Al项目
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
3℃Hunyuan3D-1.0 – 腾讯推出的3D生成模型,支持文生3D和图生3D
Hunyuan3D-1.0是什么Hunyuan3D-1.0 是腾讯推出的3D生成模型,具备文本和图像输入条件,支持高质量的3D资产生成。该模型采用两阶段方法,首先使用多视角扩散模型生成多视角RGB图像,再基于Transformer的稀疏视...
4℃DistilQwen2 – 阿里推出基于Qwen2优化的轻量级语言模型
DistilQwen2是什么DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言模型,能提高运算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增强指令数据多样性和优化蒸馏算法,将复杂知识传递给小模...
3℃Hunyuan-Large – 腾讯推出的大型混合专家(MoE)模型
Hunyuan-Large是什么Hunyuan-Large是腾讯推出的大型混合专家(MoE)模型,具有3890亿总参数量和520亿激活参数量,是目前业界参数规模最大的开源MoE模型。基于Transformer架构,支持高达256K的文本序...
3℃Cofounder – 全栈AI应用构建器,辅助开发者自动生成完整的应用程序
Cofounder是什么Cofounder是开源的全栈AI开发代理,能帮助开发者基于单一提示自动生成完整的应用程序,包括后端、前端、数据库和有状态的Web应用。Cofounder基于生成式AI技术,提供基于应用架构的UI、AI引导的原型设...
3℃MagicTailor – 组件可控个性化图像生成新框架
MagicTailor是什么MagicTailor 是专门为组件可控个性化设计的新框架,让T2I模型在个性化过程中能精确控制。MagicTailor 基于两个关键技术动态掩码退化(DM-Deg)和双流平衡(DS-Bal),解决语义污染和语...
3℃Claude Computer Use – Anthropic推出支持AI自动化操作电脑任务的功能
Claude Computer Use是什么Claude Computer Use是Anthropic公司推出的新功能,支持AI模型Claude 3.5 Sonnet 执行类似人类的电脑操作,如查看屏幕、移动光标、点击按钮和输入文本。基于...
1℃Docling – IBM开源的文档解析工具
Docling是什么Docling是开源的文档解析和转换工具,能高效地将多种格式的文档(包括PDF、DOCX、PPTX、图片和HTML)解析,导出为Markdown或JSON格式。Docling支持高级PDF理解、OCR功能,能与Llam...
1℃Cerebellum – 浏览器AI助手,完成网页自动化任务和行动规划
Cerebellum是什么Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器AI智能助手,能理解任务意图、执行网页自动化任务,如数据抓取和网站自动化测试。Cerebellum将网...
1℃WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架
WebRL是什么WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架,训练使用开放大型语言模型(LLMs)的高性能网络代理。WebRL动态生成任务、结果监督奖励模型(ORM)评估任务成功与否,及自适应强化学习策略,解决训
1℃GameGen-X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法
GameGen-X是什么GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能,如创新角色、动态环境、复杂动作和多样化事件,支持用户用
1℃OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音
OuteTTS是什么OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3.5亿参数。OuteTTS具备音频标记化、CTC强制对齐...
