4℃VideoTuna – AI视频生成应用代码库,支持多模型和全面的视频生成流程

VideoTuna是什么VideoTuna是集成多种AI视频生成模型的代码库,支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提供预训练、持续训练、后训练对齐和微调等全面视频生成流程,支持U-Net和DiT架构,并计划推出...

4℃ComfyUI-MochiEdit – 开源的AI视频编辑工具,支持视频转视频和局部编辑

ComfyUI-MochiEdit是什么ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具,基于将视频转换为噪声、重新采样实现视频编辑,支持局部编辑和视频转视频功能。用户能调整噪声校正强度、对...

4℃HiCo – 360 AI研究院推出的布局可控AI绘画模型

HiCo是什么HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦,有效地处理复杂布局,减少对象缺失和视角冲突等问...

6℃AI快讯:3月第3期(3月21日到3月31日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为3月第3期(3月21日到3月31日)的AI行业新闻集合。3月31日意大利个人数据保护局近日发布公告,禁止使用聊天机器人ChatGPT,并限制开发这一平台的OpenAI公司处...

4℃Ferret-UI 2 – 苹果推出的跨平台UI理解多模态大语言模型

Ferret-UI 2是什么Ferret-UI 2是苹果公司推出的多模态大型语言模型,用在理解和交互移动用户界面。Ferret-UI 2能识别和理解各种移动设备屏幕上的UI元素,执行复杂的用户指令,实时观察用户在移动设备屏幕上的操作,随时...

3℃AI快讯:4月第2期(4月11日到4月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第2期(4月11日到4月20日)的AI行业新闻集合。4月20日知名图像生成模型Stable Diffusion背后的公司Stability AI宣布开源类ChatGPT...

4℃AI快讯:4月第3期(4月21日到4月30日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第3期(4月21日到4月30日)的AI行业新闻集合。4月30日米哈游《崩坏:星穹铁道》网页活动 —— 「无尽的三月七」上线,「无尽的三月七」基于米哈游自研的 AIGC...

3℃MMBench-Video – 上海AI Lab联合多所高校推出的长视频理解基准测试

MMBench-Video是什么MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文大学联合推出的。MMBench-Video能全面评估大型视觉语言模型(LVLMs)在视频理解方...

6℃AI快讯:4月第1期(4月1日到4月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第1期(4月1日到4月10日)的AI行业新闻集合。4月10日AI领域的两位重量级人物Andrew Ng(吴恩达)和Yann Lecun(杨立昆)在直播中反对“暂停6个月...

4℃MiniMates – 轻量级AI数字人项目,支持语音和表情两种驱动模式

MiniMates是什么MiniMates是高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,能在普通电脑上实现实时运行。基于先进的技术架构,提供极致的速度体验和个性化定制功能,支持用户根据需求定制AI伙伴。MiniMates拥有...

4℃AI快讯:5月第1期(5月1日到5月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为5月第1期(5月1日到5月10日)的AI行业新闻集合。5月10日Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视...

4℃MotionCLR – AI动作编辑模型,根据文本提示生成相应的动作序列

MotionCLR是什么MotionCLR是基于注意力机制的人体动作生成和编辑模型,能根据文本提示生成动作,支持用户进行交互式编辑,如动作强调、减弱、替换、擦除和风格转移。MotionCLR基于自注意力和交叉注意力机制理解和编辑动作,支持...

4℃DocMind – 司马阅推出的文档智能大模型

DocMind是什么DocMind是司马阅推出的文档智能大模型,基于Transformer结构,融合深度学习、NLP和CV技术,能处理富文本文档的复杂结构和视觉信息,提高信息抽取准确性。DocMind支持精准识别文档实体、捕捉文本依赖关系...

4℃AI快讯:5月第2期(5月11日到5月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为5月第2期(5月11日到5月20日)的AI行业新闻集合。5月20日国家超算天津中心重磅发布了立足国产天河超级算力和智能算力打造的“天河E级智能计算开放创新平台”和“天河天元...

4℃AI快讯:5月第3期(5月21日到5月31日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为5月第3期(5月21日到5月31日)的AI行业新闻集合。5月31日百度创始人、董事长兼首席执行官李彦宏在摩根大通全球中国峰会期间宣布,百度将设立 10 亿元人民币的百度文心...

4℃AI快讯:6月第1期(6月1日到6月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为6月第1期(6月1日到6月10日)的AI行业新闻集合。6月10日国内又一高校引入ChatGPT,为方便学校师生使用ChatGPT,南京理工大学信息化建设与管理处推出Chat...

3℃AI快讯:7月第1期(7月1日到7月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为7月第1期(7月1日到7月10日)的AI行业新闻集合。7月10日中国证监会科技监管局局长姚前在《中国金融》发文表示,总体来看,目前国内外主流大模型在算法层面尚不存在代际差,...

3℃Hunyuan3D-1.0 – 腾讯推出的3D生成模型,支持文生3D和图生3D

Hunyuan3D-1.0是什么Hunyuan3D-1.0 是腾讯推出的3D生成模型,具备文本和图像输入条件,支持高质量的3D资产生成。该模型采用两阶段方法,首先使用多视角扩散模型生成多视角RGB图像,再基于Transformer的稀疏视...

4℃AI快讯:6月第3期(6月21日到6月30日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为6月第3期(6月21日到6月30日)的AI行业新闻集合。6月30日初创公司Inflection AI从比尔·盖茨、英伟达、LinkedIn联合创始人Hoffman等募资13...

4℃AI快讯:6月第2期(6月11日到6月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为6月第2期(6月11日到6月20日)的AI行业新闻集合。6月20日国家网信办发布境内深度合成服务算法备案信息,《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属...

4℃DistilQwen2 – 阿里推出基于Qwen2优化的轻量级语言模型

DistilQwen2是什么DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言模型,能提高运算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增强指令数据多样性和优化蒸馏算法,将复杂知识传递给小模...

3℃Hunyuan-Large – 腾讯推出的大型混合专家(MoE)模型

Hunyuan-Large是什么Hunyuan-Large是腾讯推出的大型混合专家(MoE)模型,具有3890亿总参数量和520亿激活参数量,是目前业界参数规模最大的开源MoE模型。基于Transformer架构,支持高达256K的文本序...

4℃AI快讯:7月第2期(7月11日到7月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为7月第2期(7月11日到7月20日)的AI行业新闻集合。7月20日据彭博社报道,苹果公司开发了一款类似于 OpenAI 的 ChatGPT 的内部人工智能机器人,部分工程师...

3℃Cofounder – 全栈AI应用构建器,辅助开发者自动生成完整的应用程序

Cofounder是什么Cofounder是开源的全栈AI开发代理,能帮助开发者基于单一提示自动生成完整的应用程序,包括后端、前端、数据库和有状态的Web应用。Cofounder基于生成式AI技术,提供基于应用架构的UI、AI引导的原型设...

3℃AI快讯:7月第3期(7月21日到7月31日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为7月第3期(7月21日到7月31日)的AI行业新闻集合。7月31日据英国《金融时报》报道,黑石集团的680亿美元旗舰房地产基金已从全球最大房地产买家之一变成大卖家。该基金正...