152℃wecom-cli – 企业微信官方开源的命令行工具

wecom-cli 是什么wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文档、智能表格 7 大核心能力,提供 12 ...

845℃办公场景下哪款 Claw 最好用?5 个智能体实测对比

今年的百虾大战可谓比当时接入 DeepSeek 还要盛况空前!各大厂都在办公场景中投入了大量资源,推出了自己的 OpenClaw 龙虾,引发全民养虾潮。火归火,但估计很多朋友还是有点懵,龙虾到底能干啥?大厂都在出,我到底应该怎么选呢,哪个...

901℃harrier-oss-v1 – 微软开源的多语言文本嵌入模型

harrier-oss-v1是什么harrier-oss-v1 是微软开源的多语言文本嵌入模型,在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构,通过最后 token 池化和 L2 归一化...

210℃ColaMD – 开源 Markdown 编辑器,实时同步修改内容

ColaMD是什么ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点,实现 Agent 后台修改与前台内容的实时同步,如同观看 AI 现场写作。工具采用真 WYSIWYG...

418℃Lightpanda – 开源的 AI 浏览器,兼容主流自动化框架

Lightpanda是什么Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器,用 Zig 语言从零编写,不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16,执行速度快 9 倍...

815℃天工短剧工作台 – 昆仑万维推出的 AI 短剧创作平台

天工短剧工作台是什么天工短剧工作台是昆仑万维推出的AI短剧创作平台,基于多Agent协同,整合Seedance、可灵等全球顶尖视频模型。平台支持传统与智能分镜双模式,通过资产提取Agent、导演Agent自动拆解剧本生成导演级视频,运用多...

333℃Veo 3.1 Lite – 谷歌推出的 AI 视频生成模型

Veo 3.1 Lite是什么Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型,成本比 Veo 3.1 Fast 降低 50% 以上,同时保持同等生成速度。模型支持文本/图像生成视频,可灵活切换横竖屏(16:9/9:...

881℃LongCat-AudioDiT – 美团开源的文本转语音模型

LongCat-AudioDiT是什么LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音(TTS)模型,核心创新在于直接在波形潜空间进行扩散生成,非传统梅尔频谱等中间表示,有效避免误差累积并大幅简化流程。模型引入自适应投...

226℃Vision2Web – 清华联合智谱AI推出的视觉网站开发评估基准

Vision2Web是什么Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准,用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务,分为三层递进难度:静态网页生成、交互式前端开发...

381℃GigaWorld-1 – 极佳视界开源的具身世界模型

GigaWorld-1是什么GigaWorld-1 是极佳视界推出的具身世界模型,在 WorldArena 评测中登顶全球第一。模型采用 AC-WM(动作控制世界模型)架构,结合显式动作建模与可微分物理引擎,实现几何一致、物理准确的视频生...

460℃Multi-Shot – Runway 推出的 AI 视频生成应用

Multi-Shot是什么Multi-Shot 是 Runway 推出的 AI 视频生成应用,支持实现一键成片。用户只需输入场景描述,系统自动拆解为最多5个连贯镜头,同步完成构图、运镜、对话、音效和剪辑,直接输出电影感短片。应用支持图像起...

457℃阿里国际Accio Work实测:电商版OpenClaw,一键自动化运营 

最近,阿里国际在海外悄悄上线了一款堪称电商版 OpenClaw 的Agent——Accio Work,既有龙虾 7*24 小时自动化工作的通用能力,又特别擅长生意经营、电商领域。我给它说了一句:我想开一家卖宠物玩具的 Shopify 店铺...

153℃Pascal Editor – 开源 3D 建筑编辑工具,在浏览器直接运行

Pascal Editor是什么Pascal Editor 是基于 Web 的开源 3D 建筑编辑器,由 Claude 辅助开发。工具无需安装,浏览器可运行,采用 WebGPU 技术实现高性能渲染。Pascal Editor 支持墙体绘制...

339℃Mureka V9 – 昆仑万维推出的最新AI音乐模型

Mureka V9是什么Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品,登顶Artificial Analysis人声和乐器双榜单全球第一。Mureka ...

994℃MicroCoder – 微软联合剑桥等推出的大模型训练优化框架

MicroCoder是什么MicroCoder是微软亚洲研究院联合剑桥大学、普林斯顿大学推出的代码大模型训练优化项目,针对Qwen3等新一代模型训练瓶颈,从算法、数据、评估、经验四维度全面升级。框架核心包括:MicroCoder-GRPO...

463℃Qwen3.5-Omni – 阿里通义推出的全模态大模型

Qwen3.5-Omni 是什么Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型,可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,在215项音频/音视频任务中取得...

270℃PixVerse V6 – 爱诗科技推出的最新 AI 视频生成模型

PixVerse V6是什么PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破,运镜更精准,角色情绪跨帧连贯,物理交互更真实,生成时长最长可达 15s;支持单提示词生成...

778℃Pretext – 开源 AI 前端开发工具,解决中文字布局性能瓶颈

Pretext是什么Pretext 是前 React 核心成员 Cheng Lou 开源的,纯 JavaScript/TypeScript 的多行文本测量与布局库,用于纯算术方式精确测量多行文本尺寸,完全绕过 DOM 重排。Pretext...

9℃什么是知识图谱(Knowledge Graph) – AI百科知识

知识图谱(Knowledge Graph)作为人工智能领域的一项关键技术,通过将海量信息转化为结构化的语义网络,极大地增强了机器对数据的理解和处理能力。推动了智能搜索和推荐系统的革新,在金融、医疗、教育等多个行业中展现出巨大的应用潜力。随着...

4℃什么是嵌入向量(Embedding Vectors) – AI百科知识

在人工智能的广阔领域中,嵌入向量(Embedding Vectors)扮演着至关重要的角色。将复杂的数据结构,如文本、图像和声音,转化为机器能够理解的数值表示,解锁了深度学习在自然语言处理、图像识别和推荐系统等领域的潜力。随着技术的不断进步...

6℃什么是弱监督学习(Weakly Supervised Learning) – AI百科知识

在人工智能的宏伟蓝图中,机器学习扮演着至关重要的角色,而监督学习更是其中的核心。传统的监督学习依赖于大量精确标注的数据来训练模型,以期达到对未知数据的准确预测。但在现实世界中的数据往往并非如此理想:标注成本高昂、专家资源有限、数据质量参差不...

4℃什么是对抗性训练(Adversarial Training) – AI百科知识

对抗性训练(Adversarial Training)是机器学习领域中一种创新的技术,通过在训练过程中刻意引入精心设计的扰动,增强模型对潜在攻击的防御能力。不仅提高了模型在面对恶意攻击时的鲁棒性,还提升了其在标准数据上的性能。随着人工智能系...

8℃什么是循环神经网络(RNN) – AI百科知识

在人工智能的领域中,循环神经网络(RNN)是一种特殊的神经网络结构,它在处理序列数据方面展现出了卓越的能力。本文将从多个角度深入探讨RNN的相关知识,包括其定义、结构、工作原理、应用场景、优缺点、变体以及一些常见问题。循环神经网络是什么...

4℃什么是智能体(Agents) – AI百科知识

什么是智能体智能体是人工智能中的一个核心概念,英文名Agents或AI Agents,它不仅仅是一个被动的观察者,而是一个能够主动与环境交互并产生影响的实体。智能体可以被定义为一个能够感知环境、做出决策并采取行动以实现特定目标的自主实体。...

5℃什么是嵌入表示(Embedding Representations) – AI百科知识

在探索人工智能的复杂世界中,嵌入表示(Embedding Representations)将抽象概念如文字、图像或声音转化为机器可理解的数学语言——向量形式的桥梁。这种转换使得机器能够“理解”数据,还能揭示数据间的深层关系,为各种智能应用打...
 89   1 2 3 4 下一页 尾页