AI 每日快讯

AI 每日快讯

AI 产品、模型、开源工具和官方动态的时间流。保留历史记录,按分类、日期和标签继续筛选。

1147历史快讯
74开源工具
5当前结果
06 月 16 日 昨日快讯

Qwen-RobotSuite:通义千问团队发布三款具身智能模型,覆盖操作、世界建模与导航

一句话结论:Qwen团队发布了三款具身智能模型,分别用于机械臂操作、视频世界建模和机器人导航。原始信息显示Qwen-RobotSuite包含三个模型:RobotManip,一个基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务;RobotWorld,一个语言条件视频世界模型,采用60层MMDiT架构;RobotNav,一个基于Qwen3-VL的导航模型,提供2B、4B和8B三种尺寸。文章详细介绍了每个模型的架构、数据管道和基准测试结果。这值得关注,因为这是通义千问团队在具身智能领域的系统性布局,三个模型覆盖了机器人核心能力,且基于成熟的大模型架构。影响对象主要是机器人研究者、具身智能开发者以及自动化领域的工程师。下一步建议研究人员阅读论文原文,了解模型架构细节和基准测试表现,并关注后续是否开放模型权重或API,以便在仿真或真实环境中进行验证。

MarkTechPost 官方资讯

MarkTechPost:Hermes Agent Adds Asynchronous Subagents, So Delegated Work No Longer Blocks the Parent Chat

原文摘要:We look at Hermes Agent's new asynchronous subagents from Nous Research. The delegate tool can now spawn background agents that no longer block the parent chat. We walk through the 来源:MarkTechPost。建议继续查看原文,重点核对它影响的工具入口、成本、风险和真实使用场景。

MarkTechPost 官方资讯

MarkTechPost:Meet Atoms: A Vibe Coding Tool That Uses AI Agents to Build, Deploy, and Market Your App (No…

原文摘要:The concept of vibe coding is interesting; you don’t need to be a 开发者 or software engineer to build your own applications. You can describe your idea to an AI in plain langua 来源:MarkTechPost。建议继续查看原文,重点核对它影响的工具入口、成本、风险和真实使用场景。

MarkTechPost 官方资讯

MarkTechPost:Google Cloud Introduces Open Knowledge Format (OKF): A Vendor-Neutral Markdown Spec for Givi…

原文摘要:We break down Google Cloud's new Open Knowledge Format (OKF), an open spec that formalizes the LLM-wiki pattern. We explain how a bundle works: a directory of markdown files with Y 来源:MarkTechPost。建议继续查看原文,重点核对它影响的工具入口、成本、风险和真实使用场景。

MarkTechPost 官方资讯

MarkTechPost:How to Build a Parsing Pipeline with Docling Parse for Layout-Aware Document Intelligence

原文摘要:In this tutorial, we build a 工作流 that uses Docling Parse to analyze PDF documents at a detailed structural level. We prepare a stable Python environment, handle common Colab d 来源:MarkTechPost。建议继续查看原文,重点核对它影响的工具入口、成本、风险和真实使用场景。