Prime Intellect 发布 prime-rl 0.6.0：开源框架支持万亿参数 MoE 模型的异步强化学习训练

01

核心要点

来源为 AI旗页热点日报，原文入口保留在页面底部，适合继续核对完整信息。
这条内容被归入“开源工具与开发者生态”，可作为后续工具选型、教程选题或趋势观察线索。
相关标签：AI热点日报 / 论文 / 模型 / 强化学习。

编辑判断

AI旗页判断

这条资讯来自 AI旗页热点日报，更适合当作“开源工具与开发者生态”方向的信号来看：它说明相关能力正在进入更具体的产品、行业或工作流场景，而不只是停留在演示层。

读这类新闻时，建议重点看项目是否有清晰文档、示例、许可证、活跃维护和可替代方案，而不是只看热度。

AI旗页的处理方式是保留来源、摘要和相关入口，不做全文转载。这样既能让中文用户快速判断是否值得继续读，也避免把站点做成低价值搬运页。

03

来源信息

原文标题：Prime Intellect Releases prime-rl 0.6.0 to Train Trillion-Parameter MoE Models on Agentic RL Workloads

Prime Intellect has released prime-rl 0.6.0, an open framework for asynchronous reinforcement learning on trillion-parameter Mixture-of-Experts models. It trained GLM-5 on SWE tasks at up to 131k sequence length, with sub-5-minute step times and 256 rollouts, on 28 H200 nodes. This breakdown covers the inference and training optimizations behind those numbers — FP8 inference, Wide Expert Parallelism, prefill/decode d

一句话结论：prime-rl 0.6.0 是一个开源框架，专为万亿参数 MoE 模型设计，支持异步强化学习训练，并在 28 个 H200 节点上实现了高效训练。原始信息明确：Prime Intellect 发布了该框架，成功训练 GLM-5 在 SWE 任务上达到 131k 序列长度，步时间低于 5 分钟，包含 256 个 rollout，并采用了 FP8 推理、宽专家并行等优化。为什么值得关注：它展示了在超大规模模型上应用强化学习的可行性，为训练更智能的代理模型提供了基础设施。影响谁：主要影响从事大模型训练、强化学习研究的 AI 研究员、工程师以及需要训练超大规模 MoE 模型的组织。下一步验证或使用：研究者可从 GitHub 获取源码，按照文档配置硬件环境，尝试复现 GLM-5 的训练实验，或基于框架自定义训练任务。

来源信息：AI旗页热点日报，发布时间或入库日期为 2026-06-23。页面底部保留原文入口，适合继续核对完整上下文、原始表述和附带链接。

原文摘录

来源摘要

Prime Intellect has released prime-rl 0.6.0, an open framework for asynchronous reinforcement learning on trillion-parameter Mixture-of-Experts models. It trained GLM-5 on SWE tasks at up to 131k sequence length, with sub-5-minute step times and 256 rollouts, on 28 H200 nodes. This breakdown covers the inference and training optimizations behind those numbers — FP8 inference, Wide Expert Parallelism, prefill/decode d

以上内容来自来源页/RSS 提供的摘要信息，AI旗页做中文整理、重点标注和入口归档；完整内容、上下文和版权归原作者所有，请以原文为准。

05

下一步怎么用

需要确认细节时，优先打开原文链接，看发布时间、上下文和官方表述。
如果这条动态与你的工作有关，可以继续查看同标签资讯和相关工具，判断是否需要写教程、做对比或加入工作流。
如果是产品或模型更新，建议同时比较价格、可用地区、中文体验、API 接入和数据安全边界。

标签

标签与来源

来源AI旗页热点日报时间2026-06-23 标签AI热点日报标签论文标签模型标签强化学习标签开源框架标签大模型训练标签Prime Intellect

原始来源地址：www.marktechpost.com

Prime Intellect 发布 prime-rl 0.6.0：开源框架支持万亿...