集群从 20% 提升到 90%,解决了智能体长上下文在国产芯片训练慢的难题。在智能体强化学习训练场景,星火 X2-Flash 通过上述的算法创新 + 工程创新,大幅提升了采样推理效率,相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破,一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL 训练问题,为后续的大规模强化学习对齐训练扫清了算力障碍。星火 X2-flas
当前文章:http://o7en5r.peilansu.cn/ji6/stst5.html
发布时间:06:26:02