腾讯开源强化学习新框架，提升世界模型交互准确率35%_钢铁资讯_钢铁市场网

腾讯开源强化学习新框架，提升世界模型交互准确率35%

创始人

2026-03-10 14:08:07

0次

3月10日，腾讯混元3D团队宣布开源业界首个面向世界模型的强化学习后训练框架WorldCompass。该框架是混元世界模型1.5的官方强化学习扩展模块，旨在提高世界模型的交互准确性和体验。WorldCompass通过引入强化学习机制，指导模型更准确地遵循用户指令探索世界，并保持长时序的视觉一致性。

实验结果显示，WorldCompass能显著提升SOTA开源世界模型WorldPlay的交互准确率和视觉保真度。特别是在复杂的组合动作场景下，交互准确率提升了近35%。团队在最新的开源SOTA模型WorldPlay上进行了验证。结果显示，经过WorldCompass的后训练，模型能力实现了大幅提升。在复合动作场景下，基座模型对于复杂组合式动作序列执行的准确率仅为20%左右，使用WorldCompass训练后，准确率提升至55%左右，提升幅度超过35%。对于基础动作，准确率也提升了约10%。

WorldCompass已在混元WorldPlay模型上得到验证，相关代码和模型细节已开源。这标志着腾讯在强化学习领域的又一重要进展，为长时序、交互式世界模型的研究和应用提供了新的工具和方法。

上一篇：小米SU7Ultra碳纤维前舱盖升级：空气动力学性能提升，预约免费服务开启

下一篇：小米SU7Ultra免费升级赛道模式下压力提升

相关内容

热门资讯

小米澎程SUV内饰曝光：悬浮中... 7月9日，网络上曝光了一张疑似小米增程家用SUV的内饰谍照。这款新车在设计上与小米之前推出的SU7和...

专家：癌症治疗手术并不是终点，... 文/羊城晚报全媒体记者周聪日前，由中国癌症基金会主办的“肺凡新生与爱同行”患者关爱活动在广州举办...

直击肇庆防汛一线：封开江防大堤...

国台办：民进党当局搞再多演习都... 7月8日，国务院台办举行例行新闻发布会。有记者提问：据路透社报道，民进党当局近日在南投县举办所谓“全...

故宫藏清代帝后服饰亮相上海尽...

【好评中国】河声丨热浪催热“夏... 酷暑席卷大地，消费市场却迎来一片火热。地下溶洞避暑、山野溯溪漂流、海河岸边夜市流连、演唱会全城沸腾，...

“小暑”时节农事忙

新华时评丨以史为鉴警钟长鸣新华社北京7月7日电 89年前的7月7日深夜，卢沟桥畔的枪声划破夜空，日本军国主义悍然发动全面侵华战...

用哪些关键词定义中欧关系？议员... 面对地缘冲突加剧、贸易保护主义抬头和全球秩序深刻调整，欧洲应如何寻找自身定位？欧洲议会议员翁德热伊·...

大湾区“向新力”：从一粒米、一... 6月29日，2026年“活力中国调研行”广东站主题采访活动在广州启动。来自二十余家中央和地方新闻单位...

广州荔湾区妇幼保健院入选全国首... 记者近日从中国妇幼保健协会获悉，该协会公布《儿童青少年“五健+N”服务能力提升行动》首批项目单位名单...

新政红利与优质供给双向共振！广... 广州2026年“穗八条”新政落地已满两个月，白云区市场运行数据近日正式出炉。记者从白云区住房建设和交...

广州黄埔水务紧急调派救援抢险力... 受今年第10号台风“美莎克”带来的持续性强降雨影响，广西南宁、贵港、钦州等多地遭遇严重洪涝灾害，排涝...

“美莎克”残余风雨又来了！广州... 广州市气象台7月8日上午表示，受西南方向移近的雷雨云团影响，预计未来1-3小时越秀区、天河区有中到强...

广州中小学期末考“校本化”深观... 7月8日，广州中小学陆续完成本学期期末考，这是“非统考”背景下的第二次期末考，也标志着义务教育期末考...

山西左权：太行“72道弯”绿意...

日学者：摒弃“新型军国主义”才... 日本山口大学名誉教授纐缬厚7月7日在《中国日报》撰文称，2026年7月7日是“七七事变”爆发89周年...

科普动画：应对夏季暴雨洪水，这... 夏季为暴雨多发季节。应对夏季暴雨洪水，这份安全指南请收好。科学避险，及时预防，平安度夏。作者：毛俊、...

【好评中国】东湖评论丨风雨中挺... 近日，习近平总书记对防汛救灾工作作出重要指示，要求全力组织抢险救援，确保人民群众生命财产安全。据央视...

良法善治·回响｜一群钉钉子的人钉钉子，看似很寻常，要钉得好，可要有真功夫。发扬钉钉子精神，是习近平总书记反复倡导的一种工作方法。在...