6月12日,商汤科技宣布开源其SenseNovaU1系列的新成员——U1-8B-MoT-Interleaved图文交错增强版模型。该模型针对图文交错创作与生成场景进行了专项强化,旨在提升绘本、故事书、多页PPT、图文教程等连续内容创作的效率和质量。
模型的核心升级体现在四个方面:首先,叙事一致性与角色连贯性得到显著提升,确保长周期创作中的叙事连贯性和角色一致性;其次,图文对应关系增强,有效解决了传统多模态模型中常见的“图文脱节”问题;第三,视觉质量与Artifact明显改善,特别是在人物结构、文字渲染、页面排版等高频高难区域进行了定向优化;最后,模型新增了多页PPT自动生成能力,能够智能提取要点并完成排版设计与文字渲染。
此次开源的U1-8B-MoT-Interleaved模型,将为内容创作者提供更加高效和精准的工具,以应对连续内容创作中的挑战。

