今日,小米技术宣布开源一项名为SVOR(Stable Video Object Removal)的视频消除技术,该技术能够移除视频中的路人。小米指出,现有的视频消除技术多在理想条件下设计,而真实世界的视频处理更为复杂,存在掩码边缘识别不准确、物体消除后阴影残留、快速移动目标处理不稳定等问题。为此,小米提出的SVOR框架专门针对这些问题设计了解决方案,包括MUSE窗口化联合策略、DA-Seg去噪感知分割以及课程式两阶段训练,以处理阴影和反射残留。
SVOR在多个标准数据集和退化遮罩基准上达到了新的SOTA(State of the Art)水平,并在CVPR2026物理感知视频实例消除挑战赛中获得第一名。小米还表示,其在视频消除的评测方案上也做了大量工作,包括评测数据收集整理和创新性评测方法,计划在适当时机开源。相关论文已发布,项目代码也已开源,Skill供直接调用。
