6月9日,小米MiMo官方宣布与TileRT联合发布XiaomiMiMo-V2.5-Pro的UltraSpeed模式,这一技术突破使得在通用GPU上万亿参数模型的生成速度首次超过1000tokens/s。MiMo-V2.5-Pro-UltraSpeedAPI也同步上线,其定价为MiMo-V2.5-Pro的3倍,但提供了约10倍的输出速度提升,仅限于API体验,不支持TokenPlan。
小米MiMo-V2.5-Pro-UltraSpeed的试用名额有限,采取申请制限时开放政策,申请通过的用户可以在2026年6月9日至6月23日23:59期间接入API体验。由于资源紧张,小米将优先审核具备真实业务需求的企业与专业开发者场景。通过审核的用户将获得限时免费的Chat体验,而为了保证资源受限条件下的体验质量和使用公平性,试用服务规则规定每个账号每日最多成功进入队列10次,单次会话时长上限为30分钟,如会话空闲超过5分钟,系统将自动释放资源。

