北京商报讯(记者 陶凤 王天逸)6月9日,北京商报记者获悉,小米MiMo技术团队近日正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。据称,这是全球首个在通用GPU上推理速度突破1000 tokens/s的万亿参数模型,刷新旗舰模型全球推理最快速度。
资料显示,MiMo-V2.5-Pro-UltraSpeed通过对模型推理系统的全链路工程能力优化,在不降低模型能力前提下,首次把推理速度提升至1000 tokens/s,且无需定制芯片、只使用通用GPU即可达成。即日起至6月23日 ,MiMo-V2-Pro-UltraSpeed模式将采取申请制限时开放,通过申请的用户可接入 API 进行体验。
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
![]()
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1
京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号