通义大模型发布新一代端到端语音交互模型_北京商报

您的位置：首页 > 科技频道

通义大模型发布新一代端到端语音交互模型

出处：北京商报作者：王天逸网编：陶凤 2025-12-23

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

北京商报讯（记者陶凤王天逸）12月23日，通义大模型官方发布了新一代端到端语音交互模型 Fun-Audio-Chat。

据称，该模型不是简单的“能聊天”，而是听得懂你的话、感知你的情绪、还能帮你真正干活的AI语音搭子。

技术表现方面，新模型端到端 S2S 架构可以从语音输入直接生成语音输出，无需 ASR + LLM + TTS 多模块拼接，效率更高、延迟更低；Shared LLM 层以 5Hz 帧率高效处理，SRH 以 25Hz 帧率生成高质量语音，GPU 计算开销降低近 50%；训练内容覆盖音频理解、语音问答、情感识别、工具调用等真实场景，让模型更“接地气”。

右侧广告

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行

友情链接

|

合作伙伴

商报简介| 版权声明| 在线反馈| 联系我们| 广告

本网站所有内容属北京商报社有限公司，未经许可不得转载。商报总机：010-64101978 版权合作：010-64101871

商报地址：北京市朝阳区和平里西街21号邮编：100013 法律顾问：北京市中同律师事务所（010-82011988）

网上有害信息举报违法和不良信息举报电话：010-84276691 举报邮箱：bjsb@bbtnews.com.cn

ICP备案编号：京ICP备08003726号-1 京公网安备11010502045556号互联网新闻信息服务许可证11120220001号