您的位置: 首页 > 科技频道

通义大模型发布新一代端到端语音交互模型

出处:北京商报 作者:王天逸 网编:陶凤 2025-12-23

北京商报讯(记者 陶凤 王天逸)12月23日,通义大模型官方发布了新一代端到端语音交互模型 Fun-Audio-Chat。

据称,该模型不是简单的“能聊天”,而是听得懂你的话、感知你的情绪、还能帮你真正干活的AI语音搭子。

技术表现方面,新模型端到端 S2S 架构可以从语音输入直接生成语音输出,无需 ASR + LLM + TTS 多模块拼接,效率更高、延迟更低;Shared LLM 层以 5Hz 帧率 高效处理,SRH 以 25Hz 帧率 生成高质量语音,GPU 计算开销降低近 50%;训练内容覆盖音频理解、语音问答、情感识别、工具调用等真实场景,让模型更“接地气”。

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号