北京商报讯(记者 陶凤 王天逸)4月8日,智谱正式上线并开源新一代旗舰模型GLM-5.1,在长程任务(Long Horizon Task)处理能力上实现了显著突破,壁仞科技发文称,公司壁砺166系列产品在模型发布当日完成适配,成为国内首批适配GLM-5.1的国产GPU厂商之一。
公司表示,针对GLM-5.1的744B MoE架构、200K长上下文、DSA稀疏注意力等核心特性,壁仞科技开展全栈深度优化;依托自研芯片的高算力优势与BIRENSUPA软件栈的算子级深度协同能力,基于vLLM、SGLang两大主流开源框架,精准适配40B激活参数与Interleave Thinking交叉推理模式,实现200K上下文无损推理。同时,通过MoE调度、稀疏计算、Tensor Parallel、Context Parallel、MTP等多重优化技术,实现低时延、高吞吐的高效推理。
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
![]()
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1
京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号