您的位置: 首页 > 科技频道

昆仑万维:天工通用大模型推理能力超过GPT-3.5和LLaMA2

出处:北京商报 作者:杨月涵 网编:产经中心 2023-09-17

北京商报讯(记者 杨月涵)9月16日,昆仑万维发布消息称,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维自研的通用基座大模型天工大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),“标志着天工大模型的推理能力达到全球领先,接近GPT-4”。

消息提到,天工大模型不仅在推理性能上有着强大的竞争力,在MMLU、C-EVAL、HumanEval等三项数据集测试中也同样表现出色。在MMLU数据集测试中,天工大模型以65%准确率超越了LLaMA-65B的63.4%;在C-EVAL数据集测试中,天工大模型以65%准确率超越了GPT3.5的54.4%。在HumanEval数据集测试中,天工大模型以37.2%的准确率超过了PaLM-540B(26.2%)、LLaMA-65B(23.7%)、LLaMa2 -70B(30.5%)。

右侧广告

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号