昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2_北京商报

您的位置：首页 > 科技频道

昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2

出处：北京商报作者：杨月涵网编：产经中心 2023-09-17

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

北京商报讯（记者杨月涵）9月16日，昆仑万维发布消息称，在权威推理榜单Benchmark GSM8K 测试中，昆仑万维自研的通用基座大模型天工大模型以80%的正确率脱颖而出，大幅领先GPT-3.5（57.1%）和LLaMA2-70B（56.8%），“标志着天工大模型的推理能力达到全球领先，接近GPT-4”。

消息提到，天工大模型不仅在推理性能上有着强大的竞争力，在MMLU、C-EVAL、HumanEval等三项数据集测试中也同样表现出色。在MMLU数据集测试中，天工大模型以65%准确率超越了LLaMA-65B的63.4%；在C-EVAL数据集测试中，天工大模型以65%准确率超越了GPT3.5的54.4%。在HumanEval数据集测试中，天工大模型以37.2%的准确率超过了PaLM-540B（26.2%）、LLaMA-65B（23.7%）、LLaMa2 -70B（30.5%）。

右侧广告

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行

友情链接

|

合作伙伴

商报简介| 招聘信息| 版权声明| 在线反馈| 联系我们| 广告

本网站所有内容属北京商报社有限公司，未经许可不得转载。商报总机：010-64101978 媒体合作：010-64101871

商报地址：北京市朝阳区和平里西街21号邮编：100013 法律顾问：北京市中同律师事务所（010-82011988）

网上有害信息举报违法和不良信息举报电话：010-84276691 举报邮箱：bjsb@bbtnews.com.cn

ICP备案编号：京ICP备08003726号-1 京公网安备11010502045556号互联网新闻信息服务许可证11120220001号