智源最新模型评测：百度文心大模型4.0登顶闭源榜_北京商报

您的位置：首页 > 科技频道

智源最新模型评测：百度文心大模型4.0登顶闭源榜

出处：北京商报作者：魏蔚网编：陶凤 2024-06-18

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

北京商报讯（记者魏蔚）6月18日，北京商报记者获悉，北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级，并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示，百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一，

FlagEval天秤大模型评测平台是智源研究院推出的科学、权威、公正、开放的大模型评测体系，自2023年发布以来，已从主要面向语言模型扩展到视频、语音、多模态模型，实现多领域全覆盖，目前已评测国内外 300 余个开源和商业闭源的语言及多模态大模型。资料显示，FlagEval大语言模型评测体系当前包含6大评测任务，近30个评测数据集，超10万道评测题目。

右侧广告

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行

友情链接

|

合作伙伴

商报简介| 招聘信息| 版权声明| 在线反馈| 联系我们| 广告

本网站所有内容属北京商报社有限公司，未经许可不得转载。商报总机：010-64101978 媒体合作：010-64101871

商报地址：北京市朝阳区和平里西街21号邮编：100013 法律顾问：北京市中同律师事务所（010-82011988）

网上有害信息举报违法和不良信息举报电话：010-84276691 举报邮箱：bjsb@bbtnews.com.cn

ICP备案编号：京ICP备08003726号-1 京公网安备11010502045556号互联网新闻信息服务许可证11120220001号