您的位置: 首页 > 科技频道

上海数交所上线语料库,累计挂牌近30个语料数据产品

出处:北京商报 作者:杨月涵 网编:产经中心 2023-07-08

北京商报讯(记者杨月涵)在7月8日的2023世界人工智能大会“大模型时代下的数据要素流通”主题论坛上,北京商报记者获悉,上海数交所官网已经于7月7日正式上线语料库,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。

上海数交所总经理汤奇峰表示,大模型建设中,语料库是一个非常重要的方向,语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素推动语料库建设。上海数交所建设语料库主要考虑两个维度,一是语料库的质量,另一个是语料库的开放程度。“比如有的企业具有海量高质量数据资源,开放意愿度也很高,但需要组织大量社会第三方企业帮助组织相关的大模型训练,我们针对四类数据产品开发情况不同、实际需求不同的供方企业制定了差异化工作策略,着力打造语料数据生态。”

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号