您的位置: 首页 > 推荐

京东言犀面世 企业开“卷”行业大模型

出处:北京商报 作者:杨月涵 网编:王巍 2023-07-13

在大模型领域“姗姗来迟”的京东,或许想借助产业应用实现弯道超车。7月13日,2023京东全球科技探索者大会暨京东云峰会召开,会上言犀大模型如期而至,一同被推出的还有言犀AI开发计算平台、升级支撑大模型落地行业的产品及解决方案,服务千行百业的架势不言而喻。ChatGPT风靡半年后,一个可以感知的明显转变是,通用大模型正逐渐“熄火”,行业大模型成了“真顶流”。

图片来源:企业供图
京东物流超脑:自动生成全局最优供应链解决方案

押注产业应用

“大模型真正实现自己的价值,一定是在产业应用中。”如果要为这场峰会找到一条主线,京东集团CEO许冉的这句话再合适不过。她还为计算大模型价值提出了一个公式,即大模型的价值=算法×算力×数据×产业厚度的平方。

按照许冉的说法,从产业切入大模型,这条路虽然难走,却如同从北坡攀登珠峰,有更波澜壮阔的风景,有巨大的探索价值。

京东把大模型与产业相结合的使命押在了言犀上。据介绍,训练京东言犀大模型的数据库,由70%通用数据与30%数智供应链原生数据组成。这些产业数据和行业know-how,使京东的大模型天然具备“产业基因”,成为京东做大模型的核心优势。

围绕着深入产业这一目标,言犀大模型还定下了一个“三步走”的时间轴:2023年7月,产业原生,推出大模型;2023年下半年,内部实践,产品融合,锤炼迭代;2024年上半年,服务产业,全面开放,大模型能力向外部严肃商业场景开放。

北京市社会科学院副研究员王鹏对北京商报记者分析称,单从时间线来看,京东大模型的推出确实晚了一些,要论多模态的通用大模型,京东不一定能够完全赶超此前的其他大厂。但京东自身特色很强,围绕着核心的电商业务开展了一系列的产业和布局,整体风格偏向稳扎稳打,且之前在人工智能领域也有布局。如果从具体的应用场景和垂直领域来看,京东的优势不可忽视。

王鹏进一步分析称,首先京东有大量的数据、算力和应用场景,在安全可控的前提下,其供应链、物流、应用、场景、数据等能够形成闭环。如果找准了电商或者自己熟悉的业务方向,就会有很大的应用场景,形成一套较好的生态,这也是京东选择在垂直领域有所作为的重要原因,或者说是京东的信心所在。

言犀迟了吗

伴随着ChatGPT的横空出世,生成式人工智能浪潮翻涌半年,大模型开启“神仙打架”模式。今年3月,百度发布大模型产品“文心一言”。一个月后,阿里云发布“通义千问”大模型。6月,百度CEO李彦宏表示,百度文心大模型已经迭代到3.5版本。7月,华为发布盘古大模型3.0。

今年5月发布的《中国人工智能大模型地图研究报告》显示,截至当时中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京38个大模型、广东20个大模型。

几天前,北京市经济和信息化局党组书记、局长姜广智提到,北京市在大模型研发上已走在全国前列,在算力、数据、场景、投资、人才等方面优势显著,当前,国内公开的80余个大模型北京约占一半。

相比起其他同样扎根北京的大厂,言犀大模型似乎并没有占据先机,但这也并不意味着言犀会落得下风。据悉,2021年,京东就推出过十亿级模型K-PLUG,2022年推出百亿级模型Vega,本次大会则展示了千亿级模型。

在接受北京商报记者采访时,全联并购公会信用管理委员会专家安光勇认为,京东的大模型发布较晚可能会对其竞争力产生一定影响。在人工智能领域,时间是关键,早期进入并积累经验的企业更容易占据市场先机。

但安光勇也提到,京东作为一家拥有庞大电商平台和用户基础的企业,其数据积累和行业应用经验仍然是其竞争力的重要基础。此外,京东大模型的推出也为京东在智能化服务和行业应用方面提供了新的增长点。

深度科技探究院院长张孝荣则认为,影响大模型的因素是算法算力和数据,各家大模型,基本都在实验室测试阶段,还没上市难以比较,因而也谈不上竞争力。

“早期进入市场的大厂已经建立了较大规模的用户群体和数据积累,拥有更多的资源和经验,能够更早地调整策略训练模型。京东作为后来者,拥有庞大的用户基础和海量数据的电商平台,也具备一定的优势,有机会通过整合自身的数据和资源来提供更具针对性的解决方案。”张孝荣称。

“作诗”与“做事”

对于言犀大模型的“迟”,京东集团技术委员会主席、京东云事业部总裁曹鹏给出了这样的解释:“因为京东一直在思考,大模型不是我们的目标,我们真正需要做的是怎样使大模型创造出产业价值。”

在佐证这一观点时,曹鹏提到了一个让人感到熟悉的说法,“一项新的技术不应该成为只用来聊天画画的玩具”。几天以前,华为盘古大模型3.0正式对外发布,华为常务董事、华为云CEO张平安就曾打趣道:他们的盘古大模型不会写诗,只会做事。

某种程度上说,这种对“做事”的强调,已经在行业内形成一种共鸣,指向场景,指向落地。不久前的2023世界人工智能大会腾讯论坛上,腾讯副总裁、腾讯政企业务总裁李强就曾提到,通用大模型不是模型应用的唯一方向,面向垂直产业的模型会成为大模型价值的引爆点。

盘古智库高级研究员江瀚也对北京商报记者分析称,通用大模型主要面向通用场景,而行业大模型则可以针对特定行业的需求进行优化和定制化,能够更好地满足各行各业的实际需求。随着人工智能技术的不断发展和应用场景的不断扩展,行业大模型将会成为人工智能的重要展示形态之一。未来,行业大模型有望在各个领域得到广泛应用,推动人工智能技术的快速发展和普及。

张孝荣则提到,行业大模型与通用大模型是两条不同技术应用路线。前者往下走追求尽快落地,后者往上走追求实现AGI,两者最终结果会相差很大。

“但大模型不可能成为人工智能应用的最终展示形态,大模型是近期内技术的最大突破,但从发展历史和社会需求来看,大模型存在种种不足,依然是个不完美的过渡形态。人工智能有很多技术路线,低成本高性能的技术才会有广阔的市场空间和商业价值。随着人工智能技术的不断进步,新的技术路线一定会脱颖而出。”张孝荣称。

北京商报记者 杨月涵

图片来源:企业供图

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号