您的位置: 首页 > 中外企业文化

英伟达——逆风飞扬的技术创新能力

出处:中外企业文化 作者:朱宇 网编:中外企业文化 2023-11-02

黄仁勋:

1

生于中国台湾,四岁随父母移民美国。1984年大学毕业,获得俄勒冈州立大学和斯坦福大学工程学位。1993年,与两位朋友共同创办了英伟达,总部设在美国加利福尼亚州圣克拉拉市。

看到别人看不到的机会,成为人工智能AI弄潮儿

2013-2023年十年间,英伟达市值翻了115倍,是美国股市回报率最高的公司。早期英伟达产品是GPU(Graphic Processing Units图形处理器),俗称显卡,主要用于游戏。英伟达在3D游戏领域取得突破性进展,成为GPU行业的领头羊。截至2021年,能量产GPU的公司只有英伟达、AMD和英特尔。英特尔以集成GPU为主,AMD两者都有,而英伟达则提供独立GPU,在独立GPU市场,英伟达占80%多市场份额。相对于CPU(Central Processing Unit中央处理器),GPU市场小得多。芯片行业老大是主要生产CPU的英特尔和AMD,2000年英特尔市值2770亿美元,世界排名第六,是英伟达的60倍,如今,是英伟达的1/7。

CPU和GPU的主要区别是,CPU擅长逻辑控制的串行计算,GPU则擅长大规模的并行计算。常打的一个比方是,CPU好比学识渊博的教授,而GPU好比一群小学生。即使教授再神通广大,也不能一秒钟内做500次加减法,而500个小学生同时做就能做到,所以,重复的简单计算适合用GPU。而图形的识别就是对每个像素进行同样的简单计算,显然用一群小学生同时计算比用一个教授一个个像素计算效率要高得多。因此,GPU适用于图形图像计算、天气预报、神经网络AI模型及虚拟货币挖矿等。2010年,谷歌负责人工智能的吴恩达为训练神经网络来识别猫,最初使用了16000台计算机的CPU完成了训练,耗费巨大。随后他与英伟达探讨了这件事,英伟达仅采用了12个GPU就完成了训练。黄仁勋敏锐地意识到机会来了,GPU不再只是游戏的显卡,它在AI领域有着得天独厚的优势,随着AI的发展,GPU需求将与日俱增,而CPU将成为配角。英伟达赶超英特尔和AMD,在此一搏。

当时,适逢投资周期低谷,热过一阵的AI已被很多人遗忘,就是业内人士所谓的“AI寒冬”,研究开发人员哀叹他们将永远无法获得足够的算力实现自己的梦想。而黄仁勋则逆势投资,摩拳擦掌,大举切入数据中心市场。英特尔和AMD还浑然不觉芯片行业将发生地动山摇的变化。每次新技术的问世普及,都是行业洗牌的大好时机,英雄还是狗熊,立见分晓。

2017年黄仁勋宣布将英伟达的未来押注在AI上。彼时,OpenAI才刚刚成立不到两年,ChatGPT的研究还在起步阶段。2021年二季度,英伟达数据中心业务销售收入首次超过它原来的主业游戏。此外,早在2008年,英伟达就开始布局自动驾驶平台化芯片,抢占智能汽车市场份额。同时,英伟达元宇宙(Nvidia Omniverse)制定通用标准,打通不同设计平台,已成为元宇宙平台级应用。黄仁勋的梦想不仅是摆脱游戏公司定位,成为AI浪潮中的“卖铲人”,他更希望成为AI浪潮的推动者、加速者。这些年,黄仁勋一再表示:“英伟达不是游戏公司,它将推动下一个AI大爆炸。”一开始很多人认为他想多了,一个卖游戏显卡的公司是不是高估了自己?

2022年11月,ChatGPT横空出世,举世瞩目,大家忽然都明白了,AI时代已来临。AI是继个人电脑、英特网、移动电话、云之后又一个革命性技术,且影响将更深远。英伟达是AI大浪潮中获益最多的公司,2023年初至今,其股价已翻了近两倍。正如芒格所说:“永远不要低估一个高估他自己的人,因为他很可能是对的。”虽然最近他说的是马斯克,然而,对黄仁勋也同样适用。

推出全套产品与服务,锁定客户,打造进入壁垒

客户使用GPU,需要和CPU配套,而CPU龙头老大是英特尔,老二是AMD,黄仁勋决定自研CPU,为客户提供全套服务。2021年英伟达推出自己的CPU Grace系列产品,以Grace Hopper(格蕾丝·赫柏)命名。Grace是一位传奇女性,她是耶鲁大学第一位女博士,杰出的计算机科学家,同时也是美国海军将军。她发明了世界上第一个编译器,开发了第一套完整的程序语言COBOL,美国海军“赫柏号”驱逐舰就是以她名字命名。

CPU Grace基于软银集团旗下的芯片设计公司ARM的架构,ARM是移动设备的首选架构,市场占有率超过90%,被誉为“移动互联网时代的明星”。多年前黄仁勋就和软银接洽,希望收购ARM。2020年9月,软银宣布同意以高达400亿美元价格将ARM出售给英伟达,但后来因各国监管部门的反对没有成交。今年初,英伟达不得不宣布收购计划失败,取而代之的是以12.5亿美元获得20年使用权的新交易。不过,其他公司的收购相对顺利得多。2019年英伟达以69亿美元收购Mellanox公司,获得InfiniBand技术,使网络交换速度得到保证。同时获得Bluefield芯片,英伟达将其称为DPU(Data Processing Unit),承担原先需CPU执行的网络数据处理、分发的重任,有效降低云计算的性能损失,释放CPU算力,降低功耗的同时,大大降低云数据中心的运营成本。至此,英伟达CPU+GPU+DPU产品矩阵全面形成,为客户提供一站式服务,进一步将英特尔和AMD挡在AI浪潮之外,也威慑了潜在进入者。有了这个产品矩阵,英伟达就可重塑数据中心的底层硬件市场,进一步打造市场进入壁垒,获取优势地位。

1

帮助英伟达打造市场进入壁垒的另一利器是于2016年推出的CUDA(Computer Unified Device Architecture),一种通用并行计算平台和编程模型,以比CPU更有效的方式解决许多复杂计算问题,打破了自60年前IBM System360以来CPU运算模型一统天下的局面,实现了加速计算。

在CUDA问世之前,想要调用GPU计算能力,必须编写大量底层语言代码,而CUDA使得GPU成为通用GPU,大大提高了效率。即便竞争对手的GPU在硬件参数上比肩英伟达的GPU,但缺少CUDA优化,其计算效率还是无法达到英伟达GPU水平。早在2006年黄仁勋就大力支持CUDA系统在AI领域的开发与推广,每年投入研发经费高达5亿美元,而当时年营业额只有30亿美元,市值不过10亿美元。股价多年表现低迷,股东对CUDA持怀疑态度,希望英伟达更多地关注盈利。但黄仁勋高瞻远瞩,不追求短期利益,坚持开发CUDA,并不断更新、优化,最终形成独特的生态系统,让英伟达抓住了人工智能AI的机会。目前,CUDA服务于400万开发者和逾3000个应用程序,下载量达4000万次,其中仅去年一年就达2500万次。

博弈性定价,抢占市场

CUDA定价策略很能反映黄仁勋的战略思维。当时,他让美国大学及科研机构免费使用CUDA系统,使英伟达迅速占领了AI市场。等到收费时,用户的转换成本已十分高昂。再说这个收费标准也很良心,没有转换的必要。这令人想起微软视窗Office软件在中国的定价策略,微软Office软件进入中国市场是在1995年左右,当时微软也是免费,因几乎全是盗版,收不到钱,但微软从没采取任何实质性措施打击盗版。虽然比尔·盖茨每次访华都提一提知识产权保护问题,不过他显然无意真正打击微软盗版,这其实在技术上很容易做到,但却没有做。据说比尔·盖茨有一次说漏了嘴:“至少他们盗版的是我们微软软件。”假设当年中国人盗版的是苹果软件,微软肯定不答应。微软的盗版软件是对付苹果的“斗士品牌”,更是它对付当时市场霸主金山WPS的“斗士”。如今,微软软件牢牢占据了市场,这种网络效应很强的产品一旦占据市场就很难被铲除。这时,微软开始收费,个人用户每年398元人民币。如果当年一开始微软就打击盗版,对正版每年收费398元,估计都很难占领中国市场,人们很可能还在用WPS。微软一直是一家很有战略思维的企业,从它起家时和苹果的博弈、在中国占领办公软件这些事上就很明了。现在看,英伟达也是一家很有战略思维的企业,从CUDA定价策略中可见一斑。不仅如此,黄仁勋的几乎每一个决策,都体现出他高超的战略思维能力。

只设计芯片,不制造芯片

除押注人工智能、推出全套产品、博弈性定价外,英伟达还做了一个很英明的战略决策,那就是只设计芯片而不制造芯片,将芯片制造外包给代工厂——台积电。而英特尔却选择了相反的做法,现在举步维艰。在半导体行业,英特尔是一个时代象征,曾辉煌夺目,著名的摩尔定律就是它的三个创始人之一、第二任CEO戈登·摩尔提出的。上世纪80年代初,创始人之一、第三任CEO安迪·格鲁夫与比尔·盖茨结盟,40年后的今天Wintel继续占领着个人电脑市场。

不过,现在手机的使用大大超过了电脑,但当年英特尔并没有看到手机的前景。苹果最初希望使用英特尔芯片为iPhone提供算力,英特尔当时的首席执行官保罗·欧德宁拒绝了乔布斯,担心其手机项目不能取得足够的成功以回报英特尔的投资。等到苹果手机如日中天时,英特尔再找苹果却被拒绝了。近十多年来,苹果对定制芯片的持续投资不仅阻止了英特尔在移动领域有任何作为,还帮助苹果建立了必不可少的软件平台。尽管大多数科技媒体都预测安卓(Android)将成为具有类似微软对消费科技行业控制权的“新Windows”,但这并没发生,苹果扮演了这个角色。安卓则扮演了苹果的盗版 “斗士品牌”角色:一个有力的竞争对手有效阻止了其他任何真正的竞争者,讽刺的是,这其中也包括微软。

英特尔错过了移动通信的浪潮,现在又错过了人工智能AI的浪潮,而它坚持的设计与生产一体化的集成模式又被证明不值得坚持。到了21世纪第二个十年,包括英特尔主要竞争对手AMD在内的大多数美国大型逻辑芯片公司都出售了自己的晶圆厂,只专注于设计。英特尔却固执地坚守集成模式,认为设计和制造流程可相互优化,是生产芯片的最佳方式。这有一定道理,但不设计只制造芯片的台积电可为不同的公司制造芯片,现在每年制造的芯片数量几乎是英特尔的三倍,所以它有更多的时间打磨工艺,生产经验更丰富,学习曲线更陡直。此外,台积电自己不设计芯片,所以所有芯片设计公司都是它的潜在客户。而英特尔则把其中不少公司视作潜在竞争对手,那些公司也不放心让英特尔代工。根本的利益冲突决定了英特尔代工业务肯定做不起来,但英特尔的领导不这么想。2013-2018年担任英特尔首席执行官的布莱恩·克扎尼奇曾公开表示:“过去几年,我基本上一直在运营我们的代工业务。”并称这项工作“具有战略重要性”。而到21世纪第二个十年他只赢得了一个主要客户,不久该业务就关闭了。

英伟达则完全没有犯这个错,从一开始就只专注于芯片设计,把制造外包给台积电。25年前,黄仁勋在中国台湾与台积电创始人张忠谋会面,开启了英伟达与台积电持续深厚的合作。除押注人工智能、推出全套产品、博弈性定价、专注于设计,黄仁勋还做了一个很艰难的决策,就是放弃庞大的手机市场,而专注于使命和愿景,即“创造出能解决普通电脑解决的问题的电脑”,最终创造了一个新技术,即拥有神经网络处理器和AI算法的安全架构的机器人技术,开创了一个全新行业。战略就是取舍,知进退,而放弃、撤退往往比争取、进攻需要更大的智慧和勇气。

英伟达,逆风飞扬

5月29日,在COMPUTEX大会上,黄仁勋正式向传统CPU服务器集群发起“挑战”,他直言,随着需要大量计算能力的AI应用出现,GPU将成为主角。

黄仁勋还展示了一个范例,训练一个大语言模型(LLM),需要960个CPU组成的服务器集群,这将耗费大约1000万美元和11千兆瓦时的电力。而同样以1000万美元的成本去组建GPU服务器集群,将以仅3.2千兆瓦时的电力消耗训练44个大语言模型。训练一个LLM,GPU只需40万美元左右,消耗0.13千兆瓦时电力。也就是说,相比CPU,GPU能够以4%的成本和1.2%的电力消耗来训练一个LLM。5月27日,黄仁勋受邀参加中国台湾大学毕业典礼作演讲,他回顾了40年来的技术发展,预测了未来趋势,讲了英伟达从失败中涅槃的三个故事,勉励毕业生们要学会承认错误,寻求帮助;学会承受痛苦,坚持梦想;学会“撤退放弃”,聚焦战略核心,而不是急功近利。最后他说:“无论是什么,像我们一样全力以赴去追求它,跑吧!不要慢慢走。也许你在为了食物而奔跑,也许你在为了不被他人当食物而奔跑,你往往无法知道自己正处在哪一种情况,不论怎样,都要保持奔跑!”英伟达马不停蹄奔跑了30年,跑着跑着就超过了所有竞争对手,跑到了食物链的顶端。

/朱宇

编辑/陆佳

本文刊载于《中外企业文化》2023年9期

 

右侧广告

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号