本周,AI 领域最关心的重要事件是,“超级权重股”、“AI芯片之王”英伟达(NVIDIA)将于5月22日美股盘后发布2024自然年第一季度财报。

据华尔街分析师预计,截至4月份的一季度中,英伟达营收有望达到246亿美元,同比增长两倍多,到2025年1月财年结束时,季度销售额有望突破300亿美元大关;预计同期净利润138.6亿美元,同比增幅超过500%。

过去一个月内,英伟达股票以9.22%涨幅超越纳指,成为美国科技领域增长最快的龙头股,最新市值高达2.27万亿美元。

(图片来源:SemiAnalysis)

半导体平台SemiAnalysis日前披露称,刚发布的世界上性能最强 AI 芯片——英伟达B100 GPU售价将高达3万美元(约合人民币21.67万元、具体实时价格会有变化仅供参考),预计最快将于今年9月(四季度)开始量产。

目前,世界上只有四家科技公司的市值超过 2 万亿美元:微软苹果、谷歌母公司Alphabet 和英伟达。而英伟达凭借其改变游戏规则的GPU引领了 AI 算力革命。过去短短八个月内,英伟达市值从1万亿美元飙升至 2 万亿美元,成为全球规模最大的半导体公司。

在这其中,今年61岁的英伟达联合创始人、CEO黄仁勋功不可没。

最近接受CBS《60分钟》对话时,黄仁勋坦言,AI 不会夺走你们的工作,使用 AI 的人会夺走你的工作,而一家企业如果没有更多的想法来投资增量收益,那么当工作被自动化替代时,企业不得不裁员,并加入那些有更多想法而又负担不起资金投资的公司,这样当 AI 自动化他们的工作时,情况当然会改变,当然会改变工作方式。

黄仁勋经常说,AI 将改变一切。

黄仁勋认为,GPU是英伟达 AI 超级计算机的强大引擎,使其能够快速吸收大量信息,而它与英伟达CUDA一同成为当前生成式 AI 的基础设施。

“它每秒进行千万亿次计算,这只是疯狂的数字。”黄仁勋表示。

市场普遍认为,此次财报中,华尔街对于英伟达的关注点有三个:1、英伟达业绩会否再超预期,以及利润率走势如何;2、最新推出的Blackwell架构的产能情况;3、GB200和上一代芯片换代之际,需求增速会否放缓?

黄仁勋强调,AI 将迎来进步和繁荣,并将缩小人类间的技术差距。未来10年,AI 计算能力将再提高100万倍。

以下是钛媒体AGI整理的黄仁勋近期两次接受CBS对话的核心内容,有删减:

问:15岁起,你在Denny’s担任洗碗工,而到了30岁,已婚并育有孩子。但当1993年,你和两个朋友、英伟达联合创始人 Chris Malachowsky 和 Curtis Priem却选择创立了这家公司的时候,当时发生了什么?

黄仁勋:Denny's 是美国的餐馆,英伟达则是我和其它两位联合创始人在圣何塞 —— 我们家外面的 Denny's 创立的,所以他们最近联系了我,我们常坐的那个包厢现在成了 Nvidia 的包厢,名字是 Nvidia,这就是一个万亿美元公司的诞生地,这是一个非常自豪的时刻。

就在这家Denny's店,坐在后面,我们三个人决定创办这家公司。坦白说,我不知道该怎么做。他们也没有。我们谁都不知道该怎么做。 

当时的一个最初想法是:用新的图形芯片加速计算机的处理能力。但我们最初的尝试失败了,1996 年公司几乎破产。

实际上,英伟达成立之时,正值 PC 革命刚刚开始,微处理器吸引了整个行业的想象力。世界正确地看到,CPU,微处理器,将会如何重塑 IT 行业,重塑计算机行业;在 x86 革命前后,成功的公司截然不同。我们在那个时期创办了我们的公司,我们的观点是,尽管通用计算非常令人惊叹,但它不可能成为所有问题的解决方案。

我们相信,存在一种我们称之为加速计算的计算方式,你会在通用计算旁边添加一个专家。如果你愿意的话,CPU 是一个通才,可以做任何事。它可以做任何事情。然而,显然,如果你能做任何事情,那么显然你不能做任何事情做得很好。

因此,我们认为有些问题不适合被我们所称的普通计算机解决。因此,我们开创了这家加速计算公司。问题是,如果你想创造一个计算平台公司,我不知道这里有多少计算机科学家,但如果你想创造一个计算平台公司,自1964年以来还没有一个这样的公司诞生,那是我出生后的一年,IBM 系统 System 360 完美地描述了一台计算机是什么。

1964年,IBM 描述了 System 360 有一个中央处理单元,I/O 子系统,直接内存访问,虚拟内存,跨可扩展架构的二进制兼容性,它描述了我们今天所描述的计算机的一切,60 年后,我们感觉有一种新的计算形式,可以解决一些有趣的问题,当时并不完全清楚我们能解决什么问题,但我们觉得加速计算有未来。

尽管如此,我们还是出发去创办这家公司,并做出了一个非常好的首次决策,坦白说,直到今天这个决策都是不可思议的,如果有人走过来对你说,我们要发明一个世界上没有的新技术,每个人都想围绕 CPU 建立一家计算机公司,我们想围绕与 CPU 相连的其他东西建立一家计算机公司,第一点。

第二点,杀手级应用是一款视频游戏,一款 1993 年的 3D 视频游戏,而且那个应用不存在,构建这个公司的公司不存在,我们试图构建的技术不存在。因此,现在你有一家公司,既面临技术挑战,又面临市场挑战和生态系统挑战,因此这家公司成功的可能性几乎为0%,但不管怎样,我们很幸运,因为两位非常重要的人。

坦率地说,我们三个联合创始人曾一起工作过的,他们是当时技术行业中非常重要的人物,我给当时世界上最重要的风险投资家 Don Valentine 打电话,告诉 Don 给这个孩子一些钱,然后沿途搞清楚这是否行得通,幸运的是他们这样做了,但那个商业计划,即使是今天,我也不会投资,因为它有太多的依赖性,每一个都有一定的成功概率。

当你把这些加在一起时,乘起来,你得到的是 0%,尽管如此,我们设想会有一个名为视频游戏的市场,这个市场将成为世界上最大的娱乐产业,当时它是 0;我们推测,3D 图形将被用于讲述几乎所有运动、游戏的故事。因此,在虚拟世界中,你可以拥有任何游戏,任何运动,结果每个人都会成为游戏玩家。

Don Valentine 问我,这个市场会有多大?我说,将来每个人都会是游戏玩家,也是创办公司时的错误答案,坦白说,这些都是糟糕的习惯,糟糕的技能,我不是在建议你们这样做;不管怎样,结果证明是真的,视频游戏成为了世界上最大的娱乐产业,3D 图形获得了成功,我们找到了加速计算的第一个杀手级应用,这为我们赢得了时间,使用加速计算解决了一系列其他问题,最终转向了 AI。

问:为什么英伟达要采取Fabless模式?

黄仁勋:我们不做制造的原因是因为台积电做得太好了,而且他们已经在做了,我为什么要去夺取他们的工作?我喜欢台积电的人,他们是我的好朋友,仅仅因为我有业务,我可以进入这个领域,那又怎样?他们为我做得很好,让我们不要浪费时间去重复他们已经做过的事情,让我们浪费时间做一些没有人做过的事情,没有人做过的事情,这就是你如何建立一些特别的东西,否则,你只是在谈论市场份额。

我们观察到两件事情:加速计算是一个软件问题,是一个算法问题,而 AI 是一个数据中心问题,所以我们是唯一一个出去构建所有这些东西的公司,我们做的一部分是商业模式的选择,我们本可以成为一家数据中心公司,完全垂直整合。然而,我们认识到,无论一家计算机公司有多成功,它都不会是世界上唯一的计算机公司,而作为一个平台计算公司更好,因为我们热爱开发者。作为一个为世界上每一家计算机公司服务的平台计算公司,比单独成为一家计算机公司要好。

我们采取了这种方法,将这个与这个房间大小相当的数据中心,所有的电线、所有的开关和网络以及大量软件,我们将所有这些分解,并集成到全世界其他不同的数据中心中,这是一个疯狂的复杂问题,我们找到了一种方法,在必要时拥有足够的标准化,在需要时拥有足够的灵活性,以便我们能够与全世界的计算机公司进行足够的合作。

结果是,Nvidia 的架构现在被植入到世界上每一家计算机公司中,这创造了一个更大的足迹,更大的安装基础,更多的开发者,更好的应用程序,这使客户更加满意,他们购买更多的芯片,这增加了安装基础,增加了我们的研发预算等等,飞轮效应,正反馈系统,这就是它的运作方式,简单明了。

问:随着大模型的到来,你认为,需要多少个服务器GPU来训练这些计算机?

黄仁勋:创建 GPT-4 所需的是 16000 个 GPU,这是目前任何人使用的最大的模型,价值 10 亿美元,而这只是一张支票,甚至不是一张很大的支票,不要害怕,不要让任何人劝阻你创业,去实现你的梦想。

每个人都希望你认为这是一个巨大的问题,非常昂贵。其实不是,让我告诉你为什么,我们公司大约花了 5~6 亿美元的工程成本来设计一颗芯片,然后一到两年后,我按下回车键,发一封电子邮件给台积电,通过 FTP 传送一个大文件给台积电,他们就会制造它,这个过程让我们公司花费了大约 5 亿美元。

总共花了 55 亿美元,我得到了一颗芯片,这颗芯片对我们来说当然很有价值,但这没什么大不了的。我一直在做这个,所以如果有人说,嘿 Jensen,你需要创建一个价值 10 亿美元的数据中心,一旦你插上电,钱就会从另一边喷涌而出。我会立刻去做,显然很多人也会这样做,因为谁不想创建一个产生智能的工厂呢?

现在 10 亿美元其实并不是很多钱,坦白说,全球每年在基础设施计算基础设施上的支出约为 2500 亿美元,我们中没有人正在产生金钱,只是在存储我们的文件,传递我们的电子邮件,那已经是 2500 亿美元了,我们增长如此之快的原因之一是,经过 60 年的发展,通用计算正在衰退,因为再投资 2500 亿美元创建另一个通用计算数据中心是不明智的,它在能源上过于粗暴,在计算上太慢。

现在加速计算来了,那 2500 亿美元将用于创建加速计算数据中心,我们很高兴支持客户这样做。除此之外,加速计算,你现在有了一个生成 AI 的基础设施,就像我们刚刚谈论的所有事情,基本上的工作方式是你拿很多数据,然后压缩它。

深度学习就像一个压缩算法,你试图学习你正在研究的数据的数学表达、模式和关系,并将其压缩成一个神经网络,所以输入的是,比方说,数万亿字节,数万亿个 Token ,所以说几万亿字节,输出的是 100GB,所以你已经把所有那些数据压缩成了这个小小的文件,100GB 就像 2 张 DVD,你可以在手机上下载并观看,对吧?

因此,你可以在手机上下载这个巨大的神经网络。现在,所有这些数据已经被压缩进去了,这个压缩的神经网络模型是一个 LLM,意味着你可以与之交互,你可以提问,它会回到它的记忆中,理解你的意图,并为你生成文本,与你进行对话,所以,核心就是这样,听起来神奇,但对房间里所有的计算机科学家和科学家来说,这是非常合理的,不要让任何人说服你这花费了很多钱,我会给你一个很好的折扣,大家都去创建 AI 吧。

问:你认为在过去30多年间,英伟达能够成为万亿美金公司,是运气还是愿景使然?

黄仁勋:那就是——运气是由远见创造的。我们发明了这种功能,然后有一天,创建深度学习的研究人员发现了这种架构,因为事实证明这种架构非常适合他们。

问:你如何管理英伟达这家市值2.27万亿美金的公司?如何在管理供应链、客户过程中实现规模翻倍?

黄仁勋:我喜欢管理,只有其中的一部分,就是数钱,很有趣。早上起来,在所有的现金上滚来滚去,这不就是你们所有人来这里的目的吗?我理解这是最终目标,建立公司很难,没有什么容易的事情,有很多痛苦和磨难,需要大量努力。

如果这很容易,每个人都会去做,并且关于所有公司,无论大小,无论是我们的还是其他技术公司,你总是在垂死,原因是总有人试图超越你,所以你总是在走向破产的路上;如果你不内化这种感觉,如果你不相信这一点,你将会破产。而且我最初是在 Denny 开始的,你们都知道,英伟达是在极其不可能的情况下建立起来的。我们花了很长时间才走到今天。我的意思是,我们是一家有30年历史的公司。当 Nvidia 刚成立时,1993年,Windows 95 还没有推出。那时候,才是第一台可用的 PC ,我们没有电子邮件。那时还没有笔记本电脑或智能手机。所有这些东西都不存在,所以你可以想象,我们刚开始时的世界和现在的世界是多么不同。

显然,公司全靠人,如果有正确的系统,你周围有像我一样出色的人,公司就会拥有技能。不管你是销售1000亿美元还是2000亿美元,都无关紧要。

现在的真相是,供应链并不简单,有人知道 G-Force 显卡长什么样吗?举手示意一下,有谁知道 Nvidia 的显卡长什么样,所以你会认为,显卡就像一个插入 PC 的 PC Express 插槽的卡带,但我们现在的显卡芯片,在这些深度学习系统中使用的,有 35000 个部件,重达 70 磅,因为它们太重了,所以需要机器人来组装,它们需要超级计算机来测试,因为它本身就是一台超级计算机,而且成本是20万美元,用这20万美元,你可以购买一台这样的计算机,它可以替换几百个通用处理器,这些处理器的成本高达几百万美元,每花费 20 万美元在 Nvidia 购买,你就能节省 250 万美元的计算成本,这就是为什么我告诉你们,买得越多,节省得越多;显然,这个策略非常成功,人们真的在排队购买,这就是我们的工作;供应链非常复杂,我们制造了世界上最复杂的计算机,但这真的有多难呢?其实非常难,核心在于,如果你被出色的人包围,简单的真相是,这一切都关乎人;我很幸运,周围有一个伟大的管理团队,然后 CEO 会说类似“让它成为第一名”的话,比如“让它运作”。

问:摩尔定律已经“死”了吗?你为何要提出“Jensen定律”?

黄仁勋:答案是,实际上,摩尔定律非常好,我从中受益了。整个行业都从中受益了,计算机行业之所以存在就是因为它,但最终通用计算的摩尔定律,并不是关于计算中晶体管的数量,它关于晶体管的数量,你如何使用它对于 CPU,你如何最终转化为性能,那个曲线不再是每 5 年增长 10 倍。如果你幸运的话,那个曲线是每 10 年两到四倍。问题是,那个曲线是每 10 年 2~4 倍。

计算需求和我们使用计算机解决问题的愿景,我们的想象力,使用计算机解决问题的想象力是不是超过了每 10 年 4 倍?所以我们的想象力、我们的需求、世界对所有这些的消费都超过了这个限制,你可以通过购买更多的 CPU 来解决这个问题,你可以购买更多,但问题是这些 CPU 消耗了太多的能源,因为它们是通用的,就像一个通才,一个通才不如一个专家效率高,他们的工艺不如专家好,他们不像专家那样有生产力;如果我要做开胸手术,不要给我找个通才,你们知道我的意思吗?如果你们在周围,就叫个专家好了,所以新闻作者的方式太蛮力了,所以现在这让世界消耗太多能源,让世界花费太多,只是为了粗暴地强行推动通用计算。

现在幸运的是,我们长时间以来一直在研究加速计算,正如我所提到的,加速计算不仅仅是关于处理器,它实际上是关于理解应用领域,然后创建必要的软件、算法、架构和芯片;我们不知怎么地找到了一种方法,用一种架构来做这些,这是我们所做工作的天才之处,我们不知怎么地找到了这种架构,它既非常快,有时候要加速 CPU 100*500 倍,甚至有时候 1000 倍,但它又不是那么特定,只用于一种单一活动,这合理吗?而且你需要足够广泛,以便你有大市场,但你需要足够狭窄,以便你可以加速应用程序,这条微妙的界线,这把剃刀边缘,是英伟达存在的原因。如果我在 30 年前解释这个,没有人会相信,事实上,如果你现在诚实地说,也没人会相信。

我们花了很长时间,我们坚持下去,我们从地震处理开始,分子动力学,图像处理,当然还有计算机图形学,我们不断地努力,不断地努力,不断地努力,天气模拟,流体动力学,粒子物理,量子化学,然后有一天深度学习,然后是变换器,接下来将是某种形式的强化学习变换器,然后会有一些多步推理系统,所以所有这些事情,我们只是一个应用程序。

不知怎的,我们找到了一种方法,创造了一个架构,解决了所有这些问题,这个新定律会结束吗?我不这么认为。原因是这样的,它不取代 CPU,它补充了 CPU,那么问题是,接下来会有什么东西来补充我们?

我们只是把它连接在旁边,所以当时机到来时,我们会知道我们应该使用另一个工具来解决问题,因为我们是在为我们试图解决的问题服务。我们不是在尝试制造一把刀,让每个人都使用它。我们不是在尝试制造一把钳子,让每个人都使用它。我们是为了加速计算服务于问题,所以这是你们所有人都要学习的一件事。确保你的使命是正确的。确保你的使命不是制造火车,而是促进交通,这合理吗?我们的使命不是制造 GPU。我们的使命是加速应用程序,解决普通计算机无法解决的问题。如果你的使命表述得当,你专注于正确的事情,它将永远持续下去。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com