老黄又来做推销员了。
上周英伟达市值超越苹果,成为全球第一,与此相对应的,英伟达创始人黄仁勋也没闲着,开启了全球随心飞,时常在各地露面演讲。
销售的最高技巧,就是不断的推销,推销,与推销。
今天,黄仁勋也去到了日本,与软银集团 CEO 孙正义进行了一次正式的会面。
在交流前,黄仁勋先来了一段长达一个小时的的演讲,向在场与会者深入浅出地介绍了什么是 AI,以及 AI 将会如何影响我们的生活,碰到小插曲,老黄也入乡随俗地连道多句「私密马赛」。
在与孙正义的交流过程中,黄仁勋还展示了不少「黄氏」幽默。
比如看到孙正义,先来一段排比句式的彩虹屁,逗得孙正义开颜大笑。又或者,打趣孙正义曾是英伟达最大股东时,顺便也调侃自己错失收购英伟达的懊悔不已。
黄仁勋介绍英伟达是一个模拟技术公司,专注于模拟物理学、虚拟世界和智能,通过模拟帮助预测未来,类似于在构建时间机器。
黄仁勋强调英伟达的目标不是替代 CPU,而是增强 CPU 的功能,将计算密集型任务交给 GPU。
传统编程到机器学习的过渡,软件 2.0 不再依赖传统的代码,而是通过神经网络在 GPU 上运行。这种新的编程方式使得计算能力更强大,尤其是在 AI 和深度学习领域。
随着 AI 系统规模的扩大,推理能力也得到了扩展,这意味着 AI 能够进行更多的反思、规划和思考,从而提升其智能和表现。
英伟达将继续推动计算性能的提升,不仅通过 GPU 的不断发展,还通过协同计算的方式降低成本、减少能耗。
黄仁勋与孙正义共同宣布在日本建设 AI 网格,包含 AI 工厂和 AI 网络,旨在为日本各地提供 AI 服务。日本将成为全球首个实现这一目标的国家,AI 技术将推动日本各行业的变革。
原视频地址指路👉:https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/
附上黄仁勋演讲全文以及炉边对话全文,全文共 1.7 万字,由 APPSO 编译
黄仁勋:欢迎来到英伟达 AI 峰会。
在英伟达,我们的核心是一家模拟技术公司。
我们模拟物理学,我们模拟虚拟世界,我们通过模拟来模拟智能。我们帮助你们预测未来。所以,从很多角度来看,英伟达就像是在构建时间机器。
今天,我们将分享一些我们的最新突破。但最重要的是,这次活动是关于日本生态系统的。这里有这么多合作伙伴, 350 家初创公司,250000 名开发者,数百家公司。
我们已经与日本有着长期的合作。
自公司创立初期以来,日本对我们而言一直都非常重要。正是在日本,我们做了许多「第一次」。
比如视频游戏领域,Sega 的 Yu Suzuki 是我们第一次合作的游戏开发者,曾帮助我们将 Sega 的出色 3D 游戏移植到英伟达的 GPU 上。
那是第一次有人使用英伟达的 CUDA 技术来构建超级计算机,东京科技大学的超级计算机就是通过英伟达的 GPU 来推动科学计算的发展。
日本在许多领域都是全球的先锋。
还有,正是日本让我们第一次能够创造出移动处理器,进而催生了我们非常重要的项目之一——任天 堂 Switch。如今,很多「第一次」已经成为现实。
现在,我们站在 AI 革命的起点,迎接一个全新的行业和令人惊叹的技术变革。这个时代令人激动,同时也充满挑战。因此,我们在此与日本生态系统中的优秀企业合作,携手将 AI 带入日本,共同抓住这一前所未有的机遇。
今天我们有很多合作伙伴在场,我要特别感谢他们。
英伟达是加速计算的创始者,加速计算并不会取代 CPU。
实际上,我们几乎是计算领域中唯一一家不打算替代 CPU,而是想增强 CPU 功能的公司,目的是将那些计算密集型的工作负载卸载到 GPU 上。
这些是 GPU 指令集与 CPU 一起工作。
通过这种方式,我们可以充分利用两种处理器的优势:一种擅长顺序处理的 CPU,另一种则擅长并行处理的 GPU。稍后我会详细介绍这一点。
但这不仅仅是并行计算,而是加速计算,CPU 和 GPU 协同工作。这种计算模式对世界来说是全新的。
实际上,单纯使用 CPU 的计算模式自 1964 年以来就已存在,也就是在我出生的第二年,至今已有 60 年。
今天世界上绝大多数的计算任务,都是依赖 CPU 来运行的。
但现在,计算模型迎来了一个全新的、根本性的变化。然而,为了实现这一点,我们不能仅仅将顺序执行的 CPU 软件直接移植到 GPU 上。
为了实现并行计算,我们必须开发出一系列全新的算法,正如 OpenGL 使计算机图形能够通过图形处理器进行加速那样,我们也必须为许多不同的应用领域开发出许多特定的库。
这些库正是我们公司所拥有的 350 多种不同的库,其中一些库在业界非常重要。例如,Kulit 是一个专为计算光刻设计的库,它能大大加速光刻过程。在制作芯片掩模时,通常需要数周的时间,因为涉及许多层的处理。
通过使用该技术,我们将数周的计算时间缩短为几个小时。
虽然我们可以加速芯片制造周期,但更为重要的是,这使得光刻算法得以更加复杂和先进,从而推动半导体物理的进步,远远超越 2 纳米、1 纳米甚至更小的技术节点。
因此,计算光刻将通过 cuLitho、Ku DSS(稀疏求解器)以及 AI 进行加速。我今天将会详细讲解这一令人兴奋的新库,它使得这台计算机能够支持 5G 无线电协议栈的运行。
基本上,实时运行的无线电系统依托 CUDA 加速器进行量子模拟、量子电路模拟,基因测序中的配对,CVS 用于向量存储,或者是用于 AI 的向量数据库进行索引和查询。
NumPy 是全球最受欢迎的数值处理库,全球有 500 万名开发者在使用它。仅在上个月,它的下载量就达到了 3000 万次,真是一个惊人的数字。
现在,它已经完全加速,支持多 GPU、多节点的运算。如果你感兴趣,欢迎查阅相关资料。
另外,向你们介绍一个令人震撼的 CDF 数据框架处理,这是用于结构化数据处理,如 SQL、pandas、polars、co-opt,以及经典的旅行推销员问题。
这个问题已经被加速了,速度是以前的几百倍,适用于 AI 物理学。接下来,我们创建了一个非常重要的库,叫做 Coup DN Co DNA,用于深度神经网络,处理深度学习体系中的不同层级。
通过创建 QDM(量子点(Quantum Dots))并加速深度学习,我们做了一件非常特别的事,使得深度学习得到了普及。在过去的十年里,我们让人工智能和机器学习的规模提高了 100 万倍。
通过把机器学习的规模提升 100 万倍,我们实现了一个巨大的突破,也正是这个突破,催生了如今的 ChatGPT——人工智能的到来。
QDM 做了一件非常特别的事,它改变了软件开发的方式。这是软件 1.0 之前的情况,程序员编写代码来描述一个算法,这个算法就是软件。
你输入数据,软件就预测输出。人类编写的代码,通常是运行在 CPU 上的。
软件 1.0 就是编写在 CPU 上运行的代码。现在我们进入了软件 2.0 时代,因为计算机速度已经非常快,你可以给它提供大量的样本数据,让它自己学习并预测函数。我们称之为软件 2.0。
所以,不再是传统的编程,而是机器学习;不再是代码运行在 CPU 上,而是神经网络运行在 GPU ISS 上,神经网络就是软件 2.0 的核心。
这些运行在 GPU ISS 上的神经网络,已经形成了一种全新的操作系统,一种全新的计算机使用方式。它就是现代计算机的操作系统——大型语言模型。
这种机器学习方法展现了其惊人的可扩展性,你可以用它做各种各样的事情。当然,包括数字化文本、语言、语音、图像、视频等。它是多模态的,你可以教它氨基酸序列,教它理解几乎所有事物,任何包含大量观察数据的内容。
第一步就是通过研究互联网上的大量文本来理解数据的意义。
通过这种方法,我们能够理解单词、词汇、语法,甚至通过寻找模式和关系来理解单词的含义。
如今,我们使用相同的方法,不仅能够理解与不同模态相关的各类数据的意义,例如单词与图像之间的关系,「cat」这个单词和「猫」的图像就被连接了起来,学习多模态后,我们现在甚至能够进行翻译和生成。
所以,我们能够理解各类数据,也能够生成智能信息,创造各种形式的智能。
如果你看看现在创造的所有令人惊叹的初创公司和应用,你会发现它们都属于这张幻灯片中的两种组合之一:
从文本到文本(比如摘要、问答、文本生成、讲故事),或从文本到其他形式(如视频到文本用于字幕,图像到文本用于图像识别,文本到图像用于图像生成,如 Midjourney,文本到视频用于视频创作,如 Runway ML)。
所有这些不同的组合都是突破性的。你甚至可以做到蛋白质到文本,解释蛋白质的功能;文本到化学物质,描述某种可能成为有效药物的化学特性;甚至可以将视频和文本结合,来实现机器表演、机器人技术。
每一种组合都代表了一个新的行业、新的公司、新的应用场景,掀起了令人震撼的「寒武纪大爆炸」,产生了大量新应用。
我们现在才刚刚开始,机器学习的一个特点是,脑容量越大,能够教给它的数据越多,它变得也就越聪明。
我们称之为 Scaling Laws。现在有很多证据表明,随着模型的规模扩大,训练数据的增多,智能的效果、质量和表现都会得到提升。
每年,整个行业都在将模型的规模扩大约两倍,同时需要相应增加两倍的数据量。
因此,我们需要四倍的计算资源,推动人工智能迈向下一个层次所需的计算资源是巨大的。在 Scaling Laws 中,预训练是其中一部分,后训练也是一部分。
后训练通过强化学习、人类反馈、强化学习、AI 反馈等多种方式进行。现在,后训练阶段有很多方法可以使用合成数据生成。因此,训练、预训练和后训练正在经历显著的扩展,我们仍在看到非常好的成果。
当 Strawberry 或 Open AI 的 o1 发布时,它向世界展示了一种全新的推理方式。
推理是与 AI 互动的过程,就像你与 ChatGPT 交流一样,但 ChatGPT 是一次性的。你向它提问,要求它做某事,无论你提出什么问题,或给出什么提示,通过一次交互,它就会给你答案。
然而,我们知道,思考往往不止是一瞬间的,思考需要我们进行多次尝试,最终从中选择最合适的答案。
就像我们在思考时,可能会反思答案,然后再给出答案,这就是反思;或者是我们将一个问题分解成一步一步的思考链。我们已经发明了许多技术,使得推理在我们投入更多计算资源时,能够不断提升。
现在我们有了第二个 Scaling Laws——推理 Scaling Laws,不仅仅是生成下一个单词,更是思考、反思和规划。这两种同步扩展将要求我们在每次交付新一代和新架构时,都以极快的速度推动计算性能。
我们每次交付时都会在 X 倍提升性能的同时,也减少相同倍数的功耗和成本。因此,提高性能等同于降低成本,提高性能也等同于减少能耗。
因此,随着世界越来越多地接受和应用人工智能,推动人工智能技术的发展,扩展其应用范围,是我们的使命。
我们的责任就是持续不断地推动性能提升,并尽可能地加快这一过程,同时扩大人工智能的应用领域,提升其效果,降低成本,并减少功耗。这也正是我们转向一年一个周期的原因。
然而,人工智能并不是单纯的芯片问题。这个 AI 系统庞大无比。这就是 Blackwell 系统。
Blackwell 不仅仅是一个 GPU 的名字,它也是整个系统的名字,而这个 GPU 本身也非常出色,必须要提到这一点。抱歉,向在场的各位外宾解释一下。
所以,今天我们展示的是 Blackwell。
每个 Blackwell 芯片都是世界上最大的芯片,拥有 1040 亿个晶体管,由 TSMC 在其最先进的 4 纳米制程上制造。这两个 Blackwell 芯片通过 10TB 每秒的低能耗连接互联。
位于芯片的接缝处——那条线——数千个互联节点,传输速度达到 10TB 每秒。
这些芯片通过来自 SK hynix 和 Micron 的八个 HBM 3e 内存模块连接,内存的总带宽为每秒 8TB。这两个 GPU 通过 NVLink 与 CPU 连接,每个 GPU 的连接带宽为每秒 1.8TB。
这是非常多的每秒千兆字节。之所以如此,是因为这个系统不仅可以单独运行。即便是世界上最先进的计算机,也无法单独完成人工智能任务。
有时它必须与成千上万台像这样的计算机协同工作,这些计算节点共同工作就像一个巨大的计算机,而有时它们需要独立工作,以响应不同的客户或查询。
因此,它们有时会单独运行,有时则作为一个整体工作,从而让 GPU 能够作为一个整体进行工作。我们当然有通过网络将这个 GPU 与成千上万的其他 GPU 连接,但我们仍然需要 NVLink。
这种 NVLink 可以让我们将一个机架中的几个 GPU ISS 连接起来,就像我身后的这个机架一样,机架通过 NVLink 连接,带宽为每秒 1.8 TB,比全球最高带宽的网络快 35 倍,这让我们可以将所有这些 GPU ISS 连接到一起。
这个机架中有九个 NVLink 交换机,每个机架有 72 台计算机,它们通过网络连接。
NVLink 是通过 50 英镑的铜线直接驱动的,借助这个出色的 Cdes,我们称之为 NVLink。它们连接到计算机,就像这样连接到 NVLink。这个交换机将所有这些计算机连接成一个整体。
所以最终,72 台计算机连接在一起,形成一个超级 GPU,一个巨大的 GPU。从软件角度来看,它就是一颗巨型芯片。这些机架,这个机架的成本为 3000 英镑。它不可能搬到这个舞台上展示。
如果可以的话,我会给你们展示它,3000 英镑,120 千瓦功率。这相当于很多很多台 Nintendo Switch 的功率。它不便携,但它极其强大。这就是 Blackwall 系统。
我们设计它可以配置成一个超级节点,或者构建成一个庞大的数据中心,里面有成千上万台,理想情况下有数十万台。这些机器通过交换机连接,其中一些交换机是能够无缝集成到你现有的以太网环境中,我们可以使用这些系统来构建 AI 超级计算机。
我们可以将它们集成到企业数据中心、超大规模数据中心,或为边缘计算配置。Blackwell 系统不仅强大无比,而且具有极强的适应性,可以轻松融入全球各地计算基础设施的每一个角落。因此,这就是 Blackwell,超越了 Blackwell。
这就是计算机,但最重要的是,没有在其上运行的所有软件,这台计算机根本无法发挥作用。
当你看到这些计算机配有液体冷却系统和复杂的电线时,你会感到震撼。如何才能编程控制如此强大的计算机呢?这正是英伟达软件堆栈的意义所在。我们的所有努力,包括在 CUDA、Megatron 核心等方面的工作。
我们多年开发的所有软件,像 TensorRT、Triton,所有这些软件的集成,使得全球任何地方的人都能够部署 AI 超级计算机。
然后,当然,AI 软件层进一步简化了 AI 构建过程。那么,AI 到底是什么呢?我们从许多不同的角度讨论 AI,但我认为有两种类型的 AI 会变得特别流行,另外,两个思维模型对我来说也非常有帮助。
第一个 AI 基本上是数字 AI 工作者。这些 AI 工作者具备理解、规划和执行的能力。
有时,数字 AI 工作者被要求执行市场营销活动、客户支持、制定供应链计划、优化芯片设计、协助编程,甚至可以在药物发现行业中担任研究助理或实验室助理。
或许,这些 Agent 人可以作为 CEO 的私人导师,也可以成为我们员工的辅导员。这些 AI,这些数字 AI 工作者,我们称之为 AI Agent 人,实际上它们就像是数字化员工。
就像数字员工一样,你必须对它们进行培训。你需要通过创建数据来迎接它们加入公司,教它们关于公司的知识。
根据你希望它们承担的具体职能,你会为它们提供相应的技能培训,培训完成后,还需要评估它们,确保它们学到了应学的内容。你还需要设立保护机制,确保它们只完成指定的任务,而不是不该做的事情。
当然,你还需要运营这些 AI Agent,部署它们,向它们提供来自 Blackwell 的能量和 AI token,它们将与其他 Agent 进行互动,协同工作,解决问题。你将看到各种不同的 Agent。为了让生态系统更容易为企业构建 AI Agent,我们开发了几种工具。
英伟达并不从事服务业务,也不创造或交付最终产品,也不提供完整的解决方案。我们所做的是提供技术支持,帮助生态系统创建、交付并不断改进 AI。我们的 AI Agent 生命周期平台叫做 Nemo。
Nemo 提供了我之前提到的每个阶段所需的库,从数据整理到训练、微调、合成数据生成、评估再到保护措施。所有这些库都已集成到全球各地的工作流和框架中。
我们与 AI 初创公司以及像埃森哲(Accenture)和德勤(Deloitte)这样的服务提供商合作,推动这项技术走向全球的大型企业。
我们还与像 ServiceNow 这样的 ISV 合作,帮助他们创建使用 ServiceNow 的 AI Agent。
今天,你可以通过许可 ServiceNow 平台来使用它,并且你的员工与 ServiceNow 平台互动获取帮助。未来,ServiceNow 还将提供大量 AI Agent,基本上就是你可以租用的数字员工,帮助你解决问题。
我们正与全球的 SAP、Cadence、Ansyr、Snowflake 等公司合作,目的是共同构建能够帮助提升企业生产力的 AI Agent。
现在,这些 Agent 能够理解、推理、规划并采取行动,而这些 Agent 实际上是一个由多个 AI 模型组成的系统,并非单一模型。Nemo 帮助我们构建这些 Agent。
同时,我们还创建了预训练的 AI 模型,并将它们打包成所谓的 Nim(Nemo 推理),这是一种微服务。
所以这些 Nim 就像微服务一样,它们基本上是打包的 AI。过去,软件是以盒装形式包装的,配有光盘,而今天的 AI 则以微服务的形式打包,软件本身是智能的。
你可以与这些软件进行对话,因为它能够理解你说的内容。而且,你还可以将这些软件与其他软件连接起来。
你可以把这个 AI 与其他 AI 连接在一起,组合成一个 AI Agent,这就是第一点。让我举一个例子,说明这些 AI Agent 的应用。
AI 正在改变各行各业,利用复杂的推理和迭代规划解决跨学科的复杂问题。
AI Agent 能够加速市场营销活动上线,提供即时洞察;帮助优化供应链,节省数亿成本;还可以通过帮助分析师快速识别漏洞,将软件安全处理流程从几天缩短到几秒。
AI 之所以如此强大,是因为它能将数据转化为知识,再将知识转化为行动。
举个例子,这个数字 Agen t 能够通过从一系列信息密集的研究论文中提取洞察来教育个人,这些研究论文是通过英伟达 AI 蓝图构建的。英伟达 AI 蓝图是一种参考工作流程,包含英伟达加速库、SDK 以及 Nim 微服务,帮助用户快速构建和部署 AI 应用程序。
多模态 PDF 数据提取蓝图帮助构建数据摄取管道,而数字人类蓝图则提供了流畅的类人互动。
AI Agent 系统包括三个部分。Nemo、Nims 和 Blueprints。
这些资源都可以公开获取,你可以根据需要使用并构建属于自己的 AI Agent 团队。没有哪个 Agent 能够完成某个人的 100% 工作,没有任何 Agent 能做到这一点。
然而,所有 Agent 将能够完成你工作中的 50%,这就是巨大的成就。
与其认为 AI 会替代一部分员工的工作,不如看作 AI 为所有员工完成了其中的 50%。这种思维方式下,你会发现 AI 将帮助提升公司整体的生产力,进而提升你的个人生产力。
人们经常问我,AI 会不会取代我的工作?我总是回答,AI 本身不会取代你的工作,只有当别人使用 AI 时,才会取代你的工作。所以,确保尽早开始使用 AI。第一个应用是数字 AI Agent,这些就是数字 Agent。
第二个应用是物理 AI,基本技术是一样的,这些技术现在已经体现在机械系统中。机器人技术毫无疑问将成为全球最重要的行业之一。
直到现在,机器人技术还受到很多限制。而这个限制的原因非常明确。事实上,在日本,全球 50% 的制造机器人都是在这里生产的。
川崎、Fanuc、安川、三菱是全球机器人技术的四大领先企业,生产了全球一半以上的机器人。
尽管机器人在提高制造业生产力方面发挥了重要作用,但机器人产业在很长一段时间内增长缓慢。其原因在于机器人技术过于局限,缺乏灵活性,无法适应不同的场景、条件和工作需求。
我们需要一种更加灵活的 AI,能够自我适应并进行自主学习。
你会注意到,直到现在我们描述的技术——Agent 型 AI——无论是谁,都应该能够与这些 Agent 进行互动,并得到回应。
当然,有时这些回应可能不如我们自己产生的回应,但事实上,许多情况下它们的回应甚至比我们更好。
因此,我们可以将这种通用 AI 技术应用到具身 AI 或物理 AI 领域,也就是我们通常所说的机器人技术。为了实现机器人技术,我们需要构建三台计算机。
第一台计算机用于训练 AI,就像我们之前提到的所有示例一样;第二台计算机用于模拟 AI,你需要为 AI 提供一个练习环境,让它能够学习和从合成数据中汲取知识。我们称之为 Omniverse。
Omniverse 是我们为物理 AI 和机器人技术创建的虚拟世界数字双胞胎物理 AI 库。在训练、验证和评估之后,你可以将经过训练的模型移植到物理机器人中。
在这一过程中,我们有专为机器人设计的处理器,名为 Jetson Thor。
Thor 是一个为类人机器人设计的机器人处理器。这一过程将不断循环。就像 Nemo AI Agent 生命周期平台一样,Omniverse 平台也可以帮助你创建 AI。最终,你所期望的 AI,将在屏幕左侧看到一个世界,它能识别视频、周围的环境以及你的需求,并生成相应的动作。
就像我们可以处理文本并生成视频一样,我们也可以处理文本并生成药物化学成分。我们可以处理文本并生成肢体动作。这个概念与生成式 AI 非常相似,这也是我们认为现在我们已经具备了必要的技术基础——从 Omniverse 到我们构建的所有计算机系统,再到最新的生成式 AI 技术——时机已经成熟,人工智能和机器人技术的结合已经成为现实。
那么,为什么类人机器人这么难做呢?显然,作为人类我们自身就非常复杂,为类人机器人开发软件更是异常困难。
然而,回报是巨大的。现在,世界上只有两种类型的计算机可以轻松部署到全球各地。第一种是类似汽车的机器人系统,这主要是因为我们已经为汽车打造了适应的世界。
第二种是类人机器人。这两种机器人系统可以在全球任何地方部署,因为我们已经为我们自己创造了这个世界。虽然这两种技术都异常复杂,但时机已经成熟,其影响力也将是巨大的。
就在上周的机器人学习大会上,我们宣布了一个非常重要的新框架,叫做 Isaac Lab。
Isaac Lab 是一个强化学习虚拟仿真系统,能够教会类人机器人如何成为类人机器人。我们在此基础上开发了多个工作流程。第一个工作流程叫做 Groot Mimic。Groot Mimic 是一个框架,允许通过人类示范教导机器人如何完成任务。
通过使用领域随机化技术,我们可以生成大量类似示范的其他实例,帮助机器人学会如何概括。如果没有这个过程,它只能完成非常特定的任务。通过 Mimic,我们能够让机器人学习到更为广泛的技能。
第二个流程是 Groot Gen Groen,利用生成式 AI 技术,在 Omniverse 平台上,我们可以创造出大量随机化领域的环境实例,并设计出希望机器人执行的各种动作。
所以我们正在开发一系列测试、评估系统和评估场景,让机器人可以进行尝试并自我提升,学习如何成为更优秀的机器人。
第三项是群体控制。群体控制是一个模型蒸馏框架,允许我们将所有学到的任务和技能浓缩为一个统一的模型,使机器人能够执行运动学技能。
我刚才讲到的这一点,还有一个更重要的:机器人不仅会变得自主,未来的工厂也将实现机器人化。这些工厂将是机器人驱动的,负责协调机器人,构建机械系统,这些系统本身也是机器人。
真是一个不可思议的时代。
所以我们有两种机器人系统,一种是数字化的,我们称之为 AI Agent。你可以在办公室中使用这些 Agent,与员工合作。第二种是物理 AI 系统,即机器人技术。这些物理 AI 系统将成为公司构建的产品。
因此,公司将使用 AI 来提升员工的生产力,而我们将利用 AI 来驱动和增强我们销售的产品。未来的汽车公司将有两座工厂:一座生产汽车,另一座生产车载 AI。这就是机器人革命的开始。
全球范围内都在进行大量的活动,我无法想象哪个国家比日本更适合引领机器人 AI 革命。
原因很简单,正如你们所知道的,你们喜爱机器人,且创造了世界上最优秀的机器人。这些机器人陪伴了我们成长,成了我们一生钟爱的存在。其实我还有很多最喜欢的机器人没展示出来,比如魔神 Z、钢弹等,实在是太多了,但我可别忘了提到那个失控的机器人,抱歉。
所以,我希望日本能够借助最新的人工智能突破,将其与你们在机电一体化领域的顶尖专业知识相结合。
世界上没有哪个国家在机电一体化方面比日本更具优势。抓住这个非凡的机会,对你们来说至关重要。希望我们能够共同努力,推动这一梦想的实现。英伟达 AI 在日本取得了巨大的成功,我们有很多合作伙伴。我们有一些合作伙伴正在构建大型语言模型,如东京科技研究院、乐天等。
AI 在许多不同的领域都有广泛应用,尤其是在药物发现行业,AI 的应用方式非常多样。
因此,我对这里的进展感到非常兴奋,我们希望能够加速发展,抓住 AI 革命的机会。
这个行业正在发生变革。正如我之前所说,计算机行业已经从基于 CPU 的编码时代,转变为如今基于 GPU 运行的机器学习时代,人工智能行业正从一个单纯的软件制造行业,变成一个专注于制造人工智能的行业。
人工智能是在工厂中生产的,这些工厂全天候 24 小时运作。当你购买软件并将其安装到计算机时,软件的制造和分发已经完成。
然而,智能是永远不完结的,你不断与所有 AI 系统互动,无论是 AI Agent 还是 AI 机器人,智能以 token 为表现形式,而 token 是智能的单位,它是一个数字。
这些数字被以不同的方式组织在一起,从而形成了智能——例如,语言中的智能、方向盘中的智能、自驾车中的智能、控制人形机器人的马达中的智能、药物发现中的智能等等。
所有这些 token 都在这些工厂中生产。这些基础设施和工厂之前从未存在过,它们代表了全新的产业,这也是我们为何看到全球范围内首次出现如此多的技术进展。
我们正在迎来一个新行业——一个全新工厂的诞生,我们称之为人工智能制造。
这些工厂将由各家公司建设,每家公司都将成为 AI 制造商。显然,任何公司都无法承受不生产人工智能的后果。任何公司又怎么能承受没有智能的未来?任何国家又如何能够承受没有智能的未来?
你不必生产芯片,也不必生产软件,但你必须生产智能。智能至关重要,它是你的身份的核心,也是我们的身份的核心。
所以我们有了新的行业——AI 工厂。这就是我所说的新工业革命。
上一次这种变革发生是在 300 年前,当时电力被发现并开始普及,电力的生产和分配,以及新型工厂的诞生。那个新工厂不是发电厂,而是能源行业的一部分,发生在工业革命的背景下。而现在,我们迎来了一个全新的行业,这是前所未有的。
人工智能不仅是计算机行业的产物,它还被各行各业应用和创造。
你们必须创造自己的 AI。制药行业要创造自己的 AI,汽车行业要创造自己的 AI,机器人行业也要创造自己的 AI。每个行业、每个公司、每个国家都必须拥有属于自己的 AI,这就是一场新的工业革命。
我今天有一个重要的宣布:我们将与软银合作,在日本建设 AI 基础设施。我们将共同建设日本最大的 AI 工厂——英伟达 AI 工厂。
这个工厂将基于英伟达 DGX 平台,计划在明年年初建成。
当工厂完成时,它将拥有 25 个 Exaflops 的计算能力。请记住,最近世界上最大的超级计算机才刚刚达到 1 Exaflop,而这个工厂将有 25 Exaflops 的能力,专门为生产 AI 而设。
但为了分发 AI,软银将集成英伟达 ISS Aerial,这是我之前提到的 5G 无线电引擎,它基于 CUDA 架构。通过这种方式,我们可以统一整合无线电、计算机、基带和来自 5G 网络的 AI 计算能力。
现在我们可以发展并重新构建电信网络,将其转变为 AI RAN(无线接入网络)。它不仅能传输语音、数据、视频,还能传输 AI——一种全新的信息智能。
这个网络将通过软银的 20 万个站点,服务于 5500 万用户。AI 工厂将制造 AI,AI 分发网络将分发 AI。
我们还将基于这一基础设施建立一个新的商店——AI 商店,软银和第三方创建的 AI 产品将通过这个平台提供给 5500 万用户。我们将在英伟达 AI 企业平台的基础上构建这些应用程序,并推出一个新的商店,让所有人都能享用 AI。
这将是一次巨大的发展,最终将形成一个遍布日本的 AI 网络。这个 AI 网络将成为基础设施的一部分。
而且,最重要的基础设施之一,记住,你需要工厂和道路作为基础设施的一部分,才能制造和分发商品。你还需要能源和通讯,作为基础设施的一部分。
每当你为基础设施做出根本性创新时,就会诞生新的产业、新公司、新经济机会和新的繁荣。如果没有道路和工厂,我们如何能够经历工业革命?没有能源和通讯,我们如何能迎来信息技术革命?
每一项新的基础设施都为我们带来了新的机会。所以,对于我来说,与软银合作,在日本实现这一目标,真的非常令人兴奋。这是一次彻底的革命。这是第一次把电信网络转变为人工智能网络。
好了,让我给你展示你能做到的事情。比如这个例子。
我现在站在一个基站下方,站在一个无线电塔旁,车上有视频,而这些视频正通过基站进行流媒体传输。这个基站装有 AI。这个无线电塔配备了视频智能,它能看到汽车所看到的一切,并理解汽车所看到的内容。
这个 AI 模型可能太大,不能安装在汽车上,但它绝对可以放在基站里。通过基站接收的视频,它能理解汽车和周围环境发生的任何事情。
好的,这只是一个使用边缘 AI 保证安全的例子。或者说,它基本上是自驾车的空中交通管制,应用范围是无限的。我们还可以用这种基本思路,将整个工厂转变为 AI。
看,这是一家工厂。现在,我究竟在哪里?好的,我迷路了,这里有许多摄像头,视频被流传到基站。令人惊讶的是,凭借这些摄像头和 AI 模型,这家工厂现在已变成了一个 AI。
你可以与工厂对话,询问工厂发生了什么。问工厂:今天是否发生了任何事故?有没有异常情况?今天是否有人受伤?所有这些信息会以日报的形式提供给你,你只需要询问工厂,因为现在工厂已经变成了 AI。
这个 AI 模型不必在工厂内部运行,它也可以在软银的无线电系统中运行。好吧,这是另一个例子。实际上,你可以将几乎所有的物理对象转变为 AI——体育场、道路、工厂、仓库、办公室、大楼。
它们都可以成为 AI。你只需要像和 ChatGPT 对话一样与它们沟通。那么,仓库过道的情况如何?是否有任何障碍物或溢出物?你只是与工厂对话。
工厂已经观察并理解了所有情况,它可以进行推理并规划行动,或者只是和你对话。它可能会回答:「不,仓库过道没有障碍物、溢出物或危险。视频中的过道状况看起来井然有序、清洁且没有任何障碍或危险。」。
好的,现在你们是在与工厂对话,这太不可思议了。你们是在与仓库对话,你们是在与汽车对话,因为这些现在都已经变得智能了。
黄仁勋:嗯,今天也还有一位非常特别的嘉宾,也谈谈如何将人工智能带到日本。这个朋友,你们可能认识他。伟大的 Masa(孙正义,Son Masayoshi),来告诉大家一些事儿。
我不知道你们是否知道这件事,我在科技行业已经很多年了。计算机行业从 PC 到互联网,再到云计算,接着是移动互联网,云计算最后到人工智能。
Masa 是唯一一个在每一代都能够选对赢家并与之合作的企业家,唯一的创新者。
记住,正是 Masa 把 Bill Gates 带到了日本,是 Masa 把 Jerry Yang 带到了日本,正是 Masa 让中国的云计算产业得以诞生,是 Masa 帮助阿里巴巴起飞,还是 Masa 把 Steve Jobs 和 iPhone 带到了日本。
你们中很多人可能不知道,曾经 Masa 是英伟达的最大股东。哦,没关系。
你是怎么做到的?你是如何挑选出计算机历史上每一项技术革命的创新者?
孙正义:嗯,我觉得我只是运气好。我生在了对的时代,遇到了像你这样的伟大企业家。
这是一种激情,一种梦想,也是一种本能,你能嗅到谁是真正的开拓者,谁是真正的创新者。我真的觉得我很幸运。但这也是一样的愿景,我们能嗅到彼此,对吧?
就像狼嗅到彼此的气味。我觉得我们像狼一样能闻到彼此。
黄仁勋:我有两只小狗。我现在不喜欢这个比喻。回顾历史,正如你所说,这次的过渡、平台的变革和革命,和以前的革命有什么不同?你觉得有什么区别吗?
孙正义:嗯,我认为这是最令人兴奋、最具活力的未来前沿。这比之前的一切要大 100 倍、千倍。这是最大的浪潮,我告诉你。
黄仁勋:是的,我认为从数学上或从产业角度来看,必须认识到,虽然 AI 是软件,但它是一种非常不同类型的软件。你和我共同创造的那个软件产业,是工具产业,是为人类使用的工具。
而这种新的软件类型,神经网络、大型语言模型、智能 Agent 和机器人,它们不是工具,它们是技能,它们是任务。它们能做事,能执行工作,而「工作产业」的市场,不是 1 万亿美元,而是 100 万亿美元。
黄仁勋:这就是我们意识到,这个行业实际上不仅仅是 IT 行业的转型,它是每个行业的转型,这也是为什么它如此重要。
孙正义:是的,人类是唯一拥有超级大脑的动物,相比其他物种。正是因为大脑的强大,人类才如此强大。如果仅仅从肌肉来看,像狮子和大象,它们的肌肉更强壮,但人类拥有最聪明的大脑。
今天全球 GDP 的所有活动都基于人类的大脑活动。我认为每个行业都会被这场革命所影响。
黄仁勋:你说得对,当然其中一件令人惊讶的事是,受原子支配的行业,它的规模是有限的。因为原子数量有限,你能移动的原子也有限,而且它们很重。
但人工智能行业是由电子构成的,没错,它受量子力学的支配,规模是无限的。
孙正义:对,智能的价值远远高于单纯的物质运动。想一想那种思维的链条、推理过程,真是不可思议,太神奇了。
黄仁勋:是的,今天我们宣布的其中一项重要内容就是一起建设日本的 AI 网格。
这个 AI 网格将包括 AI 工厂,用于开发 AI 模型,还会有 AI 网络,能够将这些 AI 模型分发到日本各地。我们共同设计的 AI 工厂架构和 AI 网络是革命性的,世界上没有类似的模式。
日本将成为全球第一个实现这一目标的国家。
孙正义:是的,其他的电信公司必须跟随这股新潮流。
黄仁勋:接下来我有几个问题想问你。首先,软银如何将这个系统应用于自己和你的子公司?你如何看待这个 AI 网络会如何彻底改变日本的 AI 产业?
孙正义:正如你刚刚提到的,我们的基站过去只是用于承载电信和互联网等数据传输。然而,现在,通过这个智能网络的支持,我们将彼此紧密连接,成为日本智能基础设施的一部分。这将是非常惊人的。
黄仁勋:当然,你也可以将它应用于你的子公司,像我提到的雅虎日本和 PayPay,没错。所以,你可以创建 AI 系统,使你们所有的服务变得更加有趣和实用,提升消费者体验。
但我最兴奋的一点是,能将这个资源开放,供研究人员、学生和初创公司使用,让他们在日本得到成长。
孙正义:确实如此,得益于你们的支持,我们正在创建日本最大的 AI 数据中心,我和宫川正在商讨,我们应该将这个平台开放给许多研究人员、学生和初创公司,以鼓励他们发展。
我们也在努力补贴,帮助他们更好地访问这些计算资源。
黄仁勋:建设基础设施需要大量资本投入。是的,你正在对日本进行一次重大的投资。你知道,我们以前讨论过很多次,在很多方面,日本曾在机电一体化时代引领了技术革新,那时候机械技术和电子技术开始结合。
事实上,即便是在那个时代,日本在消费电子领域也确实引领了全球。然而,当 IT 行业和软件开始崛起时,我认为过去三十年,西方和中国的软件行业蓬勃发展,而日本本可以更加积极一些。
孙正义:那时候,甚至直到今天,很多大企业和媒体都认为自己是「成年人」,他们曾说过「做物理产品」,意思是做实体的东西才有真正的价值和意义,而软件只是虚拟的,难以信任的东西。
这样对软件价值的看法在日本已经存在了很多年,这也导致年轻创业者特别是经历了互联网泡沫破裂后,感到沮丧与压抑,批评的声音让年轻人受到了很大的打击。
我认为,我们必须通过机器人技术来重新燃起这份激情,正如你所说的,将人工智能融入机器人技术。
日本有「铁臂阿童木」这样的卡通形象,而我最喜欢的就是特斯拉的机器人。你不能只有肌肉,机器人必须拥有智能,才能说话、拥有情感,成为朋友。
我认为,这种前沿技术的推动,以及我们的挑战,现在在日本非常需要。
黄仁勋:是的,我认为软件时代现在已经到来。好消息是,这标志着新时代的开始。
孙正义:是的,重置一次,再次重置,按下重置按钮。
黄仁勋:没错,行业正在重置。你可以看到,整个技术栈正在被重构,因为上一代的公司在这个新时代里并不顺利。没错,所以涌现了一个全新的技术栈,带来了前所未有的机会。
日本必须把握这个机会,利用这段时间。而人工智能与软件完全不同。人工智能要求你拥有数据和领域专长。是的,如果你是艺术家,你就拥有领域专长。如果你开发视频游戏,你也具备领域专长。
黄仁勋:如果你从事药物研究,发明新药,你也拥有领域专长。如果你拥有领域专长,你可以用数据来描述这些专长,这些数据可以用来训练 AI 模型,而这个 AI 模型就变成了你的人工智能。
孙正义:完全正确。所以,这是一个全新的机会。幸运的是,日本至少没有压制这场 AI 革命。其他一些国家试图过度保护他们的技术,因此他们的监管体系变得有些混乱。
而在日本,至少我们很幸运,政府似乎并没有对这场革命设障碍。虽然如此,我认为政府应该更加鼓励 AI 发展,鼓励更多的创新。正如你所说,这就是行业重置的时刻,这是迎接新革命的最佳时机。
孙正义:我们绝对不能错过这个时刻,不能错过这个机会。
黄仁勋:当然,要成为人工智能革命的一部分,你需要基础设施和这种类型的软件,因为它是机器学习。你将需要大量的资源。谢谢,谢谢。而且你需要基础设施。
没有基础设施,就不可能完全实现人工智能。这就是为什么软银正在日本建设 AI 网络的原因。是的,你将催化、激活并加速这里已经存在的所有活动。
孙正义:我们通过我们的示范来展示。
黄仁勋:是的,希望今天我们在日本已经与 350 家初创企业合作。是的,350 家初创企业,而全球有 22000 家。是的,这个比例并不合理。所以我们必须鼓励年轻企业家和创新者大胆尝试,投入到 AI 领域。基础设施已经到位。
孙正义:正如我和 Miya Kawa 讨论的那样,我们将创建日本最大的 AI 数据中心。所以我们将提供很多鼓励性项目,补贴计算能力,让他们几乎可以免费使用,几乎免费去尝试新的模型,测试他们的应用程序。
AI 的应用也应该得到一些捐赠的支持,对吧?
黄仁勋:好吧,最后,这是我最后一次邀请 Masa,每次见到 Masa,我就得花钱。
孙正义:这对大家都有好处。
黄仁勋:是的,非常高兴听到这些。Masa,你最期待日本未来 AI 的哪些方面?你有什么期望?你的梦想是什么?
孙正义:嗯,正如你说的,我对 AI 和机器人技术非常热衷。
我认为,AI 医疗解决方案,尤其是医疗 AGI,肯定会到来。我也看到现在有很多新的 AI Agent 出现,比如我们有 LINE,有 Yahoo,还有其他服务,PayPal 也可以为帮助日本的生活方式定制许多专门的 AI Agent。
这些完全可以由我们提供。你知道的,我们了解日本的文化、行为、当地的智能和 API,日本的许多网站都在使用这些技术。所以我认为,企业 AI Agent,我非常支持你提到的这个方向,对此我感到非常兴奋。
但我也认为,个人 AI Agent 会真正出现在每个人的生活中。比尔·盖茨曾经说过,「每个桌面上都有一台 PC」,史蒂夫·乔布斯说过,「每个人的手上都有一部智能手机」。
我觉得现在我们应该说,「每个人都应该有自己的 AI Agent」。所以,未来每个人都会拥有自己的个人 AI 助手。没错,它将帮助我们规划旅行、假期,甚至是教育。
黄仁勋:它将伴随你一生。是的,你能想象有一个 AI Agent 了解你的一生吗?
孙正义:完全对,我们的孙子、孙女们从一岁开始就会和 iPhone 一起成长。每当他们看到一张照片时,他们都会用手指去触摸,哪怕是静态图片也一样。因为他们从小就学会了用两根手指。
将来他们会想,或许每张图片都可以被放大?
黄仁勋:他们看到图片后,会和它说话,对吧?他们戳一戳,希望它能回应。
孙正义:你可以想象,他们从一岁起就有了自己的个人 AI 助手,像第二个朋友一样,陪伴他们一起成长,了解一切。当他们生病时,AI 助手知道,家里有什么,或者它是他们的私人导师。
黄仁勋:是的,从小就开始,完全没错。它记得你读过的一切,记得它教给你的一切,完全像你的个人亚里士多德。
孙正义:完全是,完全是数字孪生。我觉得它真的是要来了,结合日本本土的知识、文化等等,再加上本土化的 Agent 商业化,我们的未来将是巨大的、惊人的。
黄仁勋:是的,你知道,大多数国家现在都意识到,国家的公民数据其实承载了这个国家的知识、文化和智慧,而这些数据应该属于国家,就像国家的安全一样。
所以每个国家都应该处理自己的数据,转化为为本国人民服务的人工智能,完全没有理由将这些外包给别人。
孙正义:这是非常非常重要的。每个主权国家、每个政府都必须把国家安全数据迁移到自己的数据中心 AI 数据中心,这将成为每个国家必须具备的东西。每个国家都必须确保自己的数据安全。
我认为,未来每个国家都会形成相关的法律法规,确保每个国家都能生成属于自己的智慧。
黄仁勋:当然,每个公司也将创造属于自己的智慧、属于自己的人工智能。是的,怎么可能有公司不创建自己的人工智能呢?
孙正义:是的,公司把自己的「大脑」交给别人。
黄仁勋:没错,没错。所以我认为世界已经开始觉醒了。而最重要的第一步,就是必须要有一个国家级的 AI 网络。没有基础设施,你怎么可能有汽车工业呢?
孙正义:完全是,完全是,你知道的。
黄仁勋:所以,你已经为日本建设了 AI 的「道路」,在这些道路上,各种新的服务和新公司将蓬勃发展。我真的非常非常激动。好吧,Masa,你能想象如果今天你是英伟达最大股东的话?
孙正义:哈哈,没错。我们曾经有过三次成为英伟达最大股东的机会。
黄仁勋:我记得是两次。
孙正义:不,不,不,第一次我们通过市场购买成为股东,我们讨论过的,嗯,甚至谈到了我们不愿提的事情。别说了。十年前,如果我知道现在会后悔,我一定会……
黄仁勋:没事。让我告诉你们 Masa 说了什么。Masa 说,Jensen,市场不理解英伟达的价值。你的未来是不可思议的,但市场无法理解它。
那是十年前的事了,你的痛苦之路还将继续,因为你在创造未来。所以让我给你钱去买英伟达。他曾想借钱给我去买英伟达。
现在我后悔没接受那个提议。真是个好主意。好吧,最棒的主意。
黄仁勋:对的,这个就是我们刚才说过的那个主意,那是我收购之后的一个月。是的,接着我们讨论了合并这两家公司。是的,另一个,另一个秘密的梦想。
孙正义:那个是我们最初的想法。第一次我们讨论的是私有化,然后第二次我只是通过市场购买,第三次就是……哦,好吧,三次尝试。
黄仁勋:但现在我们将共同创造不可思议的价值。是的,英伟达和软银将会合作。市场太不可思议了。
孙正义:哈哈哈哈哈哈,很不错。
黄仁勋:所以我非常高兴,我们正在做一件如此有意义的事情。是的,我对日本的未来充满希望。
孙正义:嗯,这只是个开始,我们将一起做很多事情。谢谢你,行业非常庞大,有大量的移动、物联网和汽车领域,而你们有出色的数据中心、游戏以及其他领域,我们可以有很多合作机会。
黄仁勋:我很期待这一切。是的,女士们,先生们,阳光明媚。孙正义,嗯,我毫无疑问地认为他是世界上最伟大的企业家之一。
感谢 Masa 先生。你们可以看到他对人工智能的热情,我们正在开展的合作伙伴关系将为日本带来 AI 网络,从工厂到分布式 AI 网络。在我离开之前,我想欢迎大家参加 AI 峰会。这里有很多精彩的会议,也有很多合作伙伴。
我们的目标,我们的使命是与大家合作,将 AI 带到日本,在这里激活 AI,并利用这次技术重置的机会,推动企业转型,打造下一个伟大的公司。
日本对我来说一直特别亲近。大多数人可能不知道,如果没有日本,我非常严肃地说,如果没有日本,英伟达今天可能不会在这里。而且有原因的。
如果没有日本,我们也看不到第一台 AI 超级计算机的诞生。所以,日本对我来说一直非常重要。我非常感激我们的合作伙伴关系,也非常感激你们的友谊。