黄仁勋:下一个浪潮是物理人工智能多宝体育- 多宝体育官方网站- APP下载 DUOBAO SPORTS
2026-03-02多宝体育,多宝体育官网,多宝体育平台登录,多宝体育下载,多宝体育网页,多宝体育app,多宝体育试玩,多宝体育入口,多宝体育注册网址,多宝体育登录,多宝体育靠谱吗,多宝官网,多宝网址,多宝真人,多宝电竞
此外,黄仁勋介绍了英伟达在AI推理和生成式AI方面的突破,包括推理型AI、物理AI和代理型AI的发展,以及如何通过Grace Blackwell系统实现高性能计算。他表示,生成式人工智能赋予了我们一次性人工智能。智能远不止是你从大量数据中所学到的东西,代理型人工智能基本上就是理解、思考和行动,是数字形式的机器人。这些将在未来几年变得非常重要。他还宣布了与富士康、台积电合作建造巨型AI超级计算机的计划,并推出NVLink Fusion技术,以支持构建半定制AI基础设施。
人工智能现在是基础设施的一部分。而这种基础设施,就像互联网,就像电力一样,需要工厂。这些工厂本质上就是我们今天所建造的东西。它们不是过去的那些数据中心。一个价值 1 万亿美元的产业,提供信息和存储,支持我们所有的企业资源计划(ERP)系统和员工。这是一个数据中心。一个过去的数据中心。从某种意义上说,这与它类似,因为它来自同一个行业。它来自我们所有人。但它将演变成完全不同的东西。完全独立于世界的数据中心。这些人工智能数据中心,如果你愿意这么称呼它们,实际上被不恰当地描述了。它们实际上是人工智能工厂。
我们是如何做到模拟光子,并以这种分辨率提供这种帧率的?原因在于人工智能。我们只渲染十分之一的像素。所以你看到的每个像素中,只有十分之一是实际计算出来的,剩下的九个,由人工智能推测,而且效果堪称完美,它完美地猜中了。这项技术叫做DLSS,神经渲染。我们花费了许多年才开发出来,从我们开始研究人工智能的那一刻起,就已经开始了,所以这已经是一个10年的旅程。人工智能彻底革新了计算机图形学的进步,GeForce将人工智能带到了世界,现在人工智能又回来革新了GeForce,真的是非常惊人。
然而,加速计算并非通用计算。通用计算编写软件,每个人都用Python或C++编写,然后进行编译,通用计算的方法论始终一致:编写应用程序,编译应用程序,在CPU上运行它。然而,这种方法从根本上不适用于加速计算,因为如果可以这样做,它就会被称为CPU。如果不直接改变CPU,以便你可以编写软件、编译软件、并在CPU上运行它,那还有什么意义呢?你需要做一些不同的事情,这个事实实际上相当合理。其原因在于,如此多的人致力于通用计算,数万亿美元的创新投入,怎么可能仅仅因为芯片内部的几个小部件,计算机突然就变得快50倍、快100倍呢?这毫无道理。
我们正在利用量子计算来实现这一点。量子计算仍处于含噪声中等规模量子 (NISQ) 状态。然而,我们已经可以开始进行许多非常有用的应用。因此我们对此感到兴奋,我们正在开发一个量子经典,或者量子GPU计算平台,我们称之为CUDA-cu,并与世界各地出色的公司合作。GPU可以用于预处理和后处理、纠错以及控制。我预测在未来,所有超级计算机都将拥有量子加速器,所有计算机都将连接cuQPU。因此,一台超级计算机将是由cuPU、GPU和一些CPU组成的系统。这将是现代计算机的表征。因此,我们与该领域的许多优秀公司合作。
人工智能方面,12年前,我们从感知开始,即能够理解模式、识别语音、识别图像的人工智能模型。那是开端。过去5年,我们一直在谈论生成式人工智能,即人工智能不仅能理解,还能生成的能力。因此,它可以从文本生成文本,比如ChatGPT中一直在使用的那样;文本到图像,文本到视频,视频到文本;图像到文本,几乎任何事物到任何事物。这才是人工智能真正令人惊叹之处,我们已经发现了一个通用的函数逼近器,一个通用的翻译器。它可以从任何事物翻译到任何其他事物。
因此,我们创建了一个名为Grace Blackwell的新系统。Grace Blackwell具有多种功能:它具有向上扩展的能力,意味着将一台计算机变成一台巨型计算机;向外扩展是指将一台计算机与多台计算机连接起来,并让多台不同的计算机完成工作。 扩展很容易,向上扩展极其困难。 构建超越半导体物理极限的更大型计算机,难如登天。 而这正是格蕾丝布莱克威尔所做的。 格蕾丝布莱克威尔几乎打破了一切。
在座的各位,你们中的许多人正在与我们合作构建格蕾丝布莱克威尔系统。 我很高兴地说,我们已经全面投产。 虽然基于HGX的布莱克威尔系统自去年年底以来一直在全面生产,并且自2月起已上市,但我们现在才刚刚将所有格蕾丝布莱克威尔系统上线。 它们每天都在各地陆续上线,已经在CoreWeave上可用好几周了,已经有很多云服务提供商(CSPs)在使用它。 现在你开始看到它从各个地方涌现出来,每个人都开始发推文说Grace Blackwell正在全面投产。
回到富士康,机器人日夜不停地工作,将 10000 多个组件拾取并放置到 Grace Blackwell PCB 上。 与此同时,其他组件正在全球各地的工厂中准备。 来自 Cooler Master、AVC、Aorus 和 Delta 的定制液体冷却铜块将芯片保持在最佳温度。在另一家富士康工厂,ConnectX 7 SuperNIC 正在构建中,以实现横向扩展通信,而 Bluefield 3DPU 则用于卸载和加速网络、存储和安全任务。 所有这些部件汇集在一起,被仔细地集成到GB200计算托盘中。
来自世界各地的零部件陆续运达。 从富士康、纬创、广达、戴尔、华硕、技嘉、慧与、超微和其他合作伙伴处运来,由熟练的技术人员组装成机架规模的AI超级计算机。 总计120万个组件,2英里的铜缆,130万亿个晶体管,重达1800公斤。从蚀刻到晶圆上的第一个晶体管到固定Blackwell机架的最后一颗螺栓,每一步都承载着合作伙伴的奉献、精确和工艺。 Blackwell不仅仅是一个技术奇迹,更证明了科技生态系统的奇迹。为此共同取得的成就感到无比自豪。
所有这些都是为了我们能够构建一个非常大的芯片。NVLink 和 Blackwell,这一代的技术,使我们能够创造出这些令人难以置信的系统。这是来自和硕、广达电脑、纬创和纬颖的系统。这是来自富士康、技嘉和华硕的系统。可以看到它的正面和背面。它的整个目标是利用这些 Blackwell 芯片,可以看到它们有多大,并将它们变成一个巨大的芯片。当然,实现这一目标的能力是由 NVLink 提供的。但这低估了系统架构的复杂性,以及将它们连接在一起的丰富的软件生态系统。由 150 家公司共同构建的整个生态系统。这种架构以及技术、软件和产业中的整个生态系统,是三年工作的成果。这是一项大规模的工业投资。
所以今天,我们要宣布一件非常特别的事情。我们要宣布英伟达 NVLink Fusion。NVLink Fusion 旨在让可以构建半定制的 AI 基础设施。不仅仅是半定制芯片,因为那已经是过去式了。需要构建 AI 基础设施。而且每个人的 AI 基础设施都可能略有不同。有些人可能拥有更多的 CPU,有些人可能拥有更多的英伟达 GPU,还有些人可能拥有某种半定制的 ASIC。而那些系统构建起来极其困难。并且它们都缺少一个至关重要的要素。这个至关重要的要素叫做NVLink。NVLink可以扩展这些半定制系统,并构建真正强大的计算机。所以今天,我们宣布推出NVLink Fusion。NVLink Fusion的工作方式大致如下。这是英伟达平台。100%英伟达。
我还有另一台电脑想展示。如果那还不够,并且仍然想要拥有自己的个人电脑,这位是珍妮保罗女士。如果那台对你来说不够大,这里还有一台。这又是另一台台式机,将由戴尔、惠普、华硕、技嘉、微星、联想提供。它将从Box、Lambda等卓越的工作站公司提供。这将是你自己的个人DGX超级计算机,能让你从一个墙壁插座中获得你能获得的最高性能。你可以把它放在你的厨房里,但只能勉强放得下。如果把这个放在厨房里,然后有人启动微波炉,我认为那就是极限了。
这些系统都是AI原生的,是为新一代软件而构建的计算机。它不必与 x86 兼容,不必运行传统的 IT 软件,不必运行虚拟机监控程序,不必运行 Windows。这些计算机是为现代人工智能原生应用程序设计的。当然,这些人工智能应用程序可以是可以通过传统和经典应用程序调用的 API。但是,为了将人工智能带入一个新世界,而这个新世界是企业 IT,我们必须回到我们的根源,并且必须重新发明计算并将人工智能带入传统的企业计算中。
这是全新的 RTX Pro 企业级和 Omniverse 服务器。这台服务器可以运行所有程序,当然,它有 x86 架构,可以运行所有经典的虚拟机管理程序。它在这些虚拟机管理程序中运行 Kubernetes。因此,IT 部门想要管理网络、集群以及编排工作负载的方式,与之前的工作方式完全相同。它甚至能够将 Citrix 和其他虚拟桌面流式传输到 PC。今天世界上运行的任何东西都应该能在这里运行。Omniverse 在这里运行得非常完美。除此之外,这还是企业级人工智能代理的计算机。这些人工智能代理可能仅是文本形式,也可能是计算机图形。像是小 TJ,来到你面前,像是小玩具 Jensen 来拜访你,帮助你工作。因此,这些人工智能代理可以是文本形式,可以是图形形式,也可以是视频形式。
CX8是一个新的芯片类别,首先它是一个交换机,其次它是一个网络芯片,也是世界上最先进的网络芯片。CX8现在已进入批量生产阶段。在CX8中,可以插入GPU。CX8都在后面,PCI Express 连接在此处,CX8 在它们之间进行通信。而且网络带宽非常高,达到每秒800千兆位。这是插入到这里的收发器。因此,每个GPU都有它们自己的网络接口。现在,所有GPU都在东西向流量上与其他所有GPU进行通信,性能惊人。
Llama70B与DeepSeek R1相比,后者性能是前者的4倍。 这得益于DeepSeek R1的优化,它确实是世界人工智能产业的一份礼物。 其中计算机科学的突破非常显著,为美国和世界各地的研究人员开启了大量的优质研究。 无论在哪里,DeepSeek R1都对人们如何看待人工智能、推理以及推理型人工智能产生了影响。 他们为行业和世界做出了巨大贡献。 DeepSeek R1的性能是当前最先进的H100的4倍,这使其更具现实意义。
现在,人形机器人最令人惊叹之处不仅仅在于,如果它能正常运作,它将具有相当高的通用性。它很可能是唯一有可能成功的机器人。其原因在于技术需要规模效应。我们目前拥有的大多数机器人系统产量太低,这些低产量系统永远无法达到足够的技术规模,从而无法使飞轮运转足够远、足够快,以至于我们愿意投入足够的技术来改进它。但人形机器人很可能成为下一个数万亿美元级的产业,而且技术创新速度非常快。计算和数据中心的消耗是巨大的,但这是需要三台计算机才能实现的应用之一。一台计算机用于学习的人工智能,一台计算机是仿真引擎,人工智能可以在虚拟环境中学习如何成为机器人,然后进行部署。一切移动的物体都将是机器人。
台积电、富士康、纬创、和硕、台达电子、广达、云达科技和技嘉正在 NVIDIA Omniverse 上为制造过程的每一步开发数字孪生体。台积电与 MED-AI 从二维 CAD 生成整个晶圆厂的 3D 布局,并在 CUOP 上开发人工智能工具,可以模拟和优化跨多个楼层的复杂管道系统,从而节省数月时间。广达、纬创和和硕计划在实际建造之前,先以虚拟方式规划新的设施和生产线,通过减少停机时间节省数百万美元的成本。和硕模拟焊膏点胶,从而减少生产缺陷。广达使用 Siemens Teamcenter X 与 Omniverse 来分析和规划多步骤流程。富士康、纬创和广达利用 Cadence Reality Digital Twin 模拟测试数据中心的电力和散热效率。
为了开发具备人工智能的实体机器人,每家公司都将其数字孪生体用作机器人训练场,以开发、训练、测试和模拟机器人。无论是机械臂、自主移动机器人(AMR)、人形机器人,还是视觉人工智能代理,在执行任务或作为多元化团队协同工作时,均可利用数字孪生体。当通过物联网(IoT)连接到物理孪生体时,每个数字孪生体都成为一个实时交互式仪表板。和硕利用 NVIDIA Metropolis 构建人工智能代理,以帮助员工学习复杂的技术。


