第75章 英伟达Blackwell架构B200芯片,成本和能耗较前代改善25倍

2024年行情 一360一 933 字 3个月前

在AI技术日新月异的今天,英伟达再次以惊人的创新力引领行业潮流。近日,英伟达宣布推出新一代AI图形处理器Blackwell,其首款芯片GB200将于今年晚些时候正式发货。这一重磅消息不仅彰显了英伟达在AI芯片领域的领先地位,更预示着AI计算即将迈入全新的发展阶段。

Blackwell GPU的推出,是英伟达对AI计算性能极限的又一次挑战。据悉,Blackwell拥有六项革命性技术,能够支持多达10万亿参数的模型进行AI训练和实时LLM推理。这一强大性能的背后,是英伟达对芯片技术的深入研究和不断创新。

首先,Blackwell采用了全球最强大的芯片设计。这款GPU由2080亿个晶体管组成,采用量身定制的台积电4纳米工艺制造。其独特的双晶粒设计,将两个极限GPU裸片通过10 TB/秒的芯片到芯片链路连接成一个统一的GPU,实现了前所未有的计算性能。

其次,Blackwell搭载了第二代Transformer引擎。这一引擎结合了Blackwell Tensor Core技术和英伟达先进的动态范围管理算法,使得Blackwell能够支持新的4位浮点AI,从而实现双倍的计算和模型大小推理能力。这将大大加速AI模型的训练和推理过程,提升AI应用的性能表现。

此外,Blackwell还配备了第五代NVLink技术。这一技术为每个GPU提供了突破性的1.8TB/s双向吞吐量,确保了最复杂LLM之间多达576个GPU之间的无缝高速通信。这将极大提升AI计算集群的性能和效率,为大规模AI模型的训练和应用提供有力支持。

除了强大的计算性能,Blackwell还在可靠性、安全性以及数据处理方面进行了全面升级。其内置的RAS引擎实现了可靠性、可用性和服务性的提升,通过基于AI的预防性维护进行诊断和预测可靠性问题,从而最大限度地延长系统正常运行时间并降低运营成本。同时,Blackwell还支持先进的机密计算功能,保护AI模型和客户数据的安全,为隐私敏感行业提供了强有力的支持。此外,其专用的解压缩引擎支持最新格式,能够加快数据库查询速度,为数据分析和数据科学提供最高性能。

英伟达还为Blackwell GPU设计了一款名为GB200 NVLink 2的服务器。这款服务器结合了72个Blackwell GPU和其他旨在训练AI模型的英伟达部件,为AI计算提供了强大的硬件支持。亚马逊、谷歌、微软和甲骨文等云服务提供商将通过云服务提供对GB200的访问,这将使更多的企业和开发者能够享受到Blackwell带来的强大性能。

值得一提的是,英伟达还推出了名为NIM的创收软件。这款软件简化了AI的部署过程,为客户提供了在日益增多的竞争者中坚持使用英伟达芯片的另一个理由。通过NIM,使用较旧的英伟达GPU进行推理变得更加简单,同时允许公司继续使用其已经拥有的数亿个英伟达GPU。这将有助于降低企业的运营成本,并推动AI技术在更多场景下的应用。

英伟达的这一系列创新举措,无疑将推动AI计算的发展进入一个全新的阶段。随着Blackwell GPU和NIM软件的推出,英伟达将进一步巩固其在AI芯片领域的领先地位,并引领整个行业向更高性能、更广泛应用的方向发展。

对于企业和开发者来说,Blackwell GPU和NIM软件的推出将为他们提供更加高效、便捷的AI计算解决方案。无论是训练大规模的AI模型,还是部署AI应用到实际场景中,英伟达都将为他们提供强有力的支持和帮助。

黄仁勋提到,比亚迪将采用英伟达下一代智能汽车芯片Thor。比亚迪同时将使用英伟达基础设施进行自动驾驶模型训练,以及英伟达Isaac来设计/模拟智能工厂机器人。

黄仁勋在发布会宣布了Project GR00T项目,这是一个人形机器人的模型平台,旨在进一步推动英伟达在机器人方面的研发。由GR00T驱动的机器人可以更好地理解自然语言,并通过观察人类动作来模拟运动。英伟达将基于Jetson Thor(也是一款英伟达的GPU)来开发生产机器人。发布会上,迪士尼的机器人也来到现场,用的是英伟达为机器人设计的首款AI芯片Jetson。

在未来,我们有理由相信,英伟达将继续保持其在AI芯片领域的创新力和领导力,为AI技术的发展和应用贡献更多的力量。同时,我们也期待着更多企业和开发者能够借助英伟达的技术和产品,推动AI技术在各个领域的应用和发展,为人类社会的进步和发展做出更大的贡献。