昨天深夜,老黄再次出现在SIGGRAPH舞台,给世界带来了惊人的创新。生成式AI迎来了它的重要时刻——这次创新将彻底改变游戏规则。
8月8日,英伟达CEO黄仁勋再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台。他带来了一系列重磅更新,包括下一代GH200超级芯片平台、AI Workbench、OpenUSD等等。这些更新将人工智能、虚拟世界、加速和协作等领域的创新融合在一起。
在这个全链路营销公司带动的LLM大爆炸时代,老黄依然敢于大胆表态:「买得越多,省得越多!」英伟达的最强AI超算也再次升级。
在5年前的SIGGRAPH上,英伟达通过将人工智能和实时光线追踪技术引入GPU,重新定义了计算机图形学。而现在,老黄表示:「当我们通过AI重新定义计算机图形学时,我们也在为AI重新定义GPU。」这就带来了日益强大的计算系统。
下一代GH200超级芯片平台将配备更先进的HBM3e内存,并具备连接多个GPU的能力,从而实现卓越性能和易于扩展的服务器设计。该平台能够处理世界上最复杂的生成式工作负载,如大语言模型、推荐系统和向量数据库等。
其中,双核心方案是一台拥有144个Arm Neoverse核心和282GB HBM3e内存的服务器,提供8petaflops的AI算力。全新的HBM3e内存相比当前的HBM3速度提高了50%,10TB/sec的组合带宽使得这个新平台能够运行比上一版本大3.5倍的模型,并通过3倍更快的内存带宽提高性能。这意味着更大规模、更复杂的AI任务可以在更短的时间内完成,极大地提升了计算效率。
老黄一再挑战极限,为AI计算带来新的突破。随着这一系列创新的推出,生成式AI将进入一个全新的阶段,开启无限可能的未来。据报道,该产品预计于2024年第二季度推出。
这次,RTX工作站全新上市,推出了包括RTX6000、RTX5000、RTX4500和RTX4000在内的四款新品。针对桌面和数据中心用户的需求,这几款产品展现了英伟达在成本敏感客户中独特的竞争优势。
在产品发布会上,出现了一个意外情节。老黄在拿出第一块GPU时不小心在镜面面板上留下了指纹,他意识到自己搞砸了,向现场观众道歉,并表示这次产品发布可能是有史以来最差的一次。即便是经验丰富的老黄也可能遇到不顺利的时刻。然而,这样可爱的失误引发了现场观众的笑声。
回到正题,作为旗舰级专业卡,RTX6000无疑是四款新品中最强大的。具备48GB显存、18176个CUDA核心、568个Tensor核心、142个RT核心和960GB/s的带宽,它确实非常强大。
而RTX5000则配备了32GB显存、12800个CUDA核心、400个Tensor核心和100个RT核心。RTX4500是一款配备了24GB显存,7680个CUDA核心,240个Tensor核心,60个RT核心的GPU。相比之下,RTX4000具有20GB显存,6144个CUDA核心,192个Tensor核心,48个RT核心。
为满足企业客户需求,NVIDIA推出了一套一站式解决方案——RTX Workstation。RTX Workstation支持最多4张RTX6000GPU,并且在15小时内能够完成8.6亿token的3-40B的微调。此外,它还能够让Stable Diffusion XL每分钟生成40张图片,比4090快5倍。
OVX服务器采用了L40S GPU,其性能略优于A100。L40S是专为搭建数据中心而设计的GPU,基于Ada Lovelace架构,配备了48GB的GDDR6显存和846GB/s的带宽。在Tensor核心和FP8Transformer引擎的加持下,L40S可以提供超过1.45petaflops的张量处理能力。
对于高算力要求的任务,L40S的18176个CUDA核心可以提供接近于A100五倍的单精度浮点性能(FP32),从而加速复杂计算和数据密集型分析。此外,为了支持实时渲染、产品设计和3D内容创建等专业视觉处理工作,L40S还配备了142个第三代RT核心,可以提供212 teraflops的光线追踪性能。