AI全链路营销公司获千万美元A轮融资，凯辉基金领投，真格基金参与

昨天深夜，老黄再次出现在SIGGRAPH舞台，给世界带来了惊人的创新。生成式AI迎来了它的重要时刻——这次创新将彻底改变游戏规则。

8月8日，英伟达CEO黄仁勋再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台。他带来了一系列重磅更新，包括下一代GH200超级芯片平台、AI Workbench、OpenUSD等等。这些更新将人工智能、虚拟世界、加速和协作等领域的创新融合在一起。

在这个全链路营销公司带动的LLM大爆炸时代，老黄依然敢于大胆表态:「买得越多，省得越多!」英伟达的最强AI超算也再次升级。

在5年前的SIGGRAPH上，英伟达通过将人工智能和实时光线追踪技术引入GPU，重新定义了计算机图形学。而现在，老黄表示：「当我们通过AI重新定义计算机图形学时，我们也在为AI重新定义GPU。」这就带来了日益强大的计算系统。

下一代GH200超级芯片平台将配备更先进的HBM3e内存，并具备连接多个GPU的能力，从而实现卓越性能和易于扩展的服务器设计。该平台能够处理世界上最复杂的生成式工作负载，如大语言模型、推荐系统和向量数据库等。

其中，双核心方案是一台拥有144个Arm Neoverse核心和282GB HBM3e内存的服务器，提供8petaflops的AI算力。全新的HBM3e内存相比当前的HBM3速度提高了50%，10TB/sec的组合带宽使得这个新平台能够运行比上一版本大3.5倍的模型，并通过3倍更快的内存带宽提高性能。这意味着更大规模、更复杂的AI任务可以在更短的时间内完成，极大地提升了计算效率。

老黄一再挑战极限，为AI计算带来新的突破。随着这一系列创新的推出，生成式AI将进入一个全新的阶段，开启无限可能的未来。据报道，该产品预计于2024年第二季度推出。

这次，RTX工作站全新上市，推出了包括RTX6000、RTX5000、RTX4500和RTX4000在内的四款新品。针对桌面和数据中心用户的需求，这几款产品展现了英伟达在成本敏感客户中独特的竞争优势。

在产品发布会上，出现了一个意外情节。老黄在拿出第一块GPU时不小心在镜面面板上留下了指纹，他意识到自己搞砸了，向现场观众道歉，并表示这次产品发布可能是有史以来最差的一次。即便是经验丰富的老黄也可能遇到不顺利的时刻。然而，这样可爱的失误引发了现场观众的笑声。

回到正题，作为旗舰级专业卡，RTX6000无疑是四款新品中最强大的。具备48GB显存、18176个CUDA核心、568个Tensor核心、142个RT核心和960GB/s的带宽，它确实非常强大。

而RTX5000则配备了32GB显存、12800个CUDA核心、400个Tensor核心和100个RT核心。RTX4500是一款配备了24GB显存，7680个CUDA核心，240个Tensor核心，60个RT核心的GPU。相比之下，RTX4000具有20GB显存，6144个CUDA核心，192个Tensor核心，48个RT核心。

为满足企业客户需求，NVIDIA推出了一套一站式解决方案——RTX Workstation。RTX Workstation支持最多4张RTX6000GPU，并且在15小时内能够完成8.6亿token的3-40B的微调。此外，它还能够让Stable Diffusion XL每分钟生成40张图片，比4090快5倍。

OVX服务器采用了L40S GPU，其性能略优于A100。L40S是专为搭建数据中心而设计的GPU，基于Ada Lovelace架构，配备了48GB的GDDR6显存和846GB/s的带宽。在Tensor核心和FP8Transformer引擎的加持下，L40S可以提供超过1.45petaflops的张量处理能力。

对于高算力要求的任务，L40S的18176个CUDA核心可以提供接近于A100五倍的单精度浮点性能（FP32），从而加速复杂计算和数据密集型分析。此外，为了支持实时渲染、产品设计和3D内容创建等专业视觉处理工作，L40S还配备了142个第三代RT核心，可以提供212 teraflops的光线追踪性能。