英伟达黄仁勋是谁?带你认识AI时代的幕后推手
哈哈,你之前的感觉其实没全错,他就是那个‘卖显卡的老板’,只不过后来发现这显卡能用来搞人工智能,直接成了AI世界的军火商。黄仁勋是美籍华人,1963年出生在台湾,9岁去了美国。1993年和两个朋友创立了英伟达,当时的目标就是造专门处理图像的芯片——GPU。
那时候游戏市场刚起步,3D画面需要大量并行计算,传统的CPU根本忙不过来。打个比方,CPU像个数学教授,一次只算一道超难的题;GPU却像个指挥千军万马的将军,同时处理成千上万道简单运算。这个特性当初是为了让游戏跑得流畅,没想到二十年后,竟然成了AI训练的命脉。
问得好,这也是绝大多数人最初的误区。其实,AI训练的核心就是巨量的矩阵乘法——数十亿个数字之间的简单乘加运算,跟图形渲染里的像素计算需求几乎一模一样。2006年,黄仁勋做了一个当时看起来有点疯狂的决定:推出CUDA平台,让开发者可以直接用GPU来算科研问题,不光是画三角形。
说白了,CUDA就是给GPU装上了一套‘万能方言’,让搞科学的人也能轻松使唤它。2012年,多伦多大学的团队用英伟达GPU训练出了AlexNet,图片识别准确率直接把传统方法按在地上摩擦,从此,整个AI界开始疯抢英伟达的显卡。后来OpenAI训练GPT-1、GPT-2、GPT-3,一直到今天的GPT-5.5,背后的算力几乎都在英伟达GPU上跑。讲真,没有CUDA,大模型的训练速度可能要慢100倍,甚至根本不可行。
这又是另一个常见的误解。如果只是买几块显卡回家玩,那是游戏发烧友的事;但训练类似GPT-5.5这样的模型,需要成千上万张GPU组成集群,还要解决散热、通信、故障恢复等一堆工程噩梦。英伟达厉害就厉害在它不光卖芯片,它卖的是整套‘AI工厂’——DGX系统、Mellanox高速网络、CUDA软件栈,甚至黄仁勋自家都开始设计数据中心布局了。
举个例子,2024年发布的H200芯片,今年主流已经是B300系列,一块卡的价格顶一辆中档轿车,而且经常卖到断货。你想啊,大模型公司为了抢这些卡,提前一两年就下订单。黄仁勋自己都说,我们不是卖芯片,我们卖的是‘算力时间’。这就像当年淘金热,他不去淘金,他卖给所有淘金者铲子,而且别的铲子都没他的好用。
对,标志性的皮衣,几乎成了他的战袍。他是个工作狂,据说几十年如一日,每周工作七天。风格非常直接,内部开会有时候会直接爆粗口,但对技术和长期规划极有远见。他经常说‘我们离倒闭只有30天’,即使英伟达市价已经超过苹果,这种忧患意识让他总能提前踩中下一波浪潮。
很多人以为他只是个商人,其实他是工程师出身,对架构细节能跟技术团队深入讨论。2016年,他亲手把第一台DGX-1超级计算机送到OpenAI办公室,当时接收的人里就有马斯克。那台机器专门标着‘为了支持人类智慧的进步’,如今看来,这句话真不是说说的。
目前看,英伟达在训练端的统治力依然稳固,但挑战者也不少。Google有自研的TPU,亚马逊有Trainium,连OpenAI都在捣鼓自己的芯片。不过黄仁勋一直在迭代,像今年的B300和即将推出的R系列,性能又翻倍了。其实更关键的是生态锁死:几乎所有AI框架都是基于CUDA优化,开发者习惯了,迁移成本极高。就像我们平时交流用普通话,突然让你改用方言,所有人重新学一遍,成本太高。
不过,AI推理的战场可能比训练要大得多,一些新兴芯片公司在做能效比更优的推理芯片。黄仁勋的应对是‘全栈出击’,从训练到推理,从数据中心到自动驾驶,甚至到机器人仿真平台,他都想插一脚。未来不一定永远赢,但短期内,他依然是那个‘卖水的’,而AI淘金热远远没结束。
那普通人该怎么关注他?有什么可以上手的AI工具吗?