首页 / 科技

可容纳10万张H100/H200!马斯克揭晓超算中心“大脑皮层”

发布时间:2024-08-06 02:00:32

FSD领先的原因,马斯克亲自揭晓了。

马斯克最近发文,首次公开超算集群命名,并透露了算力规模,规模之大,让网友感叹远远超越了自己的想象。

关于这一超算集群,马斯克此前披露过多条信息,包括其硬件来源,巨额投入,以及需要的耗电量,同样惊人。

难怪有AI大佬感慨,未来能源的重要性,出手投资核聚变领域。

从这一角度来看,蔚来或许无意中,在AI领域先走了一步棋doge。

马斯克公布超算集群:Cortex

马斯克周末没休息,前往特斯拉得克萨斯州超级工厂,对超算集群进行演练,并公开了超算集群的名称:

Cortex (大脑皮层)。

马斯克透露,Cortex可以容纳10万张H100/H200,专门用来训练特斯拉的FSD和Optimus。

有网友直呼算力规模远远超越了自己的预期。

感慨“特斯拉遥遥领先”。

不过,虽然马斯克提到的是英伟达的产品,但Cortex庞大算力的硬件组成,可能是多元的。

马斯克此前透露,超算集群的目标是,一半算力由英伟达和其他厂家组成,比如AMDYES,另一半则来自特斯拉。

显然,后者指的是特斯拉自研的超算中心Dojo。

Dojo首次亮相于2021年特斯拉的AI Day,三年来不断发展,据马斯克此前透露,Dojo 1今年年底将拥有相当于8000张H100的算力,“不算多,但也并非微不足道。”

Dojo后续还会继续扩张,甚至可能开启外供。

马斯克在二季度财报电话会议上表示,通过Dojo,看到了一条与英伟达竞争的路径。

摩根士丹利曾在2023年9月的报告中预测,Dojo可以通过Robotaxi和软件服务为特斯拉提供新的收入增长点,为特斯拉的市值增加5000亿美元。

内部自研,外购囤卡,庞大的算力支撑了FSD的迭代升级,也带来了新的问题:

冷却和能耗。

网络曝光的工厂信息显示,超算设施内外配置了多重散热冷却措施,包括外部的巨大风扇,以及四个超大水箱和巨大的地下水管。

马斯克不久前还公布了包括冷却等带来的超算耗电量:

130MW,差不多是2个半中型发电站的发电量。

这还不够。

马斯克预计,18个月后集群的耗电量会增长到超500MW。

这也难怪去年11月,马斯克会担忧“未来2年内缺电”。

但相比之下,目前国内智驾玩家还不到担忧电力的时候。

或者说,算力差距,才是当前焦虑的主要来源。

2024,智能驾驶算力战争

2024年,价格战在整个车圈打的轰轰烈烈,但其实在头部智驾玩家,一场算力战,也悄然打响。

玩家们有机会,就会秀上一把肌肉。

先说特斯拉,马斯克直接在社交平台宣布,宣布今年会豪掷30-40亿美元从英伟达买卡,折合人民币217-290亿元。

买卡单项投入,几乎是新势力整体研发投入的二倍。

再来看国内,最近小鹏也在发布会上首次透露了算力规模,2.5E FLOPS在整车厂中排在前列。

理想目前尚未透露云端算力规模,有博主称是4 EFLOPS,尚未得到官方证实。

蔚来虽然公布了算力规模,但是是车端和云端的合计数据。

相比新势力,传统车企对算力规模的披露略显保守。

近期魏建军在4月中旬透露,长城自建超算中心总算力规模已达1.64EFLOPS。

供应商中,余承东今年也在智选车发布会上,不断更新云端算力数据,6月底华为用于ADS迭代的算力已达3.5E FLOPS,按照过往增长速度来看,明天的享界S9发布会上可能会突破4E FLOPS。

商汤科技2023年财报显示,其算力储备已达12E FLOPS,但尚不清楚具体分配给旗下汽车业务多少。

百度在年初也曾透露,供给极越的算力在1.8-2.2E FLOPS,上不封顶。

行业普遍认为,影响自动驾驶能力的三要素是:算力、数据和算法。

算法架构上,玩家们都转向了端到端,具体组成和细节各有千秋。

数据目前主要取决于车辆的保有量,算法迭代升级,则逃不开算力依赖。

特斯拉可以豪掷百亿,但对国内玩家来说,高端算力的获取并不容易。

有从业者表示,厂商很难买到A100/H100,只能退而求其次,求购4090,这无疑加大了集群算力提升的难度。

但也有供应商认为,算力差距,并不能决定一切。

马斯克此前也表示,虽然FSD的训练受到AI算力制约,但是需要干预的Corner Case场景数据,对迭代也很重要。

你觉得呢?

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com