APP下载

算力芯片迎来拐点

2023-12-28孟华

中国汽车界 2023年9期
关键词:算力高通车载

文 / 孟华

就像燃油车时代要讲动力一样,智能电动车要讲算力。软件定义汽车的趋势,既然已经成为共识,那么软件能力的基础就是算力,算力来源于算力芯片。

动力的计数单位是马力、功率、扭矩这些指标。而算力则是Tops(每秒进行1012次二进制计算)、Flops(每秒浮点计算次数),这些都日益被业内人士接受和熟知。这些常用来衡量GPU的图形计算能力。

对于CPU,DMIPS(106次算逻运算指令)常用来衡量处理器的整数运算能力,这个单位就相对陌生。如果智能座舱相比较流畅地运行AR、360全景、流媒体、HUD等,至少要超过20,000DMIPS。

其实,广义上的算力芯片,不只是各种PU(CPU、GPU、NPU神经网络处理器、TPU张量处理器),还包括手机和车载比较流行的Soc(系统级芯片,自动驾驶和智能座舱常用Soc方式搭载)和MCU。顺便说一句,Soc既然是系统芯片,往往集成了各种PU(看需求)和动态、静态存储,可以视为一个微型的PC机。

MCU地位下降

虽然MCU用途很广泛,多媒体、音响、导航、悬挂、车窗、雨刷等无所不包,但是现在算力的演化趋势,就是拿走了大部分的控制功能,MCU用途,正在收窄为核心算力(Soc)的“协处理器”。用通俗的语言描述,就是紧挨着核心算力大脑的“小跟班”。一方面可以充当安全处理器(冗余决策),另一方面可以分担一些中央Soc的功能,减轻后者的计算压力。比如管理电池、网关和预处理雷达数据。

从主角变成配角,这个趋势虽然没有普及化,但前景已经比较明确。这让MCU的生产商颇为落寞。恩智浦、英飞凌、瑞萨、德仪,这些传统汽车芯片厂家,本世纪以来都在MCU上赚了大钱。但是市场已经开始接受了新势力的方案,就是将大算力的各种PU作为汽车“大脑”的做法。现在的趋势是,跨国厂商早就开始研发相应E-E架构,但马上拿出来可能还有困难。

但趋势也是没办法回头的。MCU企业曾经幻想,让车企放弃昂贵的各种PU方案,回到相对传统的架构。

从什么时候这个幻想破灭了呢?这要追溯到2019年,特斯拉推出HW3.0芯片,144TOPS的算力轰动业界。一时间,高算力芯片炙手可热。自那以后,只要用了大算力平台(无论是自研还是买的),产品的软件体验(座舱和ADAS)马上能上一个档次。这就让传统芯片企业的风头,都被英伟达和高通掠走了。始作俑者特斯拉,主动终结Mobileye自动驾驶芯片供货之后,又与英伟达分手,自此一直采用自研芯片(代工方为三星和台积电)。

主流和非主流

现在的市场上,只要是2021、2022年上市的、20万元以上的中国品牌车型,座舱芯片齐刷刷都是8155(准确地说是高通的SA8155P)。2023年高通在智能座舱芯片的市占率高达90%。

自动驾驶算力芯片,竞争对手就稍微多一点,但跑不脱英伟达、地平线这几家。德仪、Mobileye、华为海思也拿到一小部分市场。

2023 年上半年的数据,在中国乘用车市场上,具备NCA 功能的计算方案市场份额,英伟达独占52.57%,其余为地平线(30.7%)、德仪(8.62%)、Mobileye(4.05%)、华为海思(4.05%)。

Mobileye认为,算力并非瓶颈,凭借算法和5个并行核心的多任务模式,就可以处理8颗摄像头数据,足以应对L4场景。

有意思的是,座舱芯片除了8155之外,选择其实很多。华为的麒麟710A、恩智浦的i.mx8、6D/Q,联发科的MT2712、德仪的JT6、意法的Accord 7、5等。但比亚迪似乎剑走偏锋,敢于使用高通的非车规SoC,例如625、665、6350、7325等(手机芯片)。

众所周知,非车规芯片的功能和车规没什么不同,只不过后者的环境适应性要求要苛刻得多。汽车使用非车规芯片,可以缩短开发周期,价格便宜。但可能引起黑屏、宕机等故障。比亚迪的应对方案是额外配置一颗安全芯片(就是刚才提到的“冗余决策芯片”),以保证主芯片出问题时,能保住核心程序继续运行。这种极致削减成本(开发周期也是成本)的做法,也是其核心竞争力的一部分。

神仙打架的局面

这样一来,就很清楚了,算力芯片领域,眼下是高通和英伟达“神仙打架”的局面。值得一提的是,高通是唯一一家没有被限制向中国出售芯片(不止是汽车芯片)的美企。8155能够占有率这么高,有这方面因素。但即便如此,美国的政策翻脸如翻书,国产替代一样充满紧迫性。

高通和英伟达,一直在车载算力芯片上较劲。一方面比拼算力芯片的巅峰能力,另一方面,都在推出超级算力芯片,统一双智运算,试图把对方的地盘也抢过来。

去年9月,英伟达发布了高达2000Tops算力的Thor,号称“驾舱一体”。意思是这不是一块纯粹的自动驾驶芯片,而是专为汽车的中央算力架构而生。一块芯片控制所有车载功能,满足所有算力需求。此举无疑顺应了E-E架构由分布式向集中式演进的趋势。

此前发布的算力254Tops算力的英伟达Orin相形见绌。而且,Thor和Orin一样,都可以叠加多颗使用。当然,史上最强“叠叠乐”,仍是英伟达产品,即DGX GH200(CPU和GPU的组合)。叠加256颗,即可组成1E(1015)Flops算力。但是5兆瓦的功率(相当于一个小城市的用电功率),决定了它只能在冷却完善的机房里运行。

在GH200上可以运行任何大模型,超算能力可以让其充当强大的云端服务器和训练大模型,这样,英伟达就在AI大模型训练硬件上一骑绝尘,并可以建立从云端到车端的连接。既然拥有了空前强大的模型工具,甚至可以用AI发明更强的GPU,这意味着算力正走向“奇点时刻”:用AI发明AI,起码现在就奠定了硬件基础。

高通更强的是算逻运算。与英伟达不断强化图形计算能力不同,高通更擅长发展移动CPU这样的路线。不过两者殊途同归,高通2023年1月发布的SA8775,也走向了驾舱一体路线。高通声称,这款4nm芯片,通过组合可以实现与英伟达Thor能力相当的2000Tops算力。这其实就是暗示单块8775无法做到这么高的算力。2022年高通以45亿美元收购自动驾驶芯片公司维宁尔,今年收购通信芯片公司Autotalks,都是为了补强短板,在算力领域与英伟达对抗。

双寡头下的变数

不过,车载算力的天花板,不但远比超算里面的单颗芯片低,其造价和周期也比后者长。一句话,同样算力,车规芯片有成本劣势。

全新的手机Soc,技术储备支持“拾级而上”的话,两年就能做到。而车规芯片要完成一系列认证,可能研发时间要加倍。

这就决定了汽车芯片的迭代周期没有手机快。不光是因为车规芯片的周期问题,也由于车载硬件方案,要跟随整车研发周期。因此我们看到2019年发布的8155、Orin,都还是装车主力。尽管他们的下一代芯片最晚在2022年发布,但采用者依然寥寥。不过,由于中国新能源汽车的竞争非常激烈,这个进程正在加速。整体而言,算力芯片上车周期,比国外快1、2年。这已经是很大的差距了。毕竟后者距离算力完全集中,还有很长的路要走。

即便不考虑车规验证周期,算力芯片本身,也很容易产生“寡头”。一旦某个芯片公司取得先发优势,他们会凭借出货量和市场份额,迅速摊平研发成本。利润回笼前就可以进入下一轮研发。优化、开发、积累新的技术,越跑越快,以至于对手从望其项背到丧失上桌资格。

而且寡头化还有个激励因素,就是制程的提高,让流片费用变得非常昂贵,可能单芯就达到数千万美元。失败成本非常高。如果安全性、稳定性、散热性达不到设计,这钱就打水漂了,代工厂是不负责的。这就更促使强者愈强。

现在算力这一块,虽然高通和英伟达尚未完成驱逐传统芯片大厂的过程,只是因为跨国整车厂的节奏没跟上,让后者还有订单。一旦大家都实现算力充分集中,可能全球车载算力需求,都会沦为“双寡头”的盘中餐。

这里面唯一的变数,是中国芯片供应商。目前寒武纪、黑芝麻、华为海思等芯片公司日子都不大好过。出货量太少令其很难追上英伟达的节奏。但是美国的制裁,让英伟达只能向中国客户提供专供版显卡,车载芯片这一块倒尚未限制,但客户们都为这一天积极做准备。这让中国芯片供应商,仍保有商业机会。

车企造芯,基本也是投资率器件、传感器、汽车MCU、电源管理等。算力芯片门槛太高,直接孵化有困难。合资和战投,是不错的入手方式。地平线获得大众的投资,财务可能一时无忧,但长期看,必须在算力芯片和架构方案的正面战场上赢得市场地位,才能有效解除警报。

在2018 年,当时最新上市的Mobileye Q4(28nm制程)自动驾驶芯片,算力为2.5Tops。Mobileye认为,算力并非瓶颈,凭借算法和5个并行核心的多任务模式,就可以处理8颗摄像头数据,足以应对L4场景。他们引以为豪的是该芯片功耗只有3W。

5年过去了,业内对算力的认知、运用和由此产生的需求,都在飞跃发展。2.5Tops算力应对L4的认知,就像80年代IBM认为,只需要5台大型机(其算力远不如现在的主流手机),就足以满足全球的计算需求。两个预测有相似之处。而《汽车人》认为,就算限制在车载场景,算力需求也很难看到终点。就像我们很难预料AI的终点一样(可能所有事物的前方,都有一个大模型,包括人本身)。

人类从历史中学到的唯一教训,是从来不会汲取教训,这句话倒是仍然有效。

猜你喜欢

算力高通车载
基于网络5.0的重叠网形态算力网络
卫星通信在算力网络中的应用研究
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
高速磁浮车载运行控制系统综述
高通、苹果专利案新进展:苹果拒绝与高通和解
历史转折后的高通前执行董事长
《福布斯》欧盟罚高通
智能互联势不可挡 车载存储需求爆发
高通24亿美元收购芯片制造商CSR