展会新闻

SOC芯片行业深度研究:数字芯片皇冠,汽车SOC芯片迎接大时代

1 汽车电动化、智能化引领产业新趋势

1.1 汽车电动化、智能化引领产业变革,关注“自动驾驶”及“智能座 舱”

汽车行业正在经历电动化、智能化革命,电动化主要改变汽车的动力和传动系统, 智能化则改变了人与车之间的关系。从 PC 时代的微软、智能手机时代的苹果, 以及到破万亿市值的特斯拉,属于智能电动车的新时代已经拉开帷幕,当下时点 为汽车行业新周期起点,电动及智能化革命将颠覆整个汽车产业链,也将孕育新 的产业生机,目前我们认为汽车行业正在经历三大趋势:

1)新能源车迈入成长期,智能车引领新趋势:伴随着优质供给如特斯拉,比亚 迪入局,续航里程提升以及带给人的舒适的驾驶体验,需求端客户已经开始逐步 接受并选择购买新能源汽车,2021 年国内新能源汽车渗透率超过 10%,行业开始 迈入成长阶段。汽车行业下一阶段发展重点是智能汽车时代,指通过搭载先进传 感器,运用人工智能等新技术,从而让其具备自动驾驶以及人机交互功能,有望 成为下一代移动空间和智能应用终端。因此汽车智能化是抢占行业竞争制高点的 关键领域。

2)汽车作为消费品,评价其核心竞争力将从“燃油车时代的马力”、“电动车时 代的电池续航能力”到“智能汽车时代的算力”:从 19 世纪 80 年代的传统燃油 车,2010 年的电动汽车,发展到 2020 年的智能汽车,我们评价汽车的性能以及 其核心竞争要素也在变化:a、燃油车评价性能好坏我们更多是看内燃机马力;b、 电动车我们更关注电池续航;c、智能车时代我们更关注在大算力平台下车外自动 驾驶技术的成熟度以及车内智能座舱所带来人机交互的智能化体验。

3)商业模式及汽车价值链重构:通过软件实现价值链向中后段转移。在汽车全 生命周期下,与传统燃油车销售的一锤子买卖不同,智能汽车后续通过“硬件预 埋、软件升级”的方式可以持续提升用户体验,增加用户粘性,届时主机厂可以 通过 OTA 升级实现软件可售、软件付费等新商业模式,获得较高附加值,整车架 构和商业模式被重新定义。

智能网联是汽车产业下一步变革的风暴中心。汽车要从根本上改变产品形态,从 移动工具转变成生活伙伴,需要智能化与网联化的发展来彻底解放人们的双手和 注意力,从而赋予汽车这一产品更丰富的想象空间。“新四化”的重心不可避免地 向智能化和网联化迁移,无论是需求端对产品定位和价值诉求的转变、供给端在 自动驾驶和车联网上的竞争与合作,都证明了“智能网联”在变革浪潮中核心驱 动力的地位,将成为汽车产业发展的长期趋势。 “自动驾驶”和“智能座舱”正在逐渐迈入大众的视野。“智能化”引领自动驾驶 自不必多言,但“网联化”也是其必不可少的重要支撑。尤其是对于智舱系统, 从娱乐的丰富性到系统的持续迭代升级,都离不开“网联化”这一重要前提。

1.2 汽车电动化、智能化带来“汽车半导体”蓬勃发展

手机领域的蓬勃发展是过去十年半导体产业快速增长的主要推动力,汽车电子化 和智能化有望成为半导体行业新增长级,产业变革下一定会催生新的科技厂商和 行业主导者。未来汽车会和手机、电脑一样,成为整个半导体行业的主要增长推动力,主要系更高级的自动驾驶、智能座舱、车载以太网络以及车载信息系统等 都会催生新的半导体需求。地平线预测 2030年全球汽车领域芯片市场规模约为 1000 亿美金,相比 2017 年全球汽车芯片 375 亿美金市场同比增长 190%。

新能源汽车搭载芯片数量约为传统燃油车的 1.5 倍,预计 2028 年单车半导体含量 相比 2021 年翻一番。自动驾驶级别越高对传感器芯片数量要求越多,L3 级别自 动驾驶平均搭载 8 个传感器芯片,而 L5 级别自动驾驶所需传感器芯片数量提升 至 20 个。同样车辆所需处理与储存的信息量也与自动驾驶技术成熟度正相关,进 一步提升了控制类芯片和储存类芯片的搭载量。据统计至 2022 年,新能源汽车车 均芯片搭载量约 1459 个,而传统燃油车搭载芯片数量为 934 个。Strategy Analytics 预计每辆车的平均硅含量将从 2021 年 530 美元/车翻一番,到 2028 年超过 1000 美元,而高端制造汽车的硅含量可能超过 3000 美元。

汽车芯片主要有如下几个应用领域:

主控芯片用来生成汽车主要控制信号的计算和生成功能。主控芯片通过接受 各类传感器搜集到的信号,进行计算相对的处理措施,并将驱动信号发送给 对应的控制模块。因此主控芯片相当于汽车的“大脑”。

功率芯片是新能源汽车价值量提升最多的部分,需求端主要为 IGBT、 MOSFET 及多个 IGBT 集成的 IPM 模块等产品,核心用于大电流和大电压的 环境。

CMOS 芯片是将光子转换为电子进行数字处理,把图像信号转换为数字信号 的芯片,包括微透镜、光电二极管、处理芯片以及 IO 接口,是摄像头的关键 部件。随着自动驾驶等级提升,预计 L3 以上的辅助驾驶需要约 18 颗摄像头, 主要用在倒车后视,环视,前视,转弯盲区等领域。

射频接收器是无线通讯的重要器件,射频芯片是指能够将射频信号与数字信 号进行转换的芯片,它包括功率放大器 PA、滤波器、低噪声放大器 LNA、天 线开关、双工器、调谐器等。未来,射频芯片将像汽车的耳朵一样将助力 C-V2X 技术发展,将“人-车-路-云”等交通参与要素有机联系在一起,弥补了 单车智能的不足,推动协同式应用服务发展。

超声波/毫米波/激光雷达是感知车身传感器,智能汽车通过传感器获得大量数 据,L5 级别的汽车会携带传感器将达到 20 个以上。车载雷达主要包括超声 波雷达、毫米波雷达和激光雷达三种。其中,中国超声波雷达已发展的相对 成熟,技术壁垒不高;毫米波雷达技术壁垒较高,且是智能汽车的重要传感 器,目前处于快速发展的阶段;激光雷达技术壁垒高,是高级别自动驾驶的 重要传感器,但目前成本昂贵、过车规难、落地难。

存储芯片是智能汽车的“记忆“,自动驾驶技术升级带来车规存储的带宽持 续高增长是长期趋势,未来汽车存储将由 GB 级走向 TB 级别。

汽车面板呈多屏化趋势。汽车智能化、电动化提速将带动车均面板数量,车 载面板也开始走向标准化。从需求上看,显示屏在汽车上的应用越来越广, 需求数量强劲成长。车载显示主要包括中控显示屏、仪表显示屏、挡风玻璃 复合抬头显示屏、虚拟电子后视镜显示屏、后座娱乐显示屏等。随着车联网、 新能源车、无人驾驶等因素的推动,人们对具备导航、车辆状况、多媒体影 音等功能的车载面板的需求将持续扩大。

1.3 电子电气架构演进驱动汽车芯片供应链创新

汽车电子电气架构由分布式向集中式演进。传统功能汽车采用分布式电子电气架 构,离散化的 ECU 软硬件紧耦合且各 ECU 之间独立性较强,硬件资源无法共享 且形成数据孤岛,对用户新需求反馈的整体周期长达 20 个月以上,难以形成持续 快速迭代的软件开发模式。因此,软件定义汽车开发模式驱动整车电子电气架构 由分布式向中央集中式演进,其核心是车载计算的集中化发展,高集成化的域控 制器、车载中央计算平台是关键。电子电气架构演进的优缺点如下:

分布式电子电气架构: √优点:各模块间功能划分明确,独立性强,软硬件强耦合,各模块可独立开发。 √缺点:各模块间芯片算力无法协同,且相互冗余,分布式架构需要大量内部通 信,增加线束成本;功能更新需各模块供应商负责,研发与推送效率低,且供应 链管理难度极大。

(跨)域集中式电子电气架构: √优点:将分散的 ECU 集中到动力、底盘、座舱、驾驶、车身等几大域控制器中, 减少内部通信需求与线束成本;软硬件逐步解耦,硬件超前设计,软件自研,通 过 OTA 灵活更新。 √缺点:域分布式计算下大算力 SOC 芯片成本较高,算力存在冗余且单车算力存 在物理上限。

中央集中式电子电气架构: √优点:进一步简化电子电气架构,降低线束设计复杂度与成本,SOA 软件架构 支持软件功能的迭代与扩展,从车载中央计算发展为车云计算后,车内与云端架构实现无缝结合,车端计算用于车内信息与数据的实时处理,云计算作为补充, 提供非实时的数据交互与计算。

复盘过去 5 年汽车半导体行业,2016 年以来第一波结构性红利已基本结束,纯国 产替代为代表的显性机会窗口快速关闭;2021 年前后“电气化”和“智能网联化” 是汽车产业变革的新一波主浪潮:

国产替代主导小周期:2016~2021 年的行业拉升,主要来自传统电子电气架 构下的国产化替代,以半导体供应链危机正式拉开大幕为催化,国产替代的 大规模上车为高潮,如中低端 MCU、三电等领域。

汽车新架构主导大周期:从 2022 年起逐步开启的第二轮产业周期,很可能是 汽车产业变革的真正主浪潮。这一次,故事主线不仅仅是国产替代,而是高 度智能化、电气化的下一代汽车,以及全新电子电气架构下的增量功能、增 量技术、增量市场;红利体量,将从国产替代的千亿级,跃升至万亿级。

我们认为本轮新汽车周期对相关汽车半导体公司的业绩贡献在 2022~2025 年,核 心驱动因素有两个:第一,各大车厂基于全新一代电子电气架构推出的车型平台, 将在 2022 年底~2024 年分批上市,2025 年后基于全新平台的新车型将全面铺开。 第二,从细分领域来看,高压/高速汽车连接器、激光雷达、域控制器、汽车 SOC、 高端 MCU 等大算力芯片、传感器加速上车,将带来汽车半导体新一轮繁荣。

而其他领域如单功能 MCU、线束的市场规模在未来几年可能会下降:

域架构下,MCU 用量下降:特斯拉电子电气架构集成度高,主要是因为特斯 拉将众多小型 ECU 的功能全部集成到区域控制器中,因此 ECU 数量相比 ID.4/Mach E 少,从下表可以看出,Model Y、ID.4、Mach E 的 ECU 数量分别 为 26、52、51。特斯拉的 Model3 的 FBCM 既负责配电,还负责一些左前灯 控制、空调控制、热管理等功能,横跨了传统的车身、座舱、底盘及动力域。

域架构下,降低线束成本:安波福测算使用域架构下可以降低 25%线束成本, 而伟世通则认为域架构可以节省 50%或更多的线束长度。特斯拉的架构更接 近于域控制架构,Model S 内部线束长度长达 3km,到 Model3 只有 1.5km, 进一步证明域架构下可以节约线束长度及重量。

2 汽车 SOC 是智能电动车功能实现的核心元件

2.1 汽车 SOC 主要负责数据处理,座舱/自动驾驶是主要市场

目前 MCU 是汽车芯片中占比第一的细分品类。IC Insights 发布的数据显示,2021 年全球汽车芯片从细分产品占比来看,前三分别微处理器、模拟芯片和传感器, 所占比重分别为 30%、29%和 17。MCU 芯片全称为微控制单元,又称为单片微型 计算机或者单片机。它是一个是把中央处理器的频率与规格做适当缩减,并将内 存、计数器、USB、A/D 转换、UART、PLC、DMA 等周边接口,甚至 LCD 驱动 电路都整合在单一芯片上形成芯片级的计算机。通常MCU只能完成较少的任务,例如开启智能雨刷,或是下车后自动落锁等等。因此在豪车中可能拥有数百个 MCU 来实现各种智能化功能。

人工智能时代诞生系统级芯片(SOC)。在人工智能时代计算架构从单一芯片模式 向融合异构多芯片模式发展,将 CPU 与 GPU、FPGA、ASIC等通用/专用芯片异构融合、集合 AI 加速器的系统级芯片(SOC)应运而生。

大算力的汽车 SOC 主要应用在智能驾驶和智能座舱领域。广义而言汽车领域算 力稍强(2K DMIPS 以上)的 MCU 都可算是 SOC,Arteris 预测未来单车 SOC 数 量为 23 个,而大算力 SOC 在车载端主要面向两个领域,分别是智能座舱和智能 驾驶。

CPU→GPU→FPGA→ASIC(xPU),芯片专用性越来越强。CPU 负责逻辑运 算和任务调度;GPU 作为通用加速器,可承担 CNN 等神经网络计算与机器学习任务,将在较长时间内承担主要计算工作;FPGA 作为硬件加速器,具备可编程 的优点,在 RNN/LSTM/强化学习等顺序类机器学习中表现优异,在部分成熟算法 领域发挥着突出作用;而 ASIC 可以兼顾性能和功耗,作为全定制的方案将在自 动驾驶算法成熟后成为最终选择。

汽车 SOC 芯片持续追求先进制程。从芯片工艺制程来看,不同汽车芯片对工艺要 求存在较大差异。MCU 主要是依靠成熟制程,全球 70% MCU 生产来自台积电; 而座舱、自动驾驶 SOC 及 AI 芯片等主控芯片持续追求 7nm 及以下先进制程。

未来部分 MCU 功能会被整合到 SOC 芯片中,ECU 数量减少导致 MCU 的用量 下降。汽车 MCU 紧随汽车电子电气架构发展,SOC 芯片会集成部分低端 MCU 功 能,因此未来 MCU 单车使用量将会下降,分布式向域控制发展使用量将从当前 从 30-40 颗,逐步提升至 70-80 颗,但未来随着集中式架构落地,算力向整车计算 平台集中,汽车 MCU 的使用量又将逐步降低至 50-60 颗左右。

域控制架构下控制芯片将形成“MCU+SOC”态势。SOC芯片并不能替代所有MCU, 一方面不是所有 MCU 都有必要接入 SOC 芯片,比如“让转向灯闪耀的控制方式” 如果不用 MCU 方案,全部接入 SOC 芯片会形成一个星形网络,不仅导线数量会增加,管理难度也会剧增。另外一方面也需要一部分MCU 作为 SOC 芯片安全冗余的备选方案。

2.2 自动驾驶 SOC 和座舱 SOC 架构对比

拆分自动驾驶 SOC 结构,包括 CPU、GPU 和其他类型的定制芯片(如 NPU、深度 学习加速器(DLAs)和计算机视觉处理器(CVP))。除此之外,一个典型的自动驾驶 SOC 结构还包括以下部分: 至少一个微处理器(MPU)或数字信号处理器(DSP),但也可以有多个处理器内 核; 存储器可以是 RAM、ROM、EEPROM 和闪存中的一种或多种; 用于提供时间脉冲信号的振荡器和锁相环电路; 由计数器和计时器、电源电路组成的外设; 不同标准的连线接口,如 USB、火线、以太网、通用异步收发和序列周边接 口等; 电压调理电路及稳压器。

拆分座舱 SOC 架构,我们发现在多块高分辨率屏幕和流畅的系统背后,不仅仅比 拼的是车机芯片的算力、视频处理能力,更加看重 AI 能力等性能指标。比如高通 8155 芯片是高通第三代骁龙汽车数字座舱旗舰级平台,是一款异构架构的芯片, 包含 CPU、GPU、DSP、ISP 以及 AI 引擎等:

CPU 部分,8155 芯片采用 1+3+4 的 8 核心设计,核心为高通 Kryo485。 其中大核主频为 2.96GHz,三个高性能核心主频为 2.42GHz,四个低功耗小 核主频为 1.8GHz。 而 GPU 部分,8155 芯片与骁龙 855 都采用 Adreno640。同时,8155 芯片所 采用的 Hexagon690DSP、Spectra380ISP,相比高通骁龙 855 和 855+,名称上 也是一模一样。 此外与自动驾驶芯片不同的是,8155 芯片并没有独立的 NPU 内核,AI 计算 主要通过 DSP、CPU 和 GPU 组成的 AI 引擎完成。其中,Hexagon690 拥有 7TOPS 的 AI 算力,加上 CPU、GPU 的 AI 算力之和为 8TOPS。

3 自动驾驶:传感器配置“内卷”,“硬件预埋”成为车企主流策略

3.1 市场概况:L2+场景将持续较长时间,封闭场景 L4 开始落地

015 年以前辅助驾驶功能主要为 L1/L0 级,L1 级可实现加减速或转向控制, 驾驶员持续进行车辆横向和纵向的操作,代表功能为 LKA、AEB 等;

2016 年进入 L2 级时代,可同时实现车速和转向自动化。驾驶必须始终保持 掌控驾驶,在特定场景下系统进行横向和纵向操作,代表功能为 ACC、LKA、 APA 等,部分 ECU 开始集成式发展,但仍未有域的划分,目前 L2 及以下整 体单车配套价值在 1.5 万元左右。

2020 年将正式进入 L3 级导入期,为有条件自动驾驶,可解放双手。驾驶 员不必一直监控系统,但必须时刻保持警惕并在必要时进行干预,整车大约 分为 5~6 个域,控制器算力指数级提升,以太网开始出现,L3 及以下整体单 车配套价值约为 2.5 万元。但是由于目前 L3 级别自动驾驶技术仍不完善、法 规问题、责任认定、加之成本过高,短期内能够实现大规模量产的仍然以 L2 级别的 ADAS 为主。

展望未来我们认为 L2+辅助驾驶系统将快速普及并长期存在,另外在一些低速、 封闭场景下比如矿山,港口中 L4 自动驾驶开始落地,而基于法律法规以及技术 成熟度等问题,高速、开放场景下的 robotaxi/robotruck 落地需要较长时间,黑 芝麻智能单记章指出,从 L2 真正突破到 L3 级是一个漫长的过程,未来很长一段 时间内智能网联汽车仍将处于人机共驾的状态,这其中涉及到软件、硬件、数据 等技术的紧密配合和升级。尤其是大算力车规级芯片,将是高阶自动驾驶突破的 核心关键。

3.2 硬件趋势:ASIC 方案+集成 ISP+大算力预埋

3.2.1 预计 CPU+ASIC 方案逐渐成为未来主流选择

CPU+ASIC 方案将是自动驾驶 SOC 主流架构。目前市面上主流的自动驾驶芯片 SOC 架构方案分为三种:CPU+GPU+ASIC,CPU+ASIC 及 CPU+FPGA。从发展 趋势来看,定制批量生产的低功耗、低成本的专用自动驾驶 AI 芯片(ASIC)将 逐渐取代高功耗的 GPU。 英伟达 Xaiver 芯片主要有四个模块,其中 GPU 占的面积最大,其次是 CPU, 辅以两个 ASIC。特斯拉 FSD 芯片架构主要有三个模块,即 GPU、CPU 和 NPU,其中 NPU 是架构重点。 MobileyeEQ5 的 CVP 是针对 Mobileye 自有的视觉算法设计的 ASIC,以此有 效降低功耗。地平线自主研发了基于灵活 BPU 架构的 ASIC 芯片。 谷歌 Waymo 采用“CPU+FPGA”方案,其计算平台采用英特尔 Xeon 的 12 核 以上的 CPU,搭配 Alter 的 Arria 系列的 FPGA。其 I/O Board 采用英飞凌的 Aurix 系列的 MCU 作为 CAN/Flex Ray 网络通信接口。在自动驾驶算法固化 后,FPGA 可能被 ASIC 替代。

3.2.2 SOC 芯片厂商集成 ISP,同时处理多传感器数据实现成本节降

ISP 参数配置是决定计算机视觉图像质量的关键因素。ISP(Image Signal Processing) 指图像信号处理器,主要作用是对前端图像传感器输出的信号做后期处理。简单 来说 ISP 是摄像头的 Photo Shop,目的是提升图像质量。在传统的自动驾驶方案 中,ISP 和摄像头是一对一的对应关系,也就是说只要有一颗摄像头,就要有一颗 ISP。 车载 SOC 芯片集成高性能 ISP 是未来趋势。在车载端,SOC 内部集成 ISP 意味 着无需再为每个摄像头传感器提供 ISP,从而大幅降低感知硬件的成本。而在摄像 头端,取消 ISP 既可以解决高像素摄像头会带来严重的散热问题,也可以帮助车 载摄像头如何进一步缩小电路板尺寸和降低功耗。

目前市场上高级别自动驾驶 SOC 芯片中均集成 ISP。英伟达的 Xavier 和黑芝麻 智能 A1000 芯片中均集成了 ISP。根据英伟达官网,英伟达 Xavier 内置的 ISP 每 秒可处理是 15 亿像素,黑芝麻智能也将 ISP 集成在了 A1000 芯片中,每秒可以 处理 12 亿像素。

3.2.3 面向高级别自动驾驶,“算力预埋”是未来主要趋势

车载计算平台的算力上限决定车辆生命周期内可承载的软件服务升级上限,整车 厂将通过向 C端收取软件授权和 OTA 更新服务费以完成商业模式闭环。当前面 向量产乘用车的智能驾驶系统整体处于 L3及以下级别,但智能驾驶技术仍在持续迭代升级中,为保证车辆在全生命周期内的持续软件升级能力,主机厂在智能 驾驶上采取“硬件预置,软件升级”的策略,通过预置大算力芯片,为后续软件 与算法升级优化提供足够发展空间。 摄像头分辨率提升,激光雷达搭载数量提升以及传输数据量增长驱动汽车对算力 需求大幅提升。高级别自动驾驶对摄像头像素要求提高,预计未来 800 万像素相 机会取代 1-200 万像素相机的主流解决方案。假设一辆智能汽车配备 12 个 800 万 像素的摄像头,每秒60 帧(FPS),隐含的数据输入速率可能达到 5.76 亿像素/秒。 叠加激光雷达的点云算法,预计智能汽车的计算能力将从目前支持 L2+/3 级自动 驾驶的神经网络处理器(NPU)的 100 多个 TOPS(每秒万亿次操作,计算能力的衡 量标准)和支持 2+/3 级自动驾驶的 CPU 的 80K DMIPS(每秒 Dhrystone 百万指令, 也是计算机性能的衡量标准),分别提高到 2030 年的 1000 多个 TOPS 和 500K DMIPS。

“通用开放式”+“大算力”是智能驾驶芯片未来的主要趋势。伴随着 ADAS 辅 助驾驶功能在新车市场上渗透率的不断提升,新势力与领先自主品牌车企在智能 驾驶领域的厮杀日益激烈,智能驾驶传感器配置走向“内卷”,以蔚来、小鹏、极 狐为代表的车型更是率先宣布激光雷达量产上车,叠加高级别自动驾驶对摄像头 像素要求提高,对应自动驾驶芯片算力也持续提升。

3.3 软件趋势:AI 云端训练+OTA 升级

3.3.1 SOC 厂商加速布局自动驾驶 AI 数据训练

自动驾驶数据集对于训练深度学习模型和提升算法可靠性至关重要,SOC 厂商不 但推出了自研的 AI 训练芯片,还有云端超算平台。特斯拉推出了 AI 训练芯片 D1 和“Dojo”超算平台,将用于特斯拉自动驾驶神经网络的训练。不仅如此,训练 算法模型产品也愈发重要,包括 2D 标注、3D 点云标注、2D/3D 融合标注、语义 分割、目标跟踪等,如英伟达 Drive Sim 自动驾驶模拟平台、地平线“艾迪”数据 闭环训练平台等。

特斯拉推出了 Dojo 超算训练平台:采用特斯拉自研 7nm AI 训练芯片 D1, 依托庞大客户群来收集自动驾驶数据,从而实现对深度学习系统的模型训练。 从官方公开信息来看,特斯拉 Dojo AI 系统采用分布式架构,每个 Dojo 节点 都有自己的 CPU、内存和通信接口。而每个节点都有 1.25MB 的 SRAM(静 态随机存取存储器),然后每个节点都连接到一个 2D 网格。当前特斯拉 Autopilot 主要使用 2D 图像+标注的方式进行训练和算法迭代,通过 Dojo 超 算平台,可以使得 Autopilot 可以以 3D 图像+时间戳(4DAutopilot 系统)的 方式进行训练,4DAutopilot 系统将具备可预测性,标记道路物体的 3D 移动 轨迹,以加强自动驾驶功能的可靠性;

英伟达推出了自动驾驶模拟平台:DRIVE Sim 是一种基于 Omniverse 构建 的仿真工具,它可以利用平台的许多功能。DRIVE Sim 生成的数据用于训练 构成自动驾驶汽车感知系统的深度神经网络。DRIVE Sim 的传感器功能包括 路径追踪摄像头、雷达和激光雷达模型,可捕获现实世界的效果,如动态模 糊、LED 闪烁、滚动快门和多普勒效应。

地平线艾迪平台:艾迪 AI 开发工具平台是一个高效的软件 2.0 训练、测试、 管理的工具平台,包括半/全自动的标注工具,自动化模型训练,长尾场景管 理、软件自动集成、自动化回归测试,最后这整套模型通过 OTA 升级部署到 芯片上。

华为八爪鱼自动驾驶开放平台:“八爪鱼”是一个按需获取的全栈云平台,服 务覆盖自动驾驶数据、模型、训练、仿真、标注等全生命周期业务,向车企 及开发者,提供了包括数据服务、训练服务、仿真服务在内的 3 大服务。(1) 数据服务:处理车载硬件平台上输出的传感器数据,回放雷达、摄像头等不 同格式的数据;支持 PB 级海量存储、交互式大数据查询和海量数据治理。 (2)训练服务:管理和训练自动驾驶模型,不断在新的数据集和测试集上提 升模型的准确度,持续提升自动驾驶安全系数。平台提供软硬件加速,能大 幅缩短训练时间,提升训练效率。(3)仿真服务:提供仿真、场景库管理、 场景片段、评测系统等应用工具,确保自动驾驶模型合规、安全、可度量、 质量达标,快速集成到版本中。

3.3.2 通过 OTA 升级可以提高自动驾驶系统的精准度

OTA 技术最早应用在 PC机上,后来广泛应用在移动手机行业,近几年才开始在汽车行业里广泛应用。OTA 是空中下载技术,即通过网络从远程服务器下载新的 软件更新包对自身系统进行升级,包含固件升级和应用升级,从而满足终端厂商 的应用管理需求和运营商对入网终端的管理要求。通过 OTA 技术,车企可以进行 车辆的远程诊断、大数据等应用,快速修复系统故障,并增加新的功能等,可以 让汽车即便在已经离厂并且服役中的状态下,能透过互联网从远程进行系统升级, 以达到“功能更新、亦或是漏洞补救”的目的。

SOA 架构是 OTA 落地前提。SOA 架构(Service-Oriented Architecture,面向服务 的架构)是将每个控制器所控制的不同的硬件和功能抽象成服务,并定义统一的 接口协议,应用开发者可以直接调取相应的服务来实现相关应用和功能,而无需 考虑底层硬件的差异。

不断演进的自动驾驶、点云融合、激光雷达等算法后续可通过 OTA 模式进行迭 代更新,进而提高辅助系统的精准度。截止到 2021 年 6 月,ADAS 算法中巡航类 相关的升级内容最多,为 42 项,其升级主要包括 ACC/ATC、主动循环、车速辅 助等;其次为预警功能新增或优化,包括碰撞预警、车门开门预警以及车道偏离 预警等,共有 23 项,另外泊车系统优化或新增也有 23 项,目标检测与识别相关 的有 17 项,主要包括对路面物体或动物识别优化、交通标志识别等,另外,环视 系统优化升级和车道保持系统升级优化分别升级了 14 项和 12 项。

OTA 升级改变整个汽车行业的商业模式,OEM 可以向 C 端客户发送“算法更新 包”从而实现汽车全生命周期收费,而不是传统汽车时代的“一锤子买卖”。过去 传统汽车行业长期以来依赖新车制造和销售获取利润,现在智能汽车时代可以通 过 OTA 按照“软件升级×汽车保有量”收费。

3.4 规模&增速:2025 年国内智驾 SOC 规模为 138 亿元,CAGR=25%

测算不同自动驾驶级别对应单 SOC 芯片价格:我们假设能支持 Level2 自动驾驶 的 SOC 的成本大约是 50 美元(与近年来 Mobileye 的价格一致)。L3 级别自动驾 驶芯片价格为 1500 人民币(拆分特斯拉 HW3.0 域控制器,其自动驾驶域的芯片成本约为 3000 元,对应 2 个 FSD 芯片)。假设 L4-L5 自动驾驶芯片单片价格为 400 美金(与英伟达 Orin 芯片价格一致)。

测算不同自动驾驶级别对应单 SOC 芯片数量:我们假设 L1 级别自动驾驶需要 1 颗 SOC 芯片,L2/L2+级别自动驾驶需要 2 颗 SOC 芯片(比如理想 one 搭载两颗 地平线 J3),L3 级别自动驾驶需要搭载 2 颗 SOC 芯片(比如特斯拉 HW3.0 需要 两颗 FSD 芯片),L4~L5 级别自动驾驶需要搭载 4 颗 SOC 芯片(比如威马 M7 搭 载 4 颗 Orin 芯片)。 测算汽车自动驾驶 SOC 芯片市场规模:随着汽车电动化、智能化的推进以及自动 驾驶渗透率的提升,自动驾驶芯片行业将维持较高速的增长。我们预计中国自动 驾驶芯片的市场规模将在 2025 年达到 138 亿元,到 2030 年达到 289 亿元,十年 复合增长率预计可达 25.1%。

4 智能座舱:感知、交互、场景应用升级,座舱芯片 向集成式方案演进

4.1 市场概况:智能座舱为“第三空间”载体,成为车企差异化竞争重点

智能化逐渐成为消费者买车时更为关心的指标之一。汽车座舱的智能化发展由三 部分推动,分别为车内/外环境感知,视觉、听觉等多模态人机交互方案以及统筹 感知计算的车联网。汽车座舱智能化发展是通过配备智能化和网联化的车载产品 来实现与人、路、车的智能交互,是人车关系从工具向伙伴演进的重要纽带和关键节点。

汽车座舱正成为具有拟人化交互能力的驾驶伙伴。目前智能座舱系统主要包括内 饰、电子两大系统,像车内的座椅、空调、灯光、仪表盘、中控屏、车联网、语 音识别、手势识别等。智能座舱目前处于智能助理的初级阶段,在硬件方面,座 舱内部的实体按键被简化,大屏化、多屏化趋势显著;在软件方面,语音交互技 术被广泛应用,人脸识别技术和手势识别技术也被尝试,座舱所实现的功能趋于 多样化。

智能座舱渗透率将逐步提升,未来中国市场渗透率将远高于全球。目前全球及中 国智能座舱配置新车渗透率分别为 49.7%与 53.3%,当前中国汽车智能座舱普及 度已经过半,预计未来中国智能座舱产品渗透率的增长将领先全球市场。目前中 国智能座舱主要装备于中高端车型,低端车型装备率较低。

智能座舱兴起诞生新的硬件投资机会,催生大算力 SOC 芯片需求。与传统多芯 多屏方案相比,大算力单芯片解决方案极大降低系统成本,并能提供多屏互动的 智能互联体验,“一芯多屏”成为发展趋势,芯片本身也朝小型化,集成化、高性 能方向发展。座舱 SOC 芯片技术壁垒高,市场集中度高,在国产替代趋势下,国 产座舱 SOC 厂商有望迎来发展机会。

4.2 硬件趋势:“单芯单屏”到“跨域融合”,算力逐步提升

汽车 E/E 架构将沿着“分布式”→“域集中式”→“中央计算式”的方向演进。 与汽车 E/E 架构同步,座舱芯片方案也将相应地经历“单芯单屏”→“单芯多屏” →“融合发展”三大阶段的演进: (1)分布式架构下不同座舱电子设备由不同控制器控制,表现为“单芯单屏”, 但随着座舱功能的提升,“单芯单屏”形态的弊端逐渐显现:1)跨芯片信号传输 存在延迟;2)成本压力开始上升。 (2)集中域式方案即用一个系统级的主控芯片 SOC来实现座舱内所有部件的控制,不仅在软件层面上实现了软硬分离,也在硬件方面实现了集中化,座舱智能 化由“被动智能”迈向“主动智能”。随着座舱智能化提升,多屏人机交互,语音 等 AI 功能需求多样化个性化,以及 OEM 不断更新的 OTA 需求,对底层硬件要求提升,在座舱内“单芯多屏”的 SOC 方案开始进入大众视野。

主流座舱 SOC CPU 算力接近 100K DMIPS。目前座舱 SOC 以 CPU 为核心,CPU 算力从过去的数 K DMIPS 提升到如今的 100 多 K DMIPS 仅用了不到 7 年的时 间。座舱主控 SOC 不仅需要处理来自仪表、座舱屏、AR-HUD 等多屏场景需求, 还需要执行语音识别、车辆控制等操作,因此座舱系统的响应速度、启动时间、 连接速度等用户体验指标直接决定着汽车品牌的竞争力,智能汽车对座舱 SOC 的 性能、算力需求持续攀升。目前高通骁龙 SA8155P 的 CPU 算力约 105K DMIPS, SA8195P 的 CPU 算力约 150K DMIPS,高通第四代座舱 SOC 芯片 SA8295 甚至 达到 200K DMIPS 以上。国内厂商,华为麒麟 990 的 CPU 算力超过 75K DMIPS, 芯驰科技最新推出的座舱芯片 X9U 的 CPU 算力达到 100K DMIPS,瑞芯微最新 推出的智能座舱芯片 RK3588MCPU 算力也达到 100K DMIPS。 座舱 SOC 集成的 AI 算力也大幅跃升。其中三星已量产的 ExynosAutoV910 具备 约 1.9TOPS 的 AI 算力,三星规划 2025 年前后投放量产的 ExynosAutoV920 座舱 芯片的NPU 算力将达到约30TOPS;高通已量产的 SA8155P 芯片AI 算力约8TOPS, 其第四代座舱 SOC 集成的 NPU 算力高达 30TOPS,是目前已发布的 AI 算力最高 的座舱 SOC 产品,计划 2023 年投产。国产座舱 SOC 方面,芯驰科技的座舱产品 从中级产品到至尊级产品均嵌入 AI 算力,其 X9U 产品 AI 算力达 1.2TOPS;瑞芯 微最新发布的座舱 SOCRK3588M 其 AI 算力达到 6TOPS;吉利旗下芯擎科技的龍 鹰一号 AI 算力达到约 8TOPS。

从架构演进情况来看,过去座舱 SOC 芯片并没有单独的 NPU 单元,但随着 AI 算力需求提升座舱 SOC 内开始出现独立 NPU 单元。比如 8155 芯片并没有独立 的 NPU 内核,AI 计算主要通过 DSP、CPU 和 GPU 组成的 AI 引擎完成。其中, Hexagon690 拥有 7TOPS 的 AI 算力,加上 CPU、GPU 的 AI 算力之和为 8TOPS。 高通 8295 芯片算力达到 30TOPS,其 AI 算力是高通 8155 的 7.5 倍,为两个六角 张量 DSP。

4.3 软件趋势:软硬解耦,OEM 需要标准化、开放式的基础软件平台

“软件定义汽车”的核心本质是算法和应用的开发同计算平台的解耦,软件不再 是基于某一固定硬件开发,而是具备可移植、可迭代和可拓展的特性。随着人工 智能的框架和工具链越来越成熟,算法的精准度、成熟度更多依赖于数据量和标 注的质量,后期算法的迭代速度越来越快,但是硬件迭代速度没有那么快。因此 软件定义汽车,更多是利用算法或者软件快速迭代的特点,销售之后通过 OTA 扩 展汽车的功能、性能,提升驾驶的体验: 在芯片平台的硬件基础上,装载 Hypervisor、Linux 等内核系统,管理软硬件 资源、完成任务调度。 在 AUTOSAR 框架下开发拓展各项功能软件,调用处理传感器、执行器数据, 执行自动驾驶算法,实现感知融合、决策规划、控制执行、HMI 等各项应用 功能。

智能汽车座舱软硬解耦分离已基本成为共识。在基于 SOA 软件服务架构基础上, 将车辆底层进行软硬解耦和复用,实现软件功能快速迭代,通过与车主的个性化 OTA 交互,打造个性化和差异化的座舱产品体验。另外为了应对座舱软件需求迭 代多变的特性,在 SOA 服务架构的设计中,还需强调重用性和扩展性。目前智能 座舱软件平台如大陆 EB、中科创达、东软睿驰、华为、诚迈科技、斑马智行等多 家科技公司有所布局。 中科创达发布智能座舱平台 TurboX Auto 4.5,是基于 SOA 架构,实现场景和 服务的解耦,可快速完成场景服务的开发变更及升级迭代。 东软睿驰搭建起通用的标准化的软件架构和软件平台,可快速适配不同市场 主流 SOC 的硬件平台,实现高、中、低端多平台的智能座舱量产落地,以满 足不同车厂不同车型的定位和需求。

4.4 规模&增速:2025 年国内座舱 SOC 规模为 112 亿,CAGR=25%

单车搭载智能座舱 SOC 芯片数量:目前智能座舱的核心一般都是 1~2 颗 SOC 芯 片。目前座舱屏幕数量一般还都是一、两块,稍微多的一些车型会使用上三四块,但随着车辆屏幕数的增加,车内电子元器件(音响、监测等)的增加,单颗芯片 对于这些信息量的处理可能会变得吃力起来,此时有两种方式处理:(1)使用算 力更高的芯片。但是这种方式会导致采购和开发成本的提升,比如集度采用高通 8295,所对应的芯片价值量也会更高;(2)采用多 SOC 模式,对芯片进行分工。 虽然一芯多屏是可以实现的,但大量数据堆积在一起,需要配合较为复杂的算法。 比如目前的理想 ONE 就是采用了这种多颗智能座舱芯片的方式,理想 ONE 搭载 了一颗骁龙 820A 芯片+一颗德州仪器的 Jacinto6 芯片。其中骁龙 820A 芯片负责 驱动 16.2 英寸的中央大屏和 12.3 英寸的副驾驶娱乐屏使用的 Android Automotive 的底层系统,Jacinto6 芯片负责驱动液晶仪表盘和辅助驾驶显示服务使用的 Linux 系统。

单智能座舱 SOC 芯片价格:低端座舱芯片,比如 20万以上售价的热销车型 比亚迪汉搭载老款高通 625 芯片(高通骁龙 625 是一款消费级芯片,曾主要 搭载于红米 Note4、坚果 Pro、小米 5X 等手机设备),成本价约 15 美元/颗 (折合人民币 100 元)。虽然高通骁龙 625 是一款老芯片,但胜在成本低,性 能较为稳定。高通 820A 的价格为 60 美元;高端高通骁龙 8155P SOC 的价格 约为 250 美元(折合人民币约 1688 元)。 测算 2025 年中国智能座舱 SOC 市场规模为 112 亿元:根据中国汽车工业协会数据,2021 年中国乘用车销量 2148.2 万辆,假设未来按照 CAGR=3%增 长;假设单 SOC 价格 750 元测算,那么预计 2025 年国内座舱 SOC 市场规模 达到 112 亿元,CAGR 为 24%。

5 汽车 SOC 高技术壁垒,国内厂商凭借差异化服务 切入自主品牌

5.1 设计/代工/车规认证为 SOC 芯片核心壁垒

大算力 SOC 芯片的设计和制造具有很高的门槛,要综合性能、功耗、成本、车规 安全多方面因素。

1) 异构、多核 SOC 设计和优化能力直接决定了大算力芯片的性能、可靠性 和安全性等。这里面有两大技术难题,一方面要了解客户需求,即深入了 解 AI 算法,尤其背后使用的神经网络。因此需要前瞻性了解新的 AI 算 法,否则等芯片研发出来后发现算法与硬件架构兼容性差将会使芯片效率 大大降低。自动驾驶是高阶的人工智能,与人脸、语音识别以及大数据分 析等领域相比,对安全性和实时性要求更高,且由于驾驶是要和人类共同 参与的,因此需要更高的认知与推理能力。另外要足够了解供给,即 SOC 芯片内部比如 CPU、ISP、DSP 等核心可以通过 IP 授权的形式获得,只有 对各种 IP 深刻理解才能设计出好用的芯片。

2) 性能/功率比为评价 AI 芯片的关键指标,并且作为创业公司要有足够资金 进行先进制程流片。各家新一代 SOC 中每瓦的峰值处理能力在逐步提高: 英伟达的 Drive Orin 能够达到 3.6TOPS/watt 的性能,较其老一代 Xavier 的 1.1TOPS/watt 有显著改进。Mobileye 的 EyeQ4 也可以从 0.83TOPS/watt 上升到 1.6TOPS/watt,并且在即将推出的 Ultra 版本中可能会超过 1.76TOPS/watt。特斯拉已经在 2019 年的 HW3.0 中实现了 2.0TOPS/watt, 并预计在下一代 HW4.0 平台中会有更实质性的改进。持续提高 AI 芯片性 能的方法有:a.持续优化 SOC 架构。如引入更强大的 ASIC 芯片——神经 网络加速器(NNAs)、NPU 或 DLAs;b.采用更先进的芯片制造技术可以有 效降低整体功耗。根据 IBS 的估计,开发一块芯片的成本,包括 IP 许可、 EDA(电子设计自动化)软件、研发、tape out(最终设计过程)、包装和测试 费用,对于 16nm 技术节点,总计流片费用为 1.06 亿美元;对于 7nm 技 术节点,总计流片费用为 2.98 亿美元;而对于 5nm 技术节点,流片费用 为 5.42 亿美元。因此是否有足够的资金进行先进制程流片以及能否拿到 先进制程的产能也是最终能否大规模量产的关键因素。

3) 功能安全流程、车规可靠性认证、ASPICE 软件认证等一系列严苛车规认 证需要逐一攻破。从芯片功能定义到流片/封装测试完成,大约需要 2 年 时间,如果早期车规芯片不涉及功能安全,那么这个过程可以加速。但从 芯片测试完成→量产,大约需要 1 年半~2 年时间,这个环节时间必不可 少,因为涉及 AECQ100,ISO 26262 等功能安全认证,还有夏季冬季认证, 一级软件认证等。

5.2 国产 SOC 厂商在设计芯片之初需要兼顾多重因素

5.2.1 IP:各大自动驾驶 SOC 芯片厂商将自研“XPU”IP 作为竞争重点

各大自动驾驶 SOC 芯片厂商将自研“XPU”IP 作为竞争重点。SOC 芯片多为异 构设计,包含 GPU、CPU、加速核、NPU、DPU、ISP 等不同的计算单元,一般来 说芯片不能简单评估算力,还需兼顾芯片带宽、外设、内存,以及能效比、成本 等。同时,在芯片设计中,异构 IP 的配置非常重要,自动驾驶 SOC 芯片商均不 断加强核心 IP 研发以保持关键竞争力: 特斯拉:经历了早期使用黑盒方案的 Mobileye EyeQ3,到较为开放的 Nvidia Drive 平台,再到如今 NPU 芯片自研。特斯拉将芯片、算法紧耦合,尽管目前特斯拉芯 片算力不是最高,但其软硬一体的融合度效率高于其他 OEM 方案。 黑芝麻:黑芝麻智能先后打造 NeuralIQ ISP 图像信号处理器和 DyanmAI NN 引擎 两大核心 IP。前者让车“看得更清楚”,后者让车“拥有了更强的处理能力及更高 的效率”。

NeuralIQ ISP 图像信号处理器旨在让汽车“看得清”。通常而言,手机拍照多 为静态拍摄,可以通过运用传统的多帧降噪技术,在暗光环境中拍出纯净的 照片。但由于汽车行驶时处于高速运动状态,所以车规级图像处理技术更困 难。黑芝麻智能通过自研 ISP 处理系统,让摄像头在超低光和大逆光场景下 清晰成像,感知到的信息在后端计算中更均一化。

深度神经网络算法平台 DynamAI NN 引擎旨在让汽车“看得懂”。通过 NeuralIQ ISP 图像信号处理器处理后的图片,将传递到深度神经网络算法平 台 DyanmAI NN 引擎上。先将收集的新数据信息与计算平台存储的数据进行 对比,再进行推理和决策,预测出周围环境可能会发生的变化,从而保证汽 车“看得懂”。其后,通过与其他车、云、路互联协同,扩大有效感知范围, 让汽车“看得远”。

5.2.2 芯片性能:“FPS/W”是综合评价芯片能力的指标

芯片算得快比算力大更有用。我们可以拿人和动物的神经元举例,比如大象有 2570 亿个神经元,人脑只有 860 亿个神经元,但其智商上限却仅相当于人类四五 岁的孩童。同样作为自动驾驶大脑的芯片,也绝不能只看硬件的堆砌,架构设计、 算法的运行方式都会影响芯片的最终实际效能。

FPS(每秒识别准确率)更能够反应 AI 芯片的真实计算性能,并且该指标已经开 始被头部自动驾驶厂商使用。马斯克在 2019 年提到,FSD 芯片算力是英伟达DrivePX2 算力 3 倍;在进行自动驾驶任务时,其 FPS 却为后者的 21 倍。而地平 线 J5 与英伟达 Orin 对比,虽然 128TOPS 的算力只有英伟达的一半,但是在进行 自动驾驶任务时,其 FPS 却做到了更胜一筹。更高的 FPS 可以做到更快速的感知, 更低的延迟,这意味着更高的安全性和更快的使用效率。

我们认为真正去评估一家 AI 处理芯片设计的好与坏,最合理的指标是“FPS/Watt & FPS/$,即为了达成 AI 处理目标所付出的功耗和芯片处理的成本”。具体拆解为 三个部分: 理论峰值计算效能(TOPS/Watt & TOPS/$):公司可以通过改进工艺制程和芯 片架构设计两方面提升该指标,其本质是一个硬件架构决定的指标。 芯片有效利用率(Utilization):该数值由软件架构决定。人工智能芯片如果把 硬件架构锁定,把算法也锁定,那软件架构可以通过编译器不断去编译、拆解、重组、部署让芯片效能越来越好。 单位有效算力(FPS /TOPS):即算法处理速度,该数值由算法架构决定。算 法摩尔定律为通过算法不断的更新和演进,解决一个 AI 任务达到的相同准 确率所要求的计算次数在持续下降,即从语音识别,文本自然语言处理,计算机视觉各个领域总结发现每 9-14 个月(每个领域可能略有不同)所完成的 AI 任务所需要的计算次数复杂度会降低一半。 地平线表示,在芯片流片之前应该关注如何让算法和软件更好的指导硬件架构, 因为算法是一个客观的大趋势,需要所有

展会新闻
联系我们
  • 上海市零陵路583号海洋石油大厦4楼

  • +86 138 1702 2917

  • +86 21-34241885

  • davy.chen@secma.org.vn

Copyright © All Rights Reserved by 国际汽车轻量化绿色科技联盟@IALTA@SENIA版权所有 | International GREEN Auto Lightweight Technology Alliance(IALTA) |Sino-EU New Energy Intelligent Automobile Industry Association(SENIA) | Copyright(C)2024.All right Reserved.  沪ICP备18017199号-2 公安网备:31010402007272  技术支持:元缘网络
距展会开幕
0
1
2

合作伙伴: