國內車企的端到端技術路線分為兩大流派,分別是一段式端到端和分段式端到端。
1.自動駕駛的分類義
自動駕駛的分類:關于自動駕駛的分級,可以參考博世的這張圖,它將自動駕駛劃分為6個階段:L0~L5,L0就是人類手動駕駛;L1是“脫腳”, 比如定速巡航,可以輔助駕駛;L2是“脫手”,除了脫腳之外還可以脫手,實現部分自動駕駛;L3是“脫眼”,眼睛可以不關注路面,可以在 車中玩手機;L4是“脫腦”,可以不用考慮駕駛這件事兒,可以坐在主駕,也可以坐在副駕,這是在限定場景下完成的;L5就是“無人駕駛”, 沒有方向盤和油門剎車等,在任何場景下都可以進行自動駕駛。
差異:國際標準嚴格區分自動化等級,將L3/L4直接綁定車企責任,強調企業主導;中國則明確駕駛員在L3/L4級別中的第一責任人地位,但在系統故障或缺陷導致事 故時,責任可以向車企或運營主體追償,更強調安全優先。
2.自動駕駛的歷史今生
自動駕駛的關鍵節點:多傳感器和視覺路線并行,L3和L4技術持續迭代。 早期探索(2000年代初):DARPA在2000年代初舉辦自動駕駛挑戰賽,將自動駕駛概念首次轉為現實,推動技術萌芽。 初步發展(2009-2016):谷歌2009年啟動L4級別自動駕駛項目,特斯拉2016年發布自研Autopilot 2.0,自此形成多傳感器和視覺雙技術路線。 技術突破(2021-2022):特斯拉2021年推出BEV+Transformer架構,引發同行車企跟隨。 高速發展(2023-2024):特斯拉2024年發布FSD v12,端到端架構引入Word Model,華為同年推出無圖架構MapTR+Occupancy。 未來展望(2025-至今):理想引入認知模型,小鵬預計2025年年內實現L3上車,特斯拉計劃2027年量產3萬美元級無人網約車Cybercab。
3.自動駕駛技術路線
自動駕駛技術路線-三個技術層級和對應的技術方案和路線
感知端的技術路線:根據感知方案的分類,可分為以激光雷達為主的多傳感器路線和純視覺路線,算法架構從2D NCC到BEV-Transformer 。決策段技術路線:從規則算法到端到端算法,按照技術架構的不同可分為一段式端到端和分段式端到端。執行端技術路線:從傳統執行系統到線控執行系統。

自動駕駛技術路線-感知端方案的分類
感知方案之爭:自動駕駛領域的感知方案分類主要圍繞傳感器配置展開,分別是以激光雷達為主的多傳感器路線和純視覺路線。純視覺路線主要系以算法突破降低硬 件依賴,適合大規模普惠型智駕系統,比如:L3級更多應用于乘用車企業賣車模式,對成本較為敏感。多傳感器融合方案以硬件冗余保障安全,適合高階自動駕駛 (L4+)或復雜場景,比如Robotaxi,無人物流這些出了問題會追責運營方的應用,對安全性要求較高。
自動駕駛技術路線-技術架構的兩大流派
技術架構的選擇:國內車企的端到端技術路線分為兩大流派,分別是一段式端到端和分段式端到端。 “一段式”端到端,特點是感知、決策、規劃全流程整合為單一神經網絡,數據驅動效率高,但需要海量數據和高算力支撐。優勢是能應對未 定義障礙物,例如突然滾落的輪胎或異形物體,系統可自主生成避讓策略。缺點是黑箱問題突出,調試難度大;算力成本高,例如特斯拉FSD V12訓練成本達10億美元。 “兩段式”端到端,特點是感知與規控分階段處理,模塊化設計便于優化和驗證。優勢是降低開發復雜度,適合數據積累不足的車企快速上車。 例如小鵬XNGP通過XNet(感知)、XPlanner(規控)、XBrain(認知)三模塊協同,實現擬人化駕駛。部分車企(如蔚來)計劃逐步從兩 段式過渡到一段式,通過云端算力提升模型整合能力。
自動駕駛技術路線-感知端的算法架構的重大變革
第一次變革:從2D CNN到BEV+Transformer。特斯拉在2021年首次將BEV+Transformer架構引入自動駕駛領域。BEV (Bird Eys View 鳥瞰圖)指的是將攝像頭采集的2D圖像轉換為3D鳥瞰圖視角,這樣可以讓 自動駕駛系統更好地理解道路場景。 Transformer是一種強大的神經網絡架構,用于處理序列數據(比如時間序列的圖像數據),可以幫助系統更好地理解場景中的動 態變化。BEV+Transforme就是將BEV視角和Transformer架構結合起來,優勢在于可同時融合多個傳感器信息,時序信息(讓模型有“記憶”),且可以構建一個實 時建圖能力,減少對高精地圖的依賴。
2022年,特斯拉又提出OCC算法 (Occupancy Network, 占用網絡),將算法架構升級為BEV+Transformer+OCC架構。BEV的視角只能獲取未知土體的占用方塊面積, OCC 引入了高度的信息,可以在矢量空間中產生統一的體積占用數據,可以用來預測通用障礙物的位置。該架構的優點是可以規避一些未知的物體(不需要“認識” 即可“識別”),大幅提升了算法對障礙物體的感知能力,減少corner case。此外,OCC也是一個強泛化能力的算法,也可以用在人形機器人上。
第二次變革:從規則算法到端到端算法。2023年8月,馬斯克在直播中首次提到了端到端算法(End-to-End),即把輸入(傳感器數據)直接到輸出(車輛控制信號)的映射,通過神經網絡來處理感知,決策, 控制任務,減少對人工規則代碼的依賴。最開始特斯拉只是將決策層的規則代碼都替換成神經網絡,直到2023年12月,特斯拉發布的FSD v12, 取消了大約30萬行傳統的 C++規則代碼,完全依賴神經網絡進行決策,實現了感知和決策層的端到端。端到端的優勢在于減少了每個層級之間信息的損耗,減少人工成本和算力,還能提升算法自 主學習能力。但端到端也有存在一些缺點,比如可解釋力差(出了問題較難判斷是哪個層級出現問題),且落地難度大(需要海量真實數據訓練)。 端到端算法逐漸形成兩大落地形式:分別是顯示端到端和隱示端到端。1)顯式端到端將原有的算法模塊以神經網絡進行替代并拼接成端到端算法,是早期量產玩家最青 睞的方向,代表的企業有華為、小鵬的分段式端到端。2)隱式即為采用單一神經網絡,全流程采用一個多模態基礎模型完成的一段式端到端,代表企業為特斯 拉、Momenta、商湯科技。
4.自動駕駛商業模式
自動駕駛的商業模式-L3和L4的發展現狀
現狀:真L3/L4的里程碑:L3=允許駕駛員脫手脫眼,L4=無監控員的無人化運營。截至2025年6月,當前所處階段而言,全球高階自動駕駛行業 處于L2+級別規模化落地( 真L3未落地)和L4級別限定場景落地(開放道路受限)并行的階段,L5級別受限于法規和技術,還處在發展早期。
自動駕駛的商業模式-L4四大場景總概況
四大場景的核心需求系:海內外共同應對勞動力短缺(老齡化,少子化)和安全事故頻繁問題。 四大場景中,Robotaxi因技術門檻高、替代剛需市場(出行)空間最大,是最值得關注的市場;其次是市場空間大,但技術壁壘低,需要關注成本能力的Robovan市 場。市場空間,技術,盈利情況排序如下: 1) 市場空間排序:截至2030年,全球來看Robotaxi > Robovan > Robotruck > Robobus 2)技術壁壘排序:Robotaxi(城市復雜路況)>Robotruck(開放場景碎片化)>Robovan (成本敏感度高)>Robobus 3)預計實現盈利順序: Robotruck (封閉場景) > Robovan > Robotaxi > Robobus
自動駕駛的商業模式-L4四大場景技術壁壘
技術壁壘對比:Robobus和Robovan因場景簡單,正向低線數激光雷達+純視覺方案過渡;而Robotaxi和Robotruck因安全要求,激光雷達 仍是剛需。激光雷達是否強制,算法和算力的要求也體現了四個場景技術壁壘的差異。