
21世紀經濟報道記者 易思琳
今年前三個季度,國內20萬元以上乘用車市場份額占比30%,13萬元以下市場份額則高達50%,但后者多數車型尚未配備城區輔助駕駛功能。這一廣闊的藍海市場,正吸引著地平線、Momenta等智駕廠商加速布局,全力搶占市場先機。
今年4月,地平線正式推出基于征程6系列芯片的城區輔助駕駛解決方案——HSD(Horizon SuperDrive)。盡管并非該賽道的先行者,但地平線已快速邁入大規模量產階段。11月,隨著星途ET5正式上市,地平線的HSD解決方案同步實現量產;另一款搭載該方案的車型深藍L06也于同期發售。兩款車型上市短短兩周后,地平線HSD的激活量便突破12000輛,量產落地成效顯著。
除了推出全新的解決方案,地平線還通過生態拓展加速市場滲透。12月初的地平線技術生態大會上,公司公布了兩大生態推進舉措:一是拓展生態合作模式,新增算法服務模式“HSD Together”,并已與日本電裝、大眾的合資公司CARIZON(酷睿程)、HCT(智駕大陸)達成合作;二是引入更多生態合作伙伴,元戎啟行、卓馭等企業已加入其生態體系。
缺乏芯片研發能力的算法公司、軟硬研發實力薄弱的車企,正紛紛向地平線聚攏。地平線接下來的目標,是讓城區輔助駕駛功能下沉至10萬元國民車型,實現技術普惠,并計劃在未來3-5年內達成千萬級量產規模。
地平線敢于定下這一目標,底氣源于其在智駕端到端方案上的長期堅守與深耕。據地平線工程師透露,公司自2024年底便集中力量主攻端到端技術,90%的研發人力均投入到該方案的研發與量產落地工作中。
圍繞智駕技術路線分野、端到端的發展前景等核心話題,21世紀經濟報道記者與地平線副總裁呂鵬進行了一次對話,以下是對話實錄(經摘編):
WA/VLA皆需端到端支撐
《21汽車·一見Auto》:地平線是目前行業內少數堅定選擇端到端路線的廠商。現在市面上的智駕方案非常多,有很多公司已經開始選擇做VLA,也有一些公司像地平線一樣深耕端到端。在外界環境不斷變化的背景下,地平線為何堅信自己能把端到端做好?
呂鵬:核心底氣來自地平線過去豐富的技術積累。最早的端到端其實是地平線的uni AD,當時獲得CVPR的最佳論文,那是我們最早基于Transformer提出的端到端架構。現在不管是VLA還是World Model,本質上來說是沒有沖突的,因為所有的東西都建立在要有一個非常完整的端到端底座。本身的技術架構都是端到端,在這里面,你是否要引入新的模態?我們的判斷是:如果端到端做得不夠堅固,性能沒有做得足夠好,是很難去把更多新東西帶進來解決這些問題的。
端到端,其實相當于是人的一個直覺模型。如果你的直覺模型不夠完善,光靠思考推理去解決一些場景是很難的,而且這些思考推理反倒會帶來一些新的問題。
我們的堅定,源于對技術邏輯的清晰認知,既要把每一步的技術做扎實,又要充分了解下一代技術的優勢與短板,要在解決問題的同時把優勢發揮到最大。而這一切的核心,在于軟硬結合,用更好的硬件去支撐大算力,同時通過軟硬協同的優化去釋放出來更多的性能,真正在體驗端為消費者帶來收益,而不光是在一些名詞上獲得收益。
《21汽車·一見Auto》:地平線HSD的端到端版本,最核心的技術亮點是什么?這一技術方案的基座又是什么?
呂鵬:端到端往簡單了說,是很好描述的,就是光子進,軌跡再輸出。目前,地平線是除特斯拉之外,少數擁有真正意義上最完整的一段式端到端系統的企業。過去很多系統,雖然營銷的詞會講端到端,但有很多都是兩段式的端到端。
《21汽車·一見Auto》:什么是兩段式端到端?
呂鵬:所謂兩段式的端到端,并不是一個模型,而是一個感知的模型加上一個規控的模型。在規控的模型里,你會發現信息的傳遞是丟失的,因為這個模型的訓練是靠感知白名單的檢測結果去進行訓練的。而真正的端到端,它其實有很多高維的feature是在模型里面進行無損的傳遞,信息量要更高,就像人開車一樣,你可能不知道那個路口具體有多少人會離你多遠,但你能憑借感覺很好地開過去,這種感覺就是一段式端到端才能提供的。
《21汽車·一見Auto》:為什么會有兩段式的端到端存在?
呂鵬:一段式的端到端做得不夠完善的話,它的輸出軌跡有特別多的缺陷,這會導致模型沒辦法控車,怎么辦呢?大家就退而求其次地去解模型,加上了一堆后處理,對橫向、縱向的軌跡做修正。當你不斷通過規則去做修正的時候,這些規則就會限制模型的上限,端到端模型的優勢又發揮不出來,會有很強烈的橫縱向割裂感。比如開車的時候,車可能突然橫向打一把再加速,正常人不會這么開。
《21汽車·一見Auto》:如何分辨一段式和兩段式端到端?
呂鵬:消費者不太需要關注這些名詞。對于消費者角度來說,最直觀的就是開車時他是否真的愿意在城市里去使用這個系統,有沒有足夠的安心?對于從業者來說,分辨起來其實沒有那么復雜,主要看模型輸出軌跡的連貫性和擬人性好不好,特別是交互情況下模型的整個動作是按照場景step by step的,還是行云流水的。這是一段式端到端中很重要的判斷點。只有行云流水的時候,里面才沒有太多的規則、行動比較一致,不會有場景的割裂感。
《21汽車·一見Auto》:此前體驗地平線HSD的時候,有產品經理分享了一個非常小的tips——變道的時候,旁邊有一個框出現的就是兩段式,沒有框的是一段式,能這樣簡單理解嗎?
呂鵬:這種說法不算是特別(嚴謹)。這只是HMI上的顯示問題,廠家不做顯示,也能達到一樣的結果。核心還是看是否連貫,以及能否控制車速。正常來說,你在一段式的端到端里面是沒有辦法設定到規定車速的,因為對于模型來說,你只能告訴他期望的車速是多少,它會朝著期望的車速去逼近,但未必會一定到那個車速。
《21汽車·一見Auto》:智駕的技術路線,不同的車企和供應商都給了不同的方案。理想、元戎啟行選擇了VLA,華為和小鵬選擇去掉了“L(language)”的WA、VA模型,地平線怎么看不同的智駕路線之爭?
呂鵬:不管是WA還是VLA都是基于端到端做的。沒有端到端的基座,很難把一些新的模態做引入,也就沒辦法更好地提升產品性能。這才是基座的意義。其他東西都只是輔助性,比如language。模型一定不是以language為核心去做開發,而是把language作為輔助項,再結合端到端的基座,這樣才符合我們人類開車的狀態。
人開車的時候,95%以上的時間開得非常輕松的,你不會有太多的思考,只在極度一些復雜的場景下,會加入一些理解、思考和推理,這也就說明了在AI重構智能駕駛的情況下,instinct model(直覺模型)一定要做得足夠好,這樣才能在此基礎上,加入一些語言或者其他輔助性的模型,才能更好的智能。
沒有扎實的端到端,高階智駕就是空中樓閣
《21汽車·一見Auto》:在未來更智能的端到端里,最關鍵的核心技術是什么?
呂鵬:隨著產品性能越來越強,仿真閉環很關鍵。因為稀疏的場景是需要通過仿真去生成一些simulation和validation。隨著端到端的不斷成熟,遇到問題的場景會越來越稀疏。雖然新技術也會有幫助,但萬變不離其宗。如果沒有一個很好的端到端基座,其他都是空中樓閣。
《21汽車·一見Auto》:按照這個邏輯,未來最理想的智駕方案,是否在端到端的基礎上疊加世界模型或者強化學習的模塊?
呂鵬:直覺模型做得足夠強,解決了95%甚至99%的場景,剩下的需要認知推理的場景再加上思維鏈的理解能力,這是比較理想化的狀態。但是一切都要回歸原點,也就是端到端場景下的直覺模型一定要先做得足夠好,再把其他的東西進行提升。
《21汽車·一見Auto》:地平線內部是否有布局VLA或者下一代的智駕方案?作為智駕供應商,接下來的競爭核心應聚焦哪些領域?
呂鵬:核心還是要回歸產品體驗和安全性。現在我們沒有必要太多關注于各種新名詞和新概念,因為本質上都是端到端,最終還是要看智駕方案的體驗夠不夠好,系統夠不夠安全,它有沒有很好的市場認可度,這些才是最關鍵的。技術上,我們肯定會做好預研和儲備。
《21汽車·一見Auto》:此前與一位智駕企業CEO交流時,他認為端到端更像是模仿學習,基于GPT架構的VLA,才是強化學習。但如果給端到端的基座去加一個世界模型,相當于是給純電車加了一個渦輪增壓,他認為沒必要。你如何回應這一觀點?
呂鵬:我覺得核心還是要看最終產品的收益是什么。少部分場景確實需要強化學習來解決,包括language這些維度的信息,最后一定是輔助項。所謂輔助項,不是說去解決復雜的思維鏈,而是幫助去訓練模型。這么多攝像頭的輸入,最終輸出只有一個踏板方向盤。如何把這個模型訓好,這里面有巨大的難度。
《21汽車·一見Auto》:如果地平線下一代智駕方案包含VLA技術,是否會全盤拋棄當前的端到端技術?
呂鵬:當然不會。沒有好的端到端,VLA一定做不好,這是基礎。

