21世紀經濟報道記者 易思琳 報道

2025年,智能駕駛行業出現“名詞過載”現象,從VLA、VA、到WA,分化出多個派別,爭鳴不斷。
理想汽車智駕團隊從端到端+世界模型全面切向VLA(Vision Language Action),在算法架構中引入大語言模型(LLM)。和理想一樣堅定選擇VLA的還有智駕供應商元戎啟行。
行業里也有堅定的VLA反對派。華為表示,不會走向VLA,而是會堅定選擇WA(World Action,世界模型)。和華為一樣嘗試去掉Language環節的還有小鵬。
而在這場爭鳴中,端到端仍展現出巨大的潛力,小米汽車就是在這一方向持續深耕的企業。
“現在競爭太激烈,大家會產生一些焦慮,傾向于通過各種方式或技術讓用戶覺得更先進。”小米汽車端到端負責人陳光告訴《21汽車·一見Auto》,“但無論VA、WA還是VLA,在我看來其實都一樣,都是看如何讓模型的智能密度最大。”
現有頭部新勢力中,小米汽車啟動端到端研發較晚。2024年,小米在內部正式整合成立“端到端算法與功能部”,負責量產方案開發。而理想、蔚來都比小米早了至少3個月。
但小米追趕很快。今年2月,小米正式向用戶全量推送了300萬Clips的端到端(HAD),7月再次推送了1000萬Clips版本的端到端。11月21日,小米汽車在廣州車展正式發布Xiaomi HAD增強版。
陳光介紹,新版本相較前兩個版本,最大的不同是引入世界模型+強化學習。“在HAD增強版中,模型不但要知道去模擬老司機開車,而且知道為什么這樣做。從認知層面上,這個模型具備開放世界的知識性,以及推斷復雜場景因果的能力。”
但在端到端算法中引入世界模型和強化學習,小米并不是第一個。陳光認為,小米會把世界模型+強化學習做得“更堅決”。
他補充,強化學習作為一種出現多年的技術,在智能駕駛里用好它會面臨兩個難題:一是世界模型很難做到完全保真,這就需要在世界模型里放入大量、可編輯的數字資產; 二是并行探索的效率會面臨很大挑戰,因為算力需要合理分配。
“在一個模擬環境里,你會希望模型能少探索簡單的場景,以節省算力;在復雜場景下,你又希望它多探索,以探尋最優路徑。”
堅定選擇端到端,并不意味著小米就放棄了其他路線的預研。當前小米的智能駕駛團隊主要分成了三撥團隊:

《21汽車·一見Auto》獨家獲悉,除開端到端、VLA,市面上的所有路線,包含WA、VA,在小米內部都有預研。除開VLA由陳龍負責外,剩下做路線預研的團隊都由陳光管理。
陳光是小米端到端研發大部門的第一位負責人,此前該部門都由小米汽車智能駕駛業務負責人葉航軍直管。
在加入小米前,陳光在一汽研究院待了四年,2024年初成為一汽研究院的總架構師,帶領著近600人的團隊。
陳光稱,面對技術路徑的選擇上,小米從來不是“一刀切”。他認為,新技術的引入需要循序漸進,技術是否先進,并不代表體驗一定更好,最終能否被用戶感知、信任和長期使用,才是判斷標準。
“從技術上來說,有時候你不一定能找到最強的技術,但你一定能找到最適合你的技術。大家講一大堆新的名詞,最終還是會落到用戶體驗上。用戶體驗不好,大家不會覺得是技術的問題,只會覺得是你出了問題。”
相較其他新勢力,小米智駕團隊有自己的獨特性。一方面,它雖然不是成立最早的智駕團隊,卻是組建最快、追趕最猛的團隊。
2021年3月30日晚,小米官宣造車,當天晚上,小米集團董事長雷軍欽點時任小米技術委員會主席葉航軍博士總領智能駕駛團隊。成立第一年,小米組建了500人團隊——那時,理想組建700人智駕團隊已花費兩年,小鵬花費3年。
4年間,小米智能駕駛團隊已經超1800名成員,2024年3月SU7上市以來,小米從高精度地圖進化到無圖,近一年間又推送了三個版本的端到端,實現了在智駕技術方案上“一年追三代”。而此前其他新勢力在智能駕駛路線上的摸索都至少經歷了三年的時間。
“基建做得好,找新方向時不用投入太多人。”陳光告訴《21汽車·一見Auto》,“而本身科技企業的屬性,使得小米天然就有一些優勢。”截至三季度,小米2025年已經投入了235億元研發費用,其中1/4的資金用于AI研發。
“云端的基建能力是可以相互借鑒的,而且經驗可復制。就好比做飯,已經有人告訴你每一步應該怎么干,做起來就會很快。”陳光說。

另一面,當下社會對輔助駕駛的討論常伴批判與譴責,作為后來者的小米輔助駕駛團隊,更遭遇了國內同行未曾經歷的輿論危機。
陳光認為,這是備受外界關注的公司不可避免需要經歷的課題,“不能只享受聚光燈下的掌聲,而不承受臺后各種困難帶來的千錘百煉。得扛住壓力繼續向前。”
質疑與壓力之下,小米從沒有想過“跳代”。葉航軍此前在采訪中表示,小米智駕一直都是沿著“規則驅動——數據驅動——認知驅動”的行業發展階段一步一腳印去做拓展,“從有圖到無圖,端到端、世界模型、VLA等主流技術棧,小米都有參與,且有不少論文產出。”
而眼下,擺在陳光面前最重要的任務是在年內完成Xiaomi HAD增強版的量產。
今年11月,時值Xiaomi HAD增強版發布前夕,《21汽車·一見Auto》和小米汽車端到端負責人陳光做了一次專訪,我們談了談技術分野、行業未來的發展趨勢、小米的基建能力、仿真能力。
以下是采訪實錄,內容經摘編:
“我們不想再制造技術焦慮了”
《21汽車·一見Auto》:小米HAD增強版和去掉“L”的VLA路線有何區別?
陳光:無論是VA、WA還是VLA,在我看來其實都一樣,最后就是看你怎么使模型的智能密度最大。因為算力是有限的,在相同算力下如何讓可承載的信息量對不同場景的理解能力更強,這是各家努力的方向。
無論是世界模型加強化學習,還是VLA大模型,說明大家發現了靠單純的數據驅動解決不了所有問題,大家需要走向認知驅動的階段。而數據驅動,你無法覆蓋所有長尾場景,你也很難去平衡不同場景下的數據分布以及優化方式。
雖然我們這個版本叫增強版,但實際上已經走進認知驅動階段了。這次的新版本,我們希望給用戶扎實的體驗。
《21汽車·一見Auto》:怎么區分認知驅動、數據驅動?
陳光:一個簡單的端到端,只是模仿學習,它一定只是數據驅動。但一旦走到強化學習、世界模型、VLA階段,一定是認知驅動。因為他不是簡單模仿,而是知道為什么這么做以及應該怎么做,讓他們自主去探索可能性,學會推理因果邏輯,這個能力是世界模型、強化學習或者VLA獨有的。
可能不需要糾結于用哪個技術比哪個技術更好,或者哪個技術是誰的升級。大家還是圍繞著一個目標、用一些認知驅動的技術方案去探索。
《21汽車·一見Auto》:但我們也看到小米內部另一個團隊在預研VLA,你們這兩個團隊是怎么配合的?
陳光:“端到端+強化學習+世界模型”這一整套系統,更多還是解決直覺的問題。我們認為針對更多中等難度或者非極端困難場景,本能的反應是更快的。人遇到突然沖出來的行人,下意識肯定是先踩剎車。而不會是我要想個幾秒,看看我是不是旁邊借道。
《21汽車·一見Auto》:端到端+世界模型是不是對現階段行業來說智能駕駛路線的最好解法?
陳光:是一個很好的解法,但我不能說最好,因為我們也在探索有沒有更好的思路。從技術上來說,有時候你不一定能找到最強的技術,但你一定能找到最適合你的系統方案。其實各家解的問題不一樣,比方說我們可能遇到一些問題,我們覺得用端到端來解更好;另外一些車企可能覺得VLA或者一些不一樣的技術去解更好。
這都是大家的選擇。大家講一大堆新的名詞,最終還是會落到用戶體驗上。用戶體驗不好,大家不會覺得是技術出了問題,只會覺得是你出了問題。
《21汽車·一見Auto》:既然多種方案有互補性,為什么行業里其他友商會執著地只選擇一種路線?
陳光:行業競爭比較激烈,大家有時候會陷入技術焦慮上,希望找到一種方式把問題全解決。
友商只是探索一種新的開發方式。他們當前遇到一些問題,需要用新的方式去更好地解決。小米HAD增強版也是一樣的。
無論是小米還是友商,大家其實心里都比較清晰,技術先進性未必能帶來產品體驗上的絕對進步。畢竟智駕是一個系統工程,你需要仔細考慮它的收益和潛在問題,在這中間取得一個平衡,最終落地的還是產品的體驗感。
如果不能給用戶帶來更好產品體驗,這個技術短期可能不具備成熟量產的必要性。
把所有問題都依賴于一套新方案來解決,有一定風險
《21汽車·一見Auto》:小米整個智駕團隊多少人?
陳光:超過1800人。
《21汽車·一見Auto》:目前市場主流的VLA、VA、WA在內的主流技術方案你們都有在看,如何分配研發資源?
陳光:主流方案都在看。除了VLA,其他方案都是我這個團隊在做,WA和VA都是我們在做。我們的WA,這版增強版可能更強調在仿真器/模擬器里面使用。其它方向的應用,內部會有一個小的精英團隊在做方案的探索。
這么大一個團隊,里面優秀的人挺多。但對于一個新的方向,不需要有大量的人一下子全投入。因為數據驅動和基建是一致的,你只需要有少量人在這方面做一些快速的探索,人多了不一定解決事。
《21汽車·一見Auto》:端到端方案能保證能力下限,但它的一個缺點是沒有辦法保證能力上限,所以需要世界模型。之前跟智駕供應商的人聊天,從去年年底今年年初,智駕供應商就堅決不做VLA。因為他們覺得在很多時候只需要用直覺判斷,不需要去通過L(語言)那個環節。
陳光:只有特別復雜的場景下才需要調用思維鏈,否則會很累。就跟看輕喜劇和懸疑片一樣。看輕喜劇,會很輕松;但看懸疑片,需要動腦子。這就需要你得有一個比較大的算力,或者有一個比較強勁的硬件去提升。
還是跟馬斯克說的一樣,怎么在有限的硬件條件下,能訓練出來一個智能密度最大的模型,大家不要過分卷一些算力。
《21汽車·一見Auto》:為什么友商還是會選擇走大模型、大算力的路線?
陳光:只要成本能cover住就行。如果成本cover不住,就需要在有限算力下做更多事。
你看各家都在講不同算力,但是最終對于用戶來說,用戶不關心你有多大的算力,最終就是你體驗能否更好。華為什么時候講過華為的算力?即使特斯拉的算力非常大,特斯拉也從來不講自己到底有多少算力。
只要我的體驗足夠好,我給用戶帶來足夠愉悅的產品使用體驗,就沒有必要向外宣傳自己的算力到底多大。
《21汽車·一見Auto》:端到端的下一步,會是VLA嗎?還是說技術路線也不一定?
陳光:雙方能打配合。端到端加世界模型加強化學習,主要解決直覺問題。VLA要解決的就是長序思考的問題。
但我們會不會一步就走到了VLA?我覺得一方面得看VLA技術迭代的速度和最終效果,如果VLA在各種場景下都比端到端好,那我們全面切向新方案。
《21汽車·一見Auto》:現在有一些友商在做VLA之后,會把所有資源都投入到新的技術方案上,原來的端到端就不做了。這會是一種很好的解法嗎?
陳光:把所有問題都依賴于新方案來解決,有一定風險。不過,做任何技術判斷都有風險。主要看各家的技術判斷。他們覺得VLA是未來,全面切沒問題。
基建做得好,找新方向時不用投入太多人
《21汽車·一見Auto》:小米不是第一個做端到端的車企,相比于友商,小米HAD增強版的優勢在哪里?
陳光:獎懲制度上做得比較好,算法會在世界模型里反復練習,走錯了就扣分,對了就加分,在獎勵機制下不斷嘗試,找到更優的開車思路。我來之后,對這版本主要做了一些配合數據驅動的基建或者流程的優化,現在這套方案的數據驅動更加順暢、效率更高了。
《21汽車·一見Auto》:底層的技術方案沒有做優化嗎?
陳光:如果整個研發架構是高效的,技術方案就不用大改。理想去年端到端做得很好,也是因為底層基建做得比較高效。
今天有人說VLA,有人說世界模型,對于底層的數據驅動來說是一致的。只要你的基建夠強大,我可以快速嘗試不同方案,看哪個方案對你當前遇到的困難有幫助。
《21汽車·一見Auto》:這里的基建怎么理解?
陳光:基建指的是以數據為核心的研發效能的提升。
《21汽車·一見Auto》:怎么判斷一個基建好還是不好、效率高還是不高?
陳光:比方說我發現一個問題,我能多快地把類似問題從已有數據挖掘出來,并且形成標注過的高質量數據,以及整個模型訓練夠不夠快,評測夠不夠自動化,都是判斷基建好壞的維度。只要自動化率做上來,效率也可以很高。
《21汽車·一見Auto》:基建,很像之前智能駕駛團隊里數據閉環團隊做的事情。
陳光:可以這么理解。這一定是各家的knowhow(技術訣竅)。特斯拉什么時候吹過自己是端到端,什么時候吹過自己是VLA,他每次跟你講都是說我當前遇到什么問題,做了什么樣的方案,這個迭代效率有多快,這才是符合正常研發的邏輯——遇到問題,當前的哪一段需要調整,調整之后進行測試實驗,看好不好,不好再調,好了就用。一定是這種快速迭代、小步快跑的思路。
《21汽車·一見Auto》:但小米2024年才發布了第一款車,智駕到今天也只是進展了一年,一年干了別人三年的活,小米是怎么在短時間之內把這個基建能力建設起來的?
陳光:本身科技企業的屬性使得小米天然就有一些優勢。
《21汽車·一見Auto》:小米其他業務也可以賦能到這邊?
陳光:云端的基建能力是可以相互借鑒的。小米的其他業務底層基建打得很扎實,汽車業務能夠對其他業務進行快速復用。
就好比做飯。如果現在廚房里,已經有人告訴你,洗好的菜在哪、案板在哪、鍋在哪、油鹽醬醋在哪,每一步應該怎么干,你難道還需要從頭學一遍嗎?
基建的經驗是可復刻的。不然大家做云,沒有意義。做云的意義就在于,能共用的東西盡量共用。現在智駕的整個開發其實跟大模型的開發越來越類似了。整個開發效率快,基建能力能不能吞吐掉這么多的數據,這個能力其實是共用的。
《21汽車·一見Auto》:除了基建能力強大,還有沒有其他的優勢讓小米在一年之內快速追趕友商?
陳光:小米汽車測試資源、數據資源非常充沛。對我們來說,很容易拿到高質量的場景數據。
有基建的能力,自己對專屬的素材跟測試的重視,才造就了現在小米的“快”。
“不能只享受聚光燈下的掌聲,而不承受困難帶來的千錘百煉”
《21汽車·一見Auto》:小米經常處于輿論風暴的中心,這些輿論有影響你的決策嗎?
陳光:沒有。任何個人團隊或者企業,你不可能只享受臺前聚光燈下的掌聲,而避免承受臺后各種困難帶來的千錘百煉。
《21汽車·一見Auto》:面對外界對于小米輔助駕駛的質疑,團隊當時的心態是什么?
陳光:團隊會有一些緊張和擔心,也會很有壓力。我作為負責人,還是希望大家能用長線思維去思考這個問題。比如,針對這個問題有沒有可以快速的新解決方式?新方案引入的代價、收益分別是什么?如果它的代價大于它的收益,那我們就不要著急在短期立刻按照新的方案進行調整。試試看看有沒有更好的方案可以平衡最后的收益,同時降低風險。
《21汽車·一見Auto》:你加入小米之后,做的第一件事是什么?
陳光:當時可能主要是先找到當前技術方案的性能短板,分析背后的技術路線是否合理,同時要看是否有可以調整的機會。
《21汽車·一見Auto》:之前端到端的整個團隊都是葉航軍博士自己在帶,你是第一個接替他管理端到端的人,也是小米智能駕駛成立以來第二個端到端大業務部門的負責人。作為空降高管,你在管理上有什么方法論嗎?比如每個月會定一個目標去達成?
陳光:我個人偏共創共識型。如果有一個比較好的方案或者研發范式,我會先和核心骨干、核心主管反復溝通,把共創共識做得扎實一些。希望核心方向、這個組聚焦的方向要保持一致。
對于這種大的技術方案,我們強調初期要抓大放小,不要把所有的困難揉在一起,想靠一條路給他走通。這個可能不一定合適,但是你的主線任務一旦確定,主線方案一旦聚焦,這是最核心的點。
《21汽車·一見Auto》:共創共識,當發生分歧的時候,誰來當裁判官?
陳光:共創共識最開始肯定是各個部門的主管,他們要先商量,遇到不行的地方,也需要更大老板來做出決定。
《21汽車·一見Auto》:我們這次的Xiaomi HAD增強版本在推出的過程中,在共創共識上是否遇到過比較大的分歧?有沒有記印象特別深刻的那一兩個場景?
陳光:會有一些討論,但非常激烈的場景沒有。小米這邊都挺nice的,整個公司文化就是peace and love。
但我們有時候會拒絕一些新的需求。比方我們覺得某個需求,業務的時間確實有點趕不上。產品同事的第一反應可能是,是不是你不想干。但你只要跟他講清楚,為什么當前我做不了這件事,拿一些指標性的數據去做證明。產品同事也不會只聽我們,他們也會挑戰我們,比如他們會說,其他家做到了,為什么小米不可以?
被挑戰,在小米很正常,只有這樣,才能螺旋上升。
《21汽車·一見Auto》:你們一般開共創會的頻次是怎么樣的?
陳光:看需求、看事情的緊急程度。七月交完了新版本之后,我們共創頻次相對高一些。因為要迅速地找到當前方案存在的問題,并開始布局下一個方案。
《21汽車·一見Auto》:友商會為了超車也會進行一些封閉式訓練,你們是這個打法嗎?
陳光:封閉式訓練,是傳統科技企業或者互聯網企業強調的war room文化。我們歷史上應該經歷過,但不多。一般在一些特別急的產品方案交付過程中,需要把隸屬于不同小團隊或者小部門的核心骨干聚在一起,讓大家交流更加快速。
仿真在訓練的時候,看起來占比不多,但價值比較高
《21汽車·一見Auto》:把強化學習應用在智駕系統上,小米不是第一個。和友商相比,小米的獨特性在哪里?
陳光:強化學習不是新的技術,它是非常經典的機器學習理論,大家過去把它應用在了不同的方向上。在世界模型的模擬器、強化學習的使用上,我們比一般友商要堅決。
如果要用強化學習對已經訓練好的系統做一些后訓練,需要比較好的模擬系統能看到這些原始的信息。這就需要我們使用世界模型去構建高保真的虛擬環境,讓智能體或者智駕系統在世界模型構建的虛擬環境去自由探索,我們同時還得保證這個虛擬環境和真實道路上的探索沒有差別。
《21汽車·一見Auto》:為什么要做這件事?
陳光:開發者希望強化學習能在相同場景下通過使用不同的獎勵和懲罰措施,來找到該場景下最優的駕駛行為,這就需要場景必須具有一定的可復現性。
但特別危險的場景,很難遇到,而且也很難在這種場景下不停地測試算法的性能、去做數據的增強,這就需要先做一個比較好的仿真環境,讓智能體或者強化學習的算法進行自由探索。
《21汽車·一見Auto》:在智駕里面引入強化學習有哪些難點?
陳光:一是世界模型要做得足夠保真、同時場景容易編輯生成。二是并行探索的效率要高。
《21汽車·一見Auto》:怎么判斷一個好的仿真環境?
陳光:首先,它需要足夠逼真、真實,符合幾何和物理的規律。同時還需要有比較強的場景編輯能力,比如可以改變一些環境要素,包括光照、天氣、路面的濕滑程度、引入交通參與者等。
大家說仿真不好,主要原因是有些企業的生成質量不高。我們這一代仿真數據的生成質量很強。
《21汽車·一見Auto》:怎么保證仿真數據足夠好?
陳光:我們會有一些評價指標,我們根據真實指標,對仿真環境中規模化生成的圖像和對應點云進行評估保證一致性要好。
第二步就是你只能讓它像,但你不能讓它像得完美。
過去游戲引擎做得很真,那種真是把所有的事物都做得很完美的。但對于智駕業務來說,你希望他能模擬道路里面的一些殘缺的真實性。
比如智駕會很害怕相機的臟污,激光雷達在一些水面反射會消失,這個水會吸掉激光一些點,這些東西都希望模擬器能進行仿真。
《21汽車·一見Auto》:原來用仿真更多側重于未出現場景的模擬,但現在用仿真,好像更多是對已經發生的真實場景的還原。
陳光:還原只是其中一環。自動化生成新場景,使得它變得更加的廣泛。比方說同樣都是一個雨天,你可能希望這個場景里可以插入一些交通事故,同時也會希望插入到不同濕滑程度地面對傳感器的影響。
《21汽車·一見Auto》:在我們這次推出的Xiaomi HAD增強版里,仿真數據占據了多少比例?
陳光:對比真實數據,占比較高。
針對我們所有的實車測試里程,我們希望在仿真里面至少是100倍的。這樣才符合整個測試三支柱里對模擬開發的要求。
《21汽車·一見Auto》:測試三支柱怎么理解?
陳光:仿真測試、場地測試和實車測試。從一個完美的測試理論來說,仿真測試能幫你做一個快速驗證,這是最核心的。
第二個是場地測試。這步主要是把整個車的能力給調動起來,在一個場地里模擬一些極端場景,去看系統整體的反應。
最后才是上實車。按照這個理論,我們的仿真數據是嚴格按照百倍以上比例去做的。
《21汽車·一見Auto》:訓練的話,仿真數據和真實數據會怎么分配比例?
陳光:二八分,真實數據占80%,仿真數據做到20%的比例就已經頂天了。
因為你肯定是使用更多真實場景的數據,仿真只能解決你真實場景下很難遇到的問題,實車都能遇到的數據,為什么還需要仿真呢?
訓練的時候,如果90%的數據都是仿真,那就說明實車測試數據不夠。你的數據是不是有問題?因為絕大部分場景還是普通場景,這些數據是真的沒有辦法采集到嗎?
《21汽車·一見Auto》:20%的仿真數據,能夠減少多少人力成本?
陳光:如果沒有20%的仿真,人力成本至少得翻個幾倍。
仿真要解決的是你實車不好遇到的問題,所以你要去采那種不好遇到的場景,非常困難。
舉個簡單例子,高速路上遇到運輸幾十米的大風葉,這種場景直接在路上采,很難遇到,一個月能采集到一個場景,就不錯了。但這個場景,在仿真器里面就很好做,這部分人力成本就能省下來不少。
仿真在訓練的時候,看起來占比不多,但價值比較高。它主要是解決了你實車不好遇到、不好收集和挖掘的數據。仿真還是非常重要的。
《21汽車·一見Auto》:在你加入之前,小米有做仿真嗎?
陳光:在做一些,但是最開始業務沒有那么聚焦,我來之后就幫大家一起梳理了一下。
《21汽車·一見Auto》:在你剛加入小米的時候,仿真是你在分析完當前系統之后決定大力投入的事情嗎?
陳光:是的,我覺得需要投入。但是當時遇到的問題,仿真可能沒辦法解決,問題出在整個系統方案上,得需要做重新梳理。
做VLA要自研芯片嗎?看需求
《21汽車·一見Auto》:自己做VLA的話,有必要自己去研發自動駕駛芯片嗎?
陳光:看需求,看是不是劃算。做芯片的好處就是首先做出來,做好之后,它的成本會相對可控一些。因為你要自己用,BOM成本還會低。第二個,軟硬件的配合上可能會好一點。
壞處是你前期投入很大,芯片這個東西回本比較辛苦。所以說主要看需求,不同的企業需求不一樣。
《21汽車·一見Auto》:如果自研的第一代智能駕駛芯片上車,一般來說會遇到哪些問題?
陳光:從一顆芯片遷移到另一顆芯片時,往往會面臨“部署偏差”的問題。一方面,不同芯片在算子支持和優化方式上存在差異,部分模型結構需要相應調整;另一方面,由于計算精度和實現機制不同,同一模型在不同芯片上運行時,其數值分布和輸出結果也可能出現不一致。因此,在模型上車前,需要基于目標芯片的實際特性進行針對性的優化和校準,確保模型在不同芯片平臺上的表現一致、穩定。
《21汽車·一見Auto》:優化的工作量大嗎?需要提前多長時間做?
陳光:需要6~10個月,甚至更久的時間。假設我在A芯片跑得很好,有個B芯片我需要切過來,原封不動切換芯片,可能也需要六個月。
英偉達的芯片從Orin遷移到Thor,很多企業也花了不少的時間。何況英偉達都是同一套供應鏈、同一套底層GPU。更別說你從A芯片遷移到B芯片。假如今天用高通,明天用TI,這個遷移成本是存在的。
這也是芯片企業的護城河。如果遷移成本很低,客戶的選擇空間自然會更大。
《21汽車·一見Auto》:那小米從Orin遷移到Thor上,花了多少時間?
陳光:我們比一般企業要快很多,因為它是一家企業的兩款芯片。
《21汽車·一見Auto》:為什么小米可以做到比別人快?
陳光:投入就行了。
《21汽車·一見Auto》:小米什么時候開始遷移的?
陳光:3月,我剛來小米的時候,遷移就已經基本完成了。
L4一定會做成,車企也會慢慢涉足到L4
《21汽車·一見Auto》:你加入小米輔助駕駛之前,在百度阿波羅、一汽南京研究院都待過,履歷更多集中在L4。從Robotaxi轉到乘用車輔助駕駛,有哪些可以復用的經驗?
陳光:我加入小米之前,有很長一段時間做Robotaxi。但在上一家企業,也做了不少輔助駕駛相關工作。
從我的視角來看,無論L2還是L4,現在的技術棧都越來越走向統一了。之前在規則驅動的開發范式下,針對不同的感知、預測、決策、規控等不同模塊,大家有不同的技術棧。但數據驅動、認知驅動下,兩者的開發邏輯越來越相同了,只是場景化上有差異。
L2更多強調任意場景下點到點的通行,L4強調特定區域下的點到點通行。L2需要平衡安全、效率、舒適性,L4對安全系數更高,需要做更多的安全冗余,做到絕對安全。
《21汽車·一見Auto》:L2、L4哪個對你的挑戰會更大一些?
陳光:目前還是L2挑戰更大。因為它受限于車上有限的算力、有限的傳感器,以及需要不停地平衡用戶的駕乘習慣跟駕乘體驗,這就要求我們在做系統設計時候,更加仔細、優化更徹底。
《21汽車·一見Auto》:最近路權放開了,很多Robotaxi的公司都開始上市了。比如小馬智行,文遠知行。你怎么看待Robotaxi這波回春潮?
陳光:這是一個很好的現象。2016年,以百度阿波羅為代表,很多企業都在發力Robotaxi,大家進行了大量方案的設計探索。2020年開始,L4公司發現當時的技術方案已經解決不了遺留下的超長尾的問題,行業就進入了一段時間的低谷。
2022年底,以GPT為代表的大模型方案,讓整個人工智能發現,機器可以掌握比人類更全的知識。面對一些新的問題,機器同樣具備一定推理思考、長時間探索的能力。
現在的自動駕駛和輔助駕駛的這種核心技術理念已經越來越一致了。唯一的不一致是安全,L4最后兜底的事情需要由系統來解決。那就要求在整個系統方案設計時候要充分考慮各種各樣的冗余,安全冗余、軟件冗余、硬件冗余,以及最危險場景下的風險控制。這是當前L4在著重解決的事情。
L2作為輔助駕駛,它主要是輔助,可能人類駕駛員作為最終對這個系統要進行監督和把控的責任方,他需要不停去平衡機器和駕駛員之間的一些喜好。考慮的事情跟L4考慮的事情有些出入,這可能是唯一的區別。
L4一定是會做成的,從車企的角度來說,也慢慢會涉足到L4。

