21世紀(jì)經(jīng)濟(jì)報(bào)道記者 鄭植文 上海報(bào)道
千呼萬喚始出來。經(jīng)過近一年的等待,北美時(shí)間9月30日,在特斯拉2022 AI Day上,馬斯克終于揭下Tesla Bot的真實(shí)面紗。
在演示視頻中,這款被命名為Optimus(下稱“擎天柱”)的人形機(jī)器人可以直立行走、給植物澆水、移動(dòng)金屬棒。據(jù)馬斯克透露“擎天柱”已經(jīng)在特斯拉工廠中進(jìn)行內(nèi)部測(cè)試,人們有望在3-5年買到“擎天柱”,而其售價(jià)預(yù)計(jì)不到2萬美元,“可能比汽車還便宜”。
這場(chǎng) AI Day活動(dòng)圍繞人形機(jī)器人、FSD技術(shù)和Dojo超算系統(tǒng)三個(gè)關(guān)鍵詞展開,馬斯克表示,“從本質(zhì)上來說,特斯拉是一家硬核科技公司,我們?cè)谂ψ龊芏嗫茖W(xué)和工程相關(guān)的工作。希望大家對(duì)特斯拉的認(rèn)識(shí),能夠超過電動(dòng)汽車本身”。
“擎天柱”面世
特斯拉人形機(jī)器人對(duì)比圖
去年AI Day上,特斯拉Tesla Bot人形機(jī)器人概念視頻與圖片首次亮相。盡管此次面世的“擎天柱”在觀感上與概念圖還有一定的差距,但特斯拉團(tuán)隊(duì)表示“擎天柱”在運(yùn)動(dòng)中有著非常好的功能,十分敏捷,甚至可以跳舞。這也是因?yàn)椤扒嫣熘睋碛泻脦讉€(gè)自由度,可以提供更高的使用靈活性,比如擁有手指運(yùn)動(dòng)的能力,目前在手指上可以實(shí)現(xiàn)兩個(gè)自由度,因此這款即將投入生產(chǎn)使用的機(jī)器人已經(jīng)在特斯拉工廠投入測(cè)試,從事一些重復(fù)性的工作。
據(jù)介紹,特斯拉的FSD技術(shù)(“Full Self Driving”,即完全自動(dòng)駕駛)直接被應(yīng)用在“擎天柱”身上作為其大腦,簡單來說它采用了與汽車一樣的視覺感知,“它可以非常清晰地識(shí)別周圍的物體。我們收集了非常多的數(shù)據(jù),通過數(shù)據(jù)來訓(xùn)練機(jī)器人,我們對(duì)于汽車的訓(xùn)練是類似的。”但機(jī)器人的需求和形式也有別于汽車,比如需要支持通信,所以“擎天柱”有很多無線連接和音頻支持,同時(shí)它的硬件也一定要非常安全能夠保護(hù)機(jī)器人本身和周圍的人,所以需要考慮四肢方面的內(nèi)容。
“汽車是有輪子的機(jī)器人,而機(jī)器人是裝上腳的汽車”,因?yàn)榻M件的相似性,機(jī)器人和汽車在設(shè)計(jì)上也具有相似性,可以進(jìn)行技術(shù)的遷移。而在馬斯克看來,和設(shè)計(jì)汽車的原則類似,以非常高的可靠性和非常低的成本來大批量生產(chǎn)機(jī)器人也非常重要。他對(duì)此表示信心十足,“我們覺得產(chǎn)量應(yīng)該可以達(dá)到數(shù)百萬臺(tái),并且它的價(jià)格比汽車便宜得多,按照我的猜測(cè),一臺(tái)機(jī)器人的最終價(jià)格不到2萬美元。”
對(duì)此,有專家在媒體采訪時(shí)表示,國內(nèi)有企業(yè)研發(fā)的雙足行走人形機(jī)器人成本價(jià)約在50萬元,這一價(jià)格屬于手工組裝的價(jià)格,未來如果大規(guī)模生產(chǎn),價(jià)格降至30萬元左右是有可能的,但要達(dá)到15萬元,成本壓力還是很大。
但背靠著特斯拉工廠的規(guī)模化生產(chǎn)和同根同源的核心技術(shù),馬斯克對(duì)于特斯拉人形機(jī)器人的預(yù)估售價(jià)或許是有底氣的。“擎天柱”頭部配備與特斯拉汽車相同的攝像頭等傳感器陣列,算力支持由FSD芯片提供,同時(shí)與汽車共用AI系統(tǒng),利用Dojo超級(jí)計(jì)算機(jī)的訓(xùn)練機(jī)制去提升機(jī)器人的功能。馬斯克及其團(tuán)隊(duì)多次表示,特斯拉的技術(shù)進(jìn)步不僅可以使用到汽車上,也可以使用到“擎天柱”上。
馬斯克認(rèn)為,盡管自動(dòng)駕駛汽車為世界帶來非常深刻的變化,在交通行業(yè)可謂是革命性的,運(yùn)輸生產(chǎn)效率至少可以提高一個(gè)數(shù)量級(jí)甚至更多,但機(jī)器人對(duì)于社會(huì)來說意義更大。“使用機(jī)器人可以實(shí)現(xiàn)更低的勞動(dòng)力成本,讓經(jīng)濟(jì)得以更好地發(fā)展。未來機(jī)器人可以無處不在,人們可以選擇體力活,但這是一種選擇而不是必須做的,大家都可以去做腦力工作。”
但馬斯克也坦言,目前的機(jī)器人還不是非常完善,當(dāng)前推出的是“擎天柱”第一個(gè)版本,接下來還要解決很多技術(shù)問題并不斷進(jìn)行迭代,要讓機(jī)器人非常靈活、高效且安全。“但現(xiàn)在我們必須要先做一些技術(shù)選擇,以便盡快量產(chǎn)出有用的機(jī)器人。”
同根同源的FSD技術(shù)和Dojo超算系統(tǒng)
特斯拉的機(jī)器人和汽車都離不開FSD技術(shù),據(jù)特斯拉官方數(shù)據(jù)顯示,目前Tesla FSD Beta擁有16萬名用戶,而在2021年只有2000名。“我們持續(xù)一年訓(xùn)練了75000個(gè)神經(jīng)網(wǎng)絡(luò)模型,基本上是每8分鐘就訓(xùn)練了一個(gè)模型,我們發(fā)布了其中281個(gè)模型,它們也的確提升了汽車的性能。此外這些性能上的創(chuàng)新是全棧式的,所以目前 FSD Beta測(cè)試版可以實(shí)現(xiàn)一定程度上的自動(dòng)駕駛,比如可以從一個(gè)停車場(chǎng)導(dǎo)航到另一個(gè)停車場(chǎng),可以停下來等紅綠燈,還可以在十字路口和其他目標(biāo)進(jìn)行一些協(xié)調(diào),這些都得益于神經(jīng)網(wǎng)絡(luò)上的進(jìn)步,才能實(shí)現(xiàn)FSD測(cè)試用戶數(shù)量的大幅增長。”
馬斯克表示,從技術(shù)角度來說,當(dāng)前FSD Beta可以適應(yīng)不同的路況,不管是在哪一國家或地區(qū),“不過我們希望在不同的天氣條件下來進(jìn)一步去驗(yàn)證,比如大雨和大雪天氣,同時(shí)我們也在考慮更多的場(chǎng)景,并對(duì)相關(guān)指標(biāo)進(jìn)行優(yōu)化,確保汽車能夠完全自動(dòng)駕駛。”
他稱,F(xiàn)SD Beta今年年底有望在全球推出,但面臨不同國家的監(jiān)管審批也具有非常大的挑戰(zhàn)。“在美國和加拿大以外的國家和地區(qū),我們需要和監(jiān)管方保持更為密切的溝通,以獲得這方面的批準(zhǔn)。但有些國家和地區(qū)在此方面的監(jiān)管其實(shí)是非常滯后的。”
據(jù)悉,此前特斯拉的自動(dòng)駕駛團(tuán)隊(duì)依靠人工數(shù)據(jù)注釋來識(shí)別和描述特斯拉汽車上的攝像頭和傳感器所拍攝的短視頻片段中的物體。這些標(biāo)記的片段用于訓(xùn)練特斯拉的神經(jīng)網(wǎng)絡(luò),并改進(jìn)駕駛輔助系統(tǒng),使特斯拉汽車能夠在駕駛者的監(jiān)督下繞行,自動(dòng)避開障礙。
而在本屆 AI Day活動(dòng)上,特斯拉方面稱目前已經(jīng)形成了非常復(fù)雜的自動(dòng)標(biāo)注系統(tǒng),通過人機(jī)合作的方式,大量的數(shù)據(jù)輸入汽車進(jìn)行分析后形成訓(xùn)練數(shù)據(jù),提供正確標(biāo)注之后再讓模型進(jìn)行訓(xùn)練,而在過去一年的時(shí)間里,訓(xùn)練基礎(chǔ)設(shè)施也擴(kuò)展了40%-50%,才能對(duì)大規(guī)模的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
此外,面對(duì)復(fù)雜的路況,人類可以順勢(shì)做出關(guān)聯(lián)判斷,但是對(duì)于汽車和機(jī)器人來說這樣的判斷較有難度。汽車面對(duì)多智能體應(yīng)該如何規(guī)劃協(xié)調(diào),也需要持續(xù)優(yōu)化,特斯拉團(tuán)隊(duì)稱,在此情況下的計(jì)算量十分龐大,隨著情況愈加復(fù)雜,計(jì)算量更是指數(shù)級(jí)的增加,而對(duì)于汽車的規(guī)劃器來說,需要非常快做出決定。
“隨著互動(dòng)關(guān)系的增加,計(jì)算量就會(huì)越來越大。所以我們要考慮的不僅僅是尺度問題,我們最終要建立的是一個(gè)輕量級(jí)的可變網(wǎng)絡(luò),可以進(jìn)行循環(huán)地運(yùn)行,這個(gè)過程中我們還需要再進(jìn)行訓(xùn)練,現(xiàn)在我們每個(gè)操作的運(yùn)行時(shí)間已經(jīng)縮短到了100微秒,這是一個(gè)莫大的進(jìn)步。”
為保證人工智能訓(xùn)練效率,同時(shí)擴(kuò)展帶寬、減少延遲、節(jié)省成本,特斯拉發(fā)展自研了Dojo超級(jí)計(jì)算機(jī)系統(tǒng),特斯拉方面稱,特斯拉的車隊(duì)在日常行駛中積累了很多視頻片段,每個(gè)視頻有多幀圖像,需要14億幀才能訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),需要使用10萬個(gè)GPU工時(shí)。而Dojo超算,能夠提升30%的網(wǎng)絡(luò)訓(xùn)練速度。
據(jù)介紹,只用4個(gè)Dojo機(jī)柜就能取代由4000個(gè)GPU組成的72個(gè)GPU機(jī)架。Dojo能將通常需要幾個(gè)月的工作減少到了1周。“我們計(jì)劃在2023年第一季度推出Dojo機(jī)柜,我想Dojo的算力是非常高的”,馬斯克表示。
而在這場(chǎng)十分硬核的AI Day活動(dòng)中,特斯拉方面頻頻發(fā)出招募人才的信號(hào),馬斯克也直言不諱,“舉辦這樣的活動(dòng)的目的就是為了展示特斯拉的技術(shù)以此吸引全球人才的加入。”而對(duì)于產(chǎn)品實(shí)際落地與上市,這一次馬斯克的承諾能如期完成嗎?