21世紀(jì)經(jīng)濟(jì)報(bào)道 趙娜 西安報(bào)道
10月28日下午,由陜西科控投資基金、西安交通大學(xué)國家技術(shù)轉(zhuǎn)移中心、21世紀(jì)經(jīng)濟(jì)報(bào)道聯(lián)合主辦,招商銀行西安分行支持,21世紀(jì)創(chuàng)投研究院擔(dān)任智庫支持的“科學(xué)家遇見投資人”閉門研討會西安交通大學(xué)專場活動在西安交通大學(xué)創(chuàng)新港校區(qū)舉辦。

“我們現(xiàn)在處于第四次工業(yè)的革命——一場以人工智能大數(shù)據(jù)為代表的智能化革命。”西安交通大學(xué)人工智能學(xué)院教授丁寧在會上表示,“借鑒前三次工業(yè)革命,相關(guān)技術(shù)都成為了人們工作和生活的必需品。可以預(yù)見,第四次工業(yè)革命后,人工智能也極有可能成為未來世界不可或缺的核心技術(shù)。”
丁寧本科與碩士畢業(yè)于西安交大,博士畢業(yè)于日本慶應(yīng)大學(xué),曾在阿里巴巴工作數(shù)年,于2023年回到高校從事大模型、人機(jī)交互、自然語言處理、語音處理等方向的研究。
AI正在進(jìn)入“多模態(tài)融合”階段
理解大語言模型(LLM),可以按著“模型”“語言模型”“大語言模型”逐次遞進(jìn)。這是一個函數(shù)式的映射系統(tǒng),通過參數(shù)學(xué)習(xí)輸入與輸出間的關(guān)系。模型的“規(guī)模”代表參數(shù)量級,但“大”并不只是數(shù)字意義的擴(kuò)張。
“在相同結(jié)構(gòu)下,模型的參數(shù)量越大,它的性能越好。但并不代表,參數(shù)量大的模型一定比參數(shù)量小的模型好。”丁寧教授在演講中指出,早期大家追求的是更大的參數(shù)量,而近兩年行業(yè)開始回歸理性。
他進(jìn)一步解釋道,大模型性能的提升并非線性依賴于參數(shù),結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練方法和數(shù)據(jù)質(zhì)量同樣決定上限。當(dāng)前業(yè)界普遍遵循“規(guī)模法則(scaling law)”:在相同架構(gòu)下,隨著參數(shù)量、算力和數(shù)據(jù)規(guī)模的增加,模型性能提升呈冪律關(guān)系。但當(dāng)成本、能耗、數(shù)據(jù)清洗等因素疊加后,模型優(yōu)化開始從盲目擴(kuò)張走向結(jié)構(gòu)創(chuàng)新和精細(xì)訓(xùn)練。
2022年底ChatGPT的出現(xiàn)標(biāo)志著人工智能發(fā)展的轉(zhuǎn)折點(diǎn),也開啟了大模型的產(chǎn)業(yè)化競爭。過去單模態(tài)(僅文本)的模型,如今正在向圖像、語音、代碼等多模態(tài)融合演進(jìn)。
多模態(tài)能力意味著AI不再只是理解文字,而是能感知和生成來自不同世界的信息。丁寧教授認(rèn)為,基于高質(zhì)量的預(yù)訓(xùn)練模型和參數(shù)高效微調(diào),形成的微調(diào)大模型可以廣泛嵌入科研、制造、教育、醫(yī)療、金融等領(lǐng)域。
目前主流大模型仍以Transformer架構(gòu)為基礎(chǔ),但在訓(xùn)練方式上,正在從“預(yù)訓(xùn)練+監(jiān)督微調(diào)”向持續(xù)學(xué)習(xí)和參數(shù)高效微調(diào)演化——即用更少算力實(shí)現(xiàn)更快適配。這一趨勢帶來一個重要變化:AI從技術(shù)突破走向可負(fù)擔(dān)的產(chǎn)業(yè)落地。
技術(shù)與資本的“雙向驅(qū)動”
大模型的快速發(fā)展離不開資本的投入與產(chǎn)業(yè)協(xié)同。如果用一句話總結(jié)這種關(guān)系:資本是技術(shù)的放大器,技術(shù)是資本的倍增器。
具體來說,大模型訓(xùn)練的前期成本極高,包括算力、數(shù)據(jù)、算法和人才。沒有資本介入,很難形成高質(zhì)量基礎(chǔ)模型;但如果沒有技術(shù)洞見和研發(fā)積累,資本也難以真正驅(qū)動產(chǎn)業(yè)升級。
再從國際對比看,美國在頭部企業(yè)、算力中心和生態(tài)層面仍領(lǐng)先,中國則在論文和專利授權(quán)方面躍居全球前列。丁寧教授在現(xiàn)場披露的數(shù)據(jù)顯示:到2023年,人工智能領(lǐng)域的論文數(shù)量占全球的41%;我國在人工智能領(lǐng)域的專利飛速增長,截至2023年在全球的專利數(shù)占比已達(dá)到69%。
另一方面,算力依然是制約我國AI發(fā)展的關(guān)鍵瓶頸,模型“幻覺”、表達(dá)精度不足、產(chǎn)業(yè)鏈協(xié)同難等問題仍待突破——如,芯片、GPU、系統(tǒng)與模型生態(tài)需要配套發(fā)展,單靠某一環(huán)難以實(shí)現(xiàn)突圍。
展望未來,丁寧教授認(rèn)為,AI的發(fā)展將呈現(xiàn)多個趨勢:第一,多模態(tài)融合,即文字、圖像、語音、傳感數(shù)據(jù)全面打通;第二,大規(guī)模與輕量化并行,即在追求能力極限的同時推動端側(cè)部署;第三,具身智能,即AI與物理世界交互,催生機(jī)器人新生態(tài);第四,通用人工智能(AGI)探索,即具備通用認(rèn)知和自學(xué)習(xí)能力,將成為長期目標(biāo)。
此外,他指出,超級智能則是一個更前瞻的概念,指具有“超過最聰明、最有天賦人類”的系統(tǒng),同時可能涉及哲學(xué)層面的議題,如自主性與自我意識。這一階段仍停留在理論探討與未來設(shè)想之中,是人工智能發(fā)展可能的方向之一。

