2026-06-13 15:05:16
6月12日至13日,第八屆北京智源大會舉行,被稱為“AI界春晚”。歷屆大會主角變遷反映AI產(chǎn)業(yè)演進(jìn),今年更多年輕面孔登臺,AI自進(jìn)化成熱詞。智源提出世界模型為第四類技術(shù)路線,仍處于早期。當(dāng)前,AI產(chǎn)業(yè)進(jìn)入新舊敘事交替的“換擋期”,真正的創(chuàng)新或許正誕生于少人關(guān)注的角落。
每經(jīng)記者|可楊 每經(jīng)編輯|杜宇
6月12日至13日,第八屆北京智源大會在中關(guān)村國際創(chuàng)新中心舉行。
這場被業(yè)界稱為“AI界春晚”的盛會,是一張AI產(chǎn)業(yè)情緒與技術(shù)路線的“晴雨表”,2026年,人們討論的關(guān)鍵詞已經(jīng)變成AI自進(jìn)化、世界模型、下一物理狀態(tài)預(yù)測。
回望近年行業(yè)發(fā)展軌跡:從ChatGPT引爆全球大模型浪潮,到國產(chǎn)模型創(chuàng)業(yè)公司站上舞臺中央,再到機(jī)器人、世界模型和智能體接棒成為焦點(diǎn),這場被稱為“AI春晚”的盛會,也記錄著過去幾年人工智能產(chǎn)業(yè)關(guān)注重心不斷遷移的軌跡。
只是與過去三年相比,今年會場里的情緒似乎平靜了許多,新的熱點(diǎn)已經(jīng)出現(xiàn),但新的超級明星公司尚未誕生,在技術(shù)“狂飆”三年之后,AI產(chǎn)業(yè)似乎正在進(jìn)入一個新的過渡階段。
2026年6月12日,第八屆“北京智源大會”在中關(guān)村國際創(chuàng)新中心開幕。 (圖片來源:主辦方供圖)
拉長時間維度來看,歷屆智源大會的嘉賓主角變遷,就是一部濃縮的AI產(chǎn)業(yè)演進(jìn)史。
2023年,ChatGPT問世剛滿半年,國內(nèi)“百模大戰(zhàn)”蓄勢待發(fā)。本屆大會的高光時刻,屬于OpenAI代表人物山姆?奧特曼與深度學(xué)習(xí)之父杰弗里?辛頓。彼時國內(nèi)大模型仍處于追趕階段,主論壇嘉賓以海外學(xué)者、國內(nèi)頂尖科研人員為主,議題也多聚焦于AI基礎(chǔ)技術(shù)探索。
2024年,行業(yè)格局迎來明顯變化。月之暗面、百度、智譜AI、零一萬物、面壁智能等一眾國產(chǎn)大模型企業(yè)的創(chuàng)始人、CTO成為大會主角,“百模大戰(zhàn)”進(jìn)入白熱化階段。其中,月之暗面創(chuàng)始人楊植麟人氣居高不下,圓桌對話結(jié)束后,他多次被現(xiàn)場觀眾圍堵,最終在工作人員協(xié)助下才得以離場,這一幕也成為當(dāng)年大會的標(biāo)志性畫面。
2025年,主角再次“易位”。第七屆智源大會上,宇樹科技創(chuàng)始人王興興成為新的焦點(diǎn)人物,結(jié)束開幕式圓桌對話后在安保引導(dǎo)下離場,具身智能取代大語言模型,成為當(dāng)年大會的關(guān)鍵詞,機(jī)器人格斗、舞蹈表演登上主論壇舞臺。
針對行業(yè)趨勢,面壁智能CEO(首席執(zhí)行官)李大海當(dāng)時向《每日經(jīng)濟(jì)新聞》記者(下稱“每經(jīng)記者”)表示,技術(shù)發(fā)展是非線性的,大模型作為底層基礎(chǔ)設(shè)施逐步成熟后,產(chǎn)業(yè)關(guān)注的重心自然會從底層模型向具體應(yīng)用遷移,這種遷移是合理且必然的。
2026年,每經(jīng)記者在第八屆北京智源大會現(xiàn)場注意到,會場的氣氛又發(fā)生了變化,本屆大會匯聚了2位圖靈獎得主、8位院士、30余位30歲以下青年科學(xué)家、40余位AI企業(yè)CEO與創(chuàng)始人,以及200余場演講和分享,線下報名人數(shù)已突破1萬人,智源研究院院長王仲遠(yuǎn)透露,本次報名人數(shù)已經(jīng)超過去年。不過,現(xiàn)場并未看到此前兩年那種因明星嘉賓而出現(xiàn)的擁堵場面。
談及大會主角的逐年更迭,王仲遠(yuǎn)在接受每經(jīng)記者采訪時坦言,過去幾年智源大會的開幕式主角一直在變化,從大模型、具身智能,到今年的世界模型,每一次主角的變化,背后其實是產(chǎn)業(yè)關(guān)注重心的遷移,“更像一個平臺和載體,反映了時代的變遷”。
第八屆北京智源大會一個引人注目的變化,是更多年輕面孔走上了主舞臺。
在開幕式圓桌環(huán)節(jié),小米集團(tuán)MiMo大模型團(tuán)隊負(fù)責(zé)人羅福莉與清華大學(xué)人工智能研究院副院長、生數(shù)科技創(chuàng)始人朱軍;清華大學(xué)計算機(jī)系教授、面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家劉知遠(yuǎn);南洋理工大學(xué)講座教授、人工智能交叉研究院院長安波同臺對話。
AI自進(jìn)化也成為本屆大會討論最密集的詞匯之一。
羅福莉的判斷是,上一代模型的能力上限更多體現(xiàn)在執(zhí)行層面,指令清晰時執(zhí)行效果接近完美,但頂尖模型如今已經(jīng)開始向設(shè)計驗證指標(biāo)、規(guī)劃實驗流程等更抽象的能力外延。
她認(rèn)為,目前模型與頂尖研究員之間的差距,主要還在于提出有價值的問題這一環(huán)節(jié),但這一差距正在被更強(qiáng)的模型疊加更好的智能體系統(tǒng)不斷縮小。
劉知遠(yuǎn)則從更宏觀的視角作出類比:工業(yè)革命的核心是用機(jī)器替代人的重復(fù)體力勞動,發(fā)展到極致便是用機(jī)器制造機(jī)器;而正在發(fā)生的智能革命,本質(zhì)上是用AI替代人的重復(fù)腦力勞動,用AI制造AI,是技術(shù)發(fā)展到高級階段的必然標(biāo)志。他同時強(qiáng)調(diào),“AI create AI”這件事的最外層驅(qū)動力,仍然應(yīng)當(dāng)是人類自身的主體性。
安波則持相對審慎的態(tài)度。他表示自己相信AI自演化的方向,但強(qiáng)調(diào)這套機(jī)制在AI能力較弱時很難在封閉環(huán)境中自行運(yùn)轉(zhuǎn),更多還是依賴外部用戶使用產(chǎn)生的真實反饋數(shù)據(jù),“完全封閉地去搞數(shù)據(jù)飛輪,這條路并不可行”。
圖片來源:每經(jīng)媒資庫 (圖文無關(guān))
如果說2025年的關(guān)鍵詞是具身智能,那么2026年智源大會真正想要推到臺前的,或許就是世界模型。
王仲遠(yuǎn)在大會前的采訪中系統(tǒng)闡述了智源對世界模型的判斷:人工智能正在經(jīng)歷一場范式變革,從“預(yù)測下一個詞元”(Next-Token Prediction)演進(jìn)到“預(yù)測下一個物理狀態(tài)”(Next Physical State Prediction),這正是世界模型的核心本質(zhì)。
智源將現(xiàn)有世界模型相關(guān)技術(shù)路線劃分為四類:第一類是以語言為中心的世界模型,包括VLM、VLA;第二類是以像素為中心的世界模型,如Sora、Seedance等視頻生成模型;第三類是以三維結(jié)構(gòu)為中心,包括3D重建以及李飛飛團(tuán)隊的World Labs Marble模型;第四類是以視覺表征為中心的世界模型,如楊立昆的JEPA系列模型,預(yù)測的是視覺表征的壓縮,但視覺嵌入演化不等于物理規(guī)律演化。
在王仲遠(yuǎn)看來,這四類模型距離真正面向物理世界的基座模型都還有很大距離,“現(xiàn)在仍處于世界模型的早期,依然需要開展大量的科研探索工作”。
基于這一判斷,智源在本屆大會上發(fā)布了通用世界基座模型悟界Physis-v0.1,以統(tǒng)一的物理狀態(tài)學(xué)習(xí)實現(xiàn)物理正確、動作因果可溯、長程一致與通用泛化。但王仲遠(yuǎn)也表示,這只是0.1版本,“很明顯只是非常初步的、正在訓(xùn)練的模型”,智源“并沒有重磅發(fā)布任何世界模型”,更多是分享研發(fā)進(jìn)展和初步觀察。
值得一提的是,智源研究院行為世界模型創(chuàng)新中心負(fù)責(zé)人是一位22歲的青年學(xué)者陳博遠(yuǎn)。王仲遠(yuǎn)表示,智源歷來秉持“青年挑大梁”的理念,當(dāng)年悟界系列的多位負(fù)責(zé)人也是30歲左右走上崗位。
在大模型產(chǎn)業(yè)論壇的圓桌討論中,關(guān)于大模型公司是否擁有長期“護(hù)城河”的爭論依然激烈。有聲音認(rèn)為,頂級模型能力正在快速趨同,開源與閉源的差距已縮小到3至6個月,大模型公司未來可能像賣水賣電的一樣,有量無價。
對此,王仲遠(yuǎn)認(rèn)為,目前大模型整體性能的迭代還遠(yuǎn)未到瓶頸期,行業(yè)格局可能走向一超多強(qiáng),也可能是多個巨頭并存,現(xiàn)階段各類評測榜單本身也并不完全可信。他特別提到,開幕式上提到的最新Claude模型發(fā)布,證明即便互聯(lián)網(wǎng)文本數(shù)據(jù)接近用盡,AI能力依然能夠持續(xù)提升,而且不僅是模型本身,整個系統(tǒng)的生產(chǎn)能力,以及從聊天工具到執(zhí)行工具的轉(zhuǎn)變,都在同步發(fā)生。
銀河通用CTO王鶴提到WAM(World Action Model,世界動作模型)的概念,將其與泛泛而談的世界模型區(qū)分開來。王鶴介紹,銀河通用此前用10億幀仿真數(shù)據(jù),已經(jīng)在抓取任務(wù)上驗證了零樣本端到端能力,但更多任務(wù)的Scaling仍依賴真實世界的遙操數(shù)據(jù)。在他看來,WAM以"動作"為核心,可以借助大量人類第一視角視頻學(xué)習(xí)動作模式,而不需要動作標(biāo)簽,這條路徑有望讓具身智能在未來兩年內(nèi)達(dá)到“GPT3.5級別”的預(yù)訓(xùn)練里程碑。
面壁智能聯(lián)合創(chuàng)始人兼首席科學(xué)家劉知遠(yuǎn)則在開幕式圓桌中提到,Anthropic之所以能夠在估值上超過OpenAI,關(guān)鍵在于其找到了“代碼”這樣一個能夠形成數(shù)據(jù)閉環(huán)的垂直方向,2024年、2025年強(qiáng)化學(xué)習(xí)上的成功,疊加Claude Code等產(chǎn)品從全球用戶那里持續(xù)收集代碼反饋數(shù)據(jù),構(gòu)成了一個可持續(xù)的數(shù)據(jù)飛輪。劉知遠(yuǎn)認(rèn)為,這一模式具有借鑒意義:任何領(lǐng)域若能快速搭建同類數(shù)據(jù)閉環(huán),都有望加速AI落地與技術(shù)突破。
而在王仲遠(yuǎn)看來,未來兩到三年內(nèi),AI Coding對各行各業(yè)的沖擊可能比世界模型等更直接、更快。他在采訪中提到,騰訊方面近期透露,今年以來公司新增代碼大部分已由AI生成,意味著人類數(shù)字世界會被現(xiàn)代AI重構(gòu)。
與前兩年相比,一個明顯的變化是:技術(shù)熱點(diǎn)的迭代速度并未減緩,但“造星效應(yīng)”有所減弱。
無論是世界模型還是AI Coding,目前都還沒有出現(xiàn)一家能夠像去年的宇樹科技、前年的月之暗面那樣,一露面就引爆全場關(guān)注的明星公司。
某科技公司一名報名前來參會的人士在接受每經(jīng)記者采訪時分享了自己的參會感受,他表示,無論是否有技術(shù)明星,智源大會的談?wù)撝黝}始終處于技術(shù)前沿,對于從業(yè)者而言,聽會以及前來與參展商的交流都很有價值。
王仲遠(yuǎn)在回應(yīng)每經(jīng)記者關(guān)于主角變遷的提問時表示,每年大會能讓全行業(yè)看到AI最新發(fā)展趨勢和方向,這也是今年報名人數(shù)再創(chuàng)新高的原因之一。他同時坦言,世界模型這一概念本身在過去半年非?;馃岬耐瑫r,也伴隨著大量的概念誤用,“我們期望大家逐步形成一些共識,避免世界模型名詞的濫用”。
在開幕式的對話環(huán)節(jié),阿里云創(chuàng)始人王堅與智源研究院理事長黃鐵軍,圍繞“總有人比時代早十年”展開了一場更具哲學(xué)意味的討論。
王堅提到,從飛機(jī)首飛到航空系成立用了三十多年的時間,“假定我們今天講的人工智能是一個大的變革,我們可能真的還遠(yuǎn)沒有到能夠成立真正意義上的'人工智能系'的時候”。
這句話或許也可以用來理解本屆大會的整體氛圍,當(dāng)具身智能的機(jī)器人格斗賽逐漸褪去新鮮感,當(dāng)大模型的能力迭代變成日常,當(dāng)自進(jìn)化、世界模型這些更抽象的概念尚未找到一個具象的明星載體,整個行業(yè)似乎正處在一個新舊敘事交替的換擋期。
正如劉知遠(yuǎn)在圓桌上對年輕人提出的建議,“真正的創(chuàng)新往往是反共識的,如果全世界都在做的事情,它就不見得是創(chuàng)新;所有人都認(rèn)為該做的事情,不見得是創(chuàng)新”。下一個能讓全場為之圍堵的明星,也許正誕生在那些此刻還少人關(guān)注的角落里。
封面圖片來源:每經(jīng)媒資庫
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP