天堂а√中文在线中文|日韩av毛片在线观看|综合精品欧美日韩国产在线|亚洲一级性片,亚洲成人资源,五月婷婷在线综合,少妇激情一区二区三区视频

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek押寶法國隊,Kimi看好阿根廷隊,千問、豆包、元寶等支持西班牙隊,AI大模型集體押注世界杯,誰最懂球?

每日經(jīng)濟新聞 2026-06-12 00:11:53

每經(jīng)記者|溫夢華    每經(jīng)編輯|何小桃 張益銘    

記者|溫夢華

編輯|何小桃?張益銘 易啟江?校對|金冥羽

還有幾個小時,2026年美加墨世界杯即將打響(北京時間6月12日凌晨)。而賽場外的AI(人工智能)賽事研判、實力比拼,早已先行開啟。

6月8日,國產(chǎn)大模型Kimi稱將通過Agent(智能體)集群同時調(diào)度300個子Agent,公開預(yù)測104場世界杯賽事,并提出德國隊或爆冷奪冠。Kimi同時上線了一場“押注”活動:1萬億Token(詞元)獎池,用戶選隊、球隊贏了就可以瓜分Token,將體育賽事與AI用戶運營深度綁定。

《每日經(jīng)濟新聞》記者(以下簡稱每經(jīng)記者)注意到,千問也緊隨其后上線了相關(guān)活動。每經(jīng)記者實測發(fā)現(xiàn),豆包、元寶、DeepSeek、文心一言等國產(chǎn)大模型在被問及“2026年世界杯誰會奪冠”時,多數(shù)預(yù)測答案為“西班牙隊”,判斷邏輯也高度趨同。

熱鬧之下,Kelly Bench最新數(shù)據(jù)卻顯示,包括GPT等在內(nèi)的頂級模型在足球賭盤上表現(xiàn)慘淡。

既然AI賭不贏,Kimi、千問等AI大模型為何還要押注世界杯?這背后,實際上是AI大模型行業(yè)的集體焦慮:當(dāng)寫詩、做題、對話的“內(nèi)卷”走到盡頭,各家廠商急于證明自己能夠理解復(fù)雜、動態(tài)、充滿不確定性的現(xiàn)實世界。

“萬億Token狂歡”:世界杯成AI“用戶拉新戰(zhàn)場”

面對世界杯的巨大流量,一眾品牌早已摩拳擦掌,這一次下場“押注”除了傳統(tǒng)贊助商,還有手握萬億Token的AI大模型們。

6月8日,Kimi發(fā)文稱,將通過Agent集群同時調(diào)度300個子Agent,公開預(yù)測104場世界杯賽事,并在每輪賽前公開預(yù)測、賽后復(fù)盤。

Kimi的預(yù)測策略并沒有完全隨大流。它并未否認當(dāng)前多數(shù)主流模型將西班牙隊和法國隊列為奪冠最大熱門,同樣認為兩者的奪冠概率位居前列,但它提出了另一個關(guān)注點:德國隊的奪冠概率可能被市場低估。

GXaOuDJovOp5UpFAlOHsicKQb2iaBzRQOBIJIcIIludI443Ots56eZ3GRfQ8bxMsczmlicOn4hxuQyV7FQql5ekHV3x7KGfPguUbOEeOlFunm4.pngKimi月之暗面公眾號

當(dāng)網(wǎng)友們熱議“AI預(yù)測究竟準(zhǔn)不準(zhǔn)”“AI懂不懂球”時,Kimi在文章開頭就坦承“我們的預(yù)測很可能是錯的”,并稱希望通過這次嘗試,把分析過程、預(yù)測結(jié)果和賽后復(fù)盤放在同一個透明框架中。

此外,Kimi還拿出1萬億Token獎池,用戶預(yù)測冠軍隊、pick(挑選)的球隊每次獲勝就可以參與瓜分Token。截至6月11日18時,Kimi App顯示,實時排行的隊伍支持率TOP5分別為阿根廷、法國、西班牙、巴西、葡萄牙,有43.33%的參與用戶選擇了阿根廷。

GXaOuDJovOryQqWNS2GOiaiarTEvrX01oyH1gicoMVXuqUTmW4SKnPRicnLF8nHjUUN6QX5YtQMXBPDJ1ibaKicCnGlwtEuv2w4evibaTiaT1HfT0a0.jpgKimi“預(yù)測冠軍隊搶萬億Token”活動截圖

那么,Kimi押注世界杯并豪擲萬億Token,究竟是能力展示,還是一次品牌營銷?

長期關(guān)注世界杯等知名賽事的體育咨詢專家、關(guān)鍵之道創(chuàng)始人張慶告訴每經(jīng)記者,Kimi此次活動類似于春晚搶紅包、集福瓜分獎金等互聯(lián)網(wǎng)平臺常用打法,更像一種營銷活動。

“每一屆世界杯都是巨大的流量池,各個企業(yè)都希望有機會參與,獲得更多曝光、引流機會。而大模型天然適合做這類數(shù)據(jù)分析和預(yù)測?!睆垜c向每經(jīng)記者指出,當(dāng)下,大模型競爭激烈,尤其是用戶注意力和使用頻次的競爭,通過世界杯一方面會加持品牌聲量,另一方面也有利于提升大模型的數(shù)據(jù)用戶積累和活躍度。

深耕人工智能產(chǎn)業(yè)多年的技術(shù)專家王巖(化名)在接受每經(jīng)記者采訪時坦言,大模型預(yù)測世界杯冠軍,是體育熱點、Token補貼和Agent展示疊加形成的傳播事件。

王巖認為,熱點借勢只是入口,真正競爭點在于誰能把抽象模型能力轉(zhuǎn)化為用戶可感知結(jié)果。這意味著,AI大模型企業(yè)在品牌傳播上,不再只發(fā)布參數(shù)、榜單和技術(shù)報告,轉(zhuǎn)為借高關(guān)注賽事制造用戶體驗入口;而在商業(yè)競爭上各家模型爭奪的則是用戶心智、使用頻次、社交傳播和開發(fā)者注意力。

截至目前,多少用戶參與了Kimi“押注”世界杯的活動?通過用Agent集群預(yù)測世界杯冠軍,Kimi又將獲得哪些方面的能力提升?Kimi(月之暗面)方面向每經(jīng)記者表示:“暫無回應(yīng)”。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

多款國產(chǎn)大模型預(yù)測西班牙隊

精準(zhǔn)共識還是算法趨同?

不只Kimi,其他AI大模型玩家也試圖“分一杯世界杯的羹”。例如,千問也推出“決戰(zhàn)美加墨,與千問一起預(yù)測,贏萬元現(xiàn)金”的活動,加入這場AI“秀肌肉”爭奪戰(zhàn)。

GXaOuDJovOrAvczSoKktMs5rEeItb4G6bMtlbqyZ2vOpPw22ibYKlWchjYvwtt3tIAqKEuiar33Cm3xSplWYDluj4pkYicgLMBJWaM9k1lgyWg.png千問App截圖

“我前兩天也用DeepSeek、豆包預(yù)測了2026年世界杯冠軍,想對比它們誰分析的有道理,但我看到它們給出的預(yù)測和相關(guān)理由都有明顯局限性。”張慶向每經(jīng)記者分享道。

在國產(chǎn)大模型眼中,誰是“2026年世界杯冠軍隊伍”?每經(jīng)記者實測DeepSeek、Kimi、豆包、元寶、千問、文心一言、智譜清言發(fā)現(xiàn):DeepSeek押寶法國隊,Kimi看好阿根廷隊,而千問、豆包、元寶、文心一言、智譜清言5款國產(chǎn)大模型則均預(yù)測支持西班牙隊。

每款A(yù)I大模型給出的“奪冠隊伍”理由分析略有不同。值得注意的是,投票西班牙隊的AI大模型們,其判斷邏輯高度趨同,核心理由之一均為“權(quán)威數(shù)據(jù)模型、機構(gòu)高度一致看好”。

GXaOuDJovOoRFgiajshicKVoZkqky4Y7DHViaVfxSLMzWvnr8s409wOiaycPCTnxiaPSofWfxJV9BXkLAIuU3EmxFJwXOwBx7eibhNN9uFkd6W9Xg.jpg

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png大模型的預(yù)測到底準(zhǔn)不準(zhǔn)?

能否獲得球迷的青睞?

上海財經(jīng)大學(xué)特聘教授胡延平向每經(jīng)記者表示,AI大模型已經(jīng)初步展露出基于全局動態(tài)信息和深度復(fù)雜推理的特定預(yù)測能力,使得各家大模型有基礎(chǔ)、有信心來進行預(yù)測,但足球是圓的,預(yù)測的成功率、精準(zhǔn)度方面還有待觀察。

“世界杯預(yù)測無疑是展示模型與智能體水準(zhǔn)的一個上佳機會窗口,不過預(yù)測的效果也是一把雙刃劍。個人預(yù)期這屆世界杯,水準(zhǔn)最高的預(yù)測模型,成功率能達到60%~80%左右。”胡延平坦言。

不過,Kelly Bench在2023—2024賽季英格蘭超級聯(lián)賽的模擬中顯示,其評估的每個前沿模型在整個賽季都虧損了,并且許多都經(jīng)歷了破產(chǎn)。其中,Claude Opus 4.7目前以-3.7%的平均投資回報率領(lǐng)先;有4個模型避免了所有的破產(chǎn)。

GXaOuDJovOrrNVksHr1egK9xdUCnNgsacvGJMibdQvibJwbp7ym2lgdXO3Mpcvm8mE0YwkT1vkXiaTicSpUaN2rIErFtN4fo23avKmjs8XBHsf0.jpgKelly Bench截圖

“AI更多是一個輔助工具,基于戰(zhàn)隊歷史戰(zhàn)績、世界杯排名、賠率、國際足聯(lián)等大量數(shù)據(jù)的多維度預(yù)測,AI大模型呈現(xiàn)了客觀數(shù)據(jù)統(tǒng)計,所以作為參考工具還是有意義的,但不會完全依賴它的結(jié)果。”一位長期關(guān)注世界杯的資深球迷告訴每經(jīng)記者。

在上述球迷看來,相比大模型的預(yù)測,每個球迷都更青睞自己喜歡的球隊,喜好也會占一大部分判斷,而且越到?jīng)Q賽越是球員臨場發(fā)揮和心理上的博弈,不確定性太多了。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

不再比誰更會“聊”

押注世界杯背后AI們集體想拼什么?

當(dāng)Kimi拿出萬億Token、調(diào)動300個子Agent對世界杯賽事進行并行預(yù)測,當(dāng)千問、豆包、元寶爭先恐后地給出各自的奪冠熱門隊伍時,這場看似娛樂化的“AI押注戰(zhàn)”背后,AI大模型廠商究竟想“秀”什么?又在集體“卷”什么?

“本輪大模型預(yù)測世界杯冠軍,是生成式AI從問答工具走向公共事件運營的典型樣本。”王巖向每經(jīng)記者指出,公眾看到的是冠軍預(yù)測,企業(yè)展示的則是Agent協(xié)同、長上下文處理、實時檢索、概率解釋和高并發(fā)服務(wù)能力,商業(yè)上爭奪的則是用戶時長、付費轉(zhuǎn)化和資本敘事。

GXaOuDJovOrakGuvV1puNzeLhM5RhrUN7gTYUQdkKyodC1fLqiabicRwiaEGLHWwYr9NxOcYbOYcjpl0ARxiaUibxibeIkNXsBYkmElc2kRBv5TFo.pngKimi月之暗面公眾號

當(dāng)下,AI大模型的競爭早已不局限于單純的參數(shù)榜單,而是從“會聊天”轉(zhuǎn)向“能辦事”,從“比模型”轉(zhuǎn)向“比場景”。然而,《Build for the Future 2025》全球研究顯示,在調(diào)研全球1250多家企業(yè)后,僅5%的公司實現(xiàn)了AI價值的規(guī)?;瘧?yīng)用。Gartner數(shù)據(jù)也顯示,截至2025年底,嵌入真正AI Agent的企業(yè)應(yīng)用占比不足5%。

胡延平觀察到,大模型和智能體正從對話走向任務(wù),從預(yù)訓(xùn)練走向持續(xù)學(xué)習(xí),從數(shù)據(jù)語料走向持續(xù)多維的現(xiàn)實感知?!邦A(yù)測世界杯這類探索項目會加速這個進化過程。未來行動智能體所需要的能力體系,也是在走向‘感知-交互-決策-協(xié)同’這個方向?!?/span>

不過,王巖坦言,世界杯預(yù)測可以成為Agent能力的公開壓力測試,但不能自動證明Agent能力提升,大模型在這場押注中訓(xùn)練和檢驗的是長任務(wù)組織、概率校準(zhǔn)和用戶交互能力。

“Kimi的300個Agent代表分析覆蓋面增加,不直接代表預(yù)測準(zhǔn)確率提升。相關(guān)Agent任務(wù)Token消耗研究顯示,同一任務(wù)的Token消耗可相差幾十倍,更多Token并不必然帶來更高準(zhǔn)確率。同樣,相關(guān)Prediction Arena研究也顯示,多個前沿模型在Kalshi真實預(yù)測市場57天交易測試中最終收益為-16.0%至-30.8%,研究量與結(jié)果沒有相關(guān)性?!蓖鯉r向每經(jīng)記者進一步分析道。

正如王巖所言:“當(dāng)前Agent的最大缺口,正在從‘能否給出合理計劃’轉(zhuǎn)向‘能否穩(wěn)定完成長周期真實任務(wù)’?!边@意味著,誰能率先落地“實戰(zhàn)能力”,誰就將有機會在愈發(fā)激烈的爭奪賽中脫穎而出。

(免責(zé)聲明:文章內(nèi)容和數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。)

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經(jīng)濟新聞 ?nbdnews? 原創(chuàng)文章|

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0