要聞

DeepSeek押寶法國隊，Kimi看好阿根廷隊，千問、豆包、元寶等支持西班牙隊，AI大模型集體押注世界杯，誰最懂球？

每日經(jīng)濟新聞 2026-06-12 00:11:53

每經(jīng)記者｜溫夢華每經(jīng)編輯｜何小桃張益銘

記者|溫夢華

編輯|何小桃?張益銘易啟江?校對|金冥羽

還有幾個小時，2026年美加墨世界杯即將打響（北京時間6月12日凌晨）。而賽場外的AI（人工智能）賽事研判、實力比拼，早已先行開啟。

6月8日，國產(chǎn)大模型Kimi稱將通過Agent（智能體）集群同時調(diào)度300個子Agent，公開預(yù)測104場世界杯賽事，并提出德國隊或爆冷奪冠。Kimi同時上線了一場“押注”活動：1萬億Token（詞元）獎池，用戶選隊、球隊贏了就可以瓜分Token，將體育賽事與AI用戶運營深度綁定。

《每日經(jīng)濟新聞》記者（以下簡稱每經(jīng)記者）注意到，千問也緊隨其后上線了相關(guān)活動。每經(jīng)記者實測發(fā)現(xiàn)，豆包、元寶、DeepSeek、文心一言等國產(chǎn)大模型在被問及“2026年世界杯誰會奪冠”時，多數(shù)預(yù)測答案為“西班牙隊”，判斷邏輯也高度趨同。

熱鬧之下，Kelly Bench最新數(shù)據(jù)卻顯示，包括GPT等在內(nèi)的頂級模型在足球賭盤上表現(xiàn)慘淡。

既然AI賭不贏，Kimi、千問等AI大模型為何還要押注世界杯？這背后，實際上是AI大模型行業(yè)的集體焦慮：當(dāng)寫詩、做題、對話的“內(nèi)卷”走到盡頭，各家廠商急于證明自己能夠理解復(fù)雜、動態(tài)、充滿不確定性的現(xiàn)實世界。

“萬億Token狂歡”：世界杯成AI“用戶拉新戰(zhàn)場”

面對世界杯的巨大流量，一眾品牌早已摩拳擦掌，這一次下場“押注”除了傳統(tǒng)贊助商，還有手握萬億Token的AI大模型們。

6月8日，Kimi發(fā)文稱，將通過Agent集群同時調(diào)度300個子Agent，公開預(yù)測104場世界杯賽事，并在每輪賽前公開預(yù)測、賽后復(fù)盤。

Kimi的預(yù)測策略并沒有完全隨大流。它并未否認當(dāng)前多數(shù)主流模型將西班牙隊和法國隊列為奪冠最大熱門，同樣認為兩者的奪冠概率位居前列，但它提出了另一個關(guān)注點：德國隊的奪冠概率可能被市場低估。

GXaOuDJovOp5UpFAlOHsicKQb2iaBzRQOBIJIcIIludI443Ots56eZ3GRfQ8bxMsczmlicOn4hxuQyV7FQql5ekHV3x7KGfPguUbOEeOlFunm4.png Kimi月之暗面公眾號

當(dāng)網(wǎng)友們熱議“AI預(yù)測究竟準(zhǔn)不準(zhǔn)”“AI懂不懂球”時，Kimi在文章開頭就坦承“我們的預(yù)測很可能是錯的”，并稱希望通過這次嘗試，把分析過程、預(yù)測結(jié)果和賽后復(fù)盤放在同一個透明框架中。

此外，Kimi還拿出1萬億Token獎池，用戶預(yù)測冠軍隊、pick（挑選）的球隊每次獲勝就可以參與瓜分Token。截至6月11日18時，Kimi App顯示，實時排行的隊伍支持率TOP5分別為阿根廷、法國、西班牙、巴西、葡萄牙，有43.33%的參與用戶選擇了阿根廷。

GXaOuDJovOryQqWNS2GOiaiarTEvrX01oyH1gicoMVXuqUTmW4SKnPRicnLF8nHjUUN6QX5YtQMXBPDJ1ibaKicCnGlwtEuv2w4evibaTiaT1HfT0a0.jpg Kimi“預(yù)測冠軍隊搶萬億Token”活動截圖

那么，Kimi押注世界杯并豪擲萬億Token，究竟是能力展示，還是一次品牌營銷？

長期關(guān)注世界杯等知名賽事的體育咨詢專家、關(guān)鍵之道創(chuàng)始人張慶告訴每經(jīng)記者，Kimi此次活動類似于春晚搶紅包、集福瓜分獎金等互聯(lián)網(wǎng)平臺常用打法，更像一種營銷活動。

“每一屆世界杯都是巨大的流量池，各個企業(yè)都希望有機會參與，獲得更多曝光、引流機會。而大模型天然適合做這類數(shù)據(jù)分析和預(yù)測?！睆垜c向每經(jīng)記者指出，當(dāng)下，大模型競爭激烈，尤其是用戶注意力和使用頻次的競爭，通過世界杯一方面會加持品牌聲量，另一方面也有利于提升大模型的數(shù)據(jù)用戶積累和活躍度。

深耕人工智能產(chǎn)業(yè)多年的技術(shù)專家王巖（化名）在接受每經(jīng)記者采訪時坦言，大模型預(yù)測世界杯冠軍，是體育熱點、Token補貼和Agent展示疊加形成的傳播事件。

王巖認為，熱點借勢只是入口，真正競爭點在于誰能把抽象模型能力轉(zhuǎn)化為用戶可感知結(jié)果。這意味著，AI大模型企業(yè)在品牌傳播上，不再只發(fā)布參數(shù)、榜單和技術(shù)報告，轉(zhuǎn)為借高關(guān)注賽事制造用戶體驗入口；而在商業(yè)競爭上各家模型爭奪的則是用戶心智、使用頻次、社交傳播和開發(fā)者注意力。

截至目前，多少用戶參與了Kimi“押注”世界杯的活動？通過用Agent集群預(yù)測世界杯冠軍，Kimi又將獲得哪些方面的能力提升？Kimi（月之暗面）方面向每經(jīng)記者表示：“暫無回應(yīng)”。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

多款國產(chǎn)大模型預(yù)測西班牙隊

精準(zhǔn)共識還是算法趨同？

不只Kimi，其他AI大模型玩家也試圖“分一杯世界杯的羹”。例如，千問也推出“決戰(zhàn)美加墨，與千問一起預(yù)測，贏萬元現(xiàn)金”的活動，加入這場AI“秀肌肉”爭奪戰(zhàn)。

GXaOuDJovOrAvczSoKktMs5rEeItb4G6bMtlbqyZ2vOpPw22ibYKlWchjYvwtt3tIAqKEuiar33Cm3xSplWYDluj4pkYicgLMBJWaM9k1lgyWg.png 千問App截圖

“我前兩天也用DeepSeek、豆包預(yù)測了2026年世界杯冠軍，想對比它們誰分析的有道理，但我看到它們給出的預(yù)測和相關(guān)理由都有明顯局限性。”張慶向每經(jīng)記者分享道。

在國產(chǎn)大模型眼中，誰是“2026年世界杯冠軍隊伍”？每經(jīng)記者實測DeepSeek、Kimi、豆包、元寶、千問、文心一言、智譜清言發(fā)現(xiàn)：DeepSeek押寶法國隊，Kimi看好阿根廷隊，而千問、豆包、元寶、文心一言、智譜清言5款國產(chǎn)大模型則均預(yù)測支持西班牙隊。

每款A(yù)I大模型給出的“奪冠隊伍”理由分析略有不同。值得注意的是，投票西班牙隊的AI大模型們，其判斷邏輯高度趨同，核心理由之一均為“權(quán)威數(shù)據(jù)模型、機構(gòu)高度一致看好”。

GXaOuDJovOoRFgiajshicKVoZkqky4Y7DHViaVfxSLMzWvnr8s409wOiaycPCTnxiaPSofWfxJV9BXkLAIuU3EmxFJwXOwBx7eibhNN9uFkd6W9Xg.jpg

大模型的預(yù)測到底準(zhǔn)不準(zhǔn)？

能否獲得球迷的青睞？

上海財經(jīng)大學(xué)特聘教授胡延平向每經(jīng)記者表示，AI大模型已經(jīng)初步展露出基于全局動態(tài)信息和深度復(fù)雜推理的特定預(yù)測能力，使得各家大模型有基礎(chǔ)、有信心來進行預(yù)測，但足球是圓的，預(yù)測的成功率、精準(zhǔn)度方面還有待觀察。

“世界杯預(yù)測無疑是展示模型與智能體水準(zhǔn)的一個上佳機會窗口，不過預(yù)測的效果也是一把雙刃劍。個人預(yù)期這屆世界杯，水準(zhǔn)最高的預(yù)測模型，成功率能達到60%～80%左右。”胡延平坦言。

不過，Kelly Bench在2023—2024賽季英格蘭超級聯(lián)賽的模擬中顯示，其評估的每個前沿模型在整個賽季都虧損了，并且許多都經(jīng)歷了破產(chǎn)。其中，Claude Opus 4.7目前以-3.7%的平均投資回報率領(lǐng)先；有4個模型避免了所有的破產(chǎn)。

GXaOuDJovOrrNVksHr1egK9xdUCnNgsacvGJMibdQvibJwbp7ym2lgdXO3Mpcvm8mE0YwkT1vkXiaTicSpUaN2rIErFtN4fo23avKmjs8XBHsf0.jpg Kelly Bench截圖

“AI更多是一個輔助工具，基于戰(zhàn)隊歷史戰(zhàn)績、世界杯排名、賠率、國際足聯(lián)等大量數(shù)據(jù)的多維度預(yù)測，AI大模型呈現(xiàn)了客觀數(shù)據(jù)統(tǒng)計，所以作為參考工具還是有意義的，但不會完全依賴它的結(jié)果。”一位長期關(guān)注世界杯的資深球迷告訴每經(jīng)記者。

在上述球迷看來，相比大模型的預(yù)測，每個球迷都更青睞自己喜歡的球隊，喜好也會占一大部分判斷，而且越到?jīng)Q賽越是球員臨場發(fā)揮和心理上的博弈，不確定性太多了。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

不再比誰更會“聊”

押注世界杯背后AI們集體想拼什么？

當(dāng)Kimi拿出萬億Token、調(diào)動300個子Agent對世界杯賽事進行并行預(yù)測，當(dāng)千問、豆包、元寶爭先恐后地給出各自的奪冠熱門隊伍時，這場看似娛樂化的“AI押注戰(zhàn)”背后，AI大模型廠商究竟想“秀”什么？又在集體“卷”什么？

“本輪大模型預(yù)測世界杯冠軍，是生成式AI從問答工具走向公共事件運營的典型樣本。”王巖向每經(jīng)記者指出，公眾看到的是冠軍預(yù)測，企業(yè)展示的則是Agent協(xié)同、長上下文處理、實時檢索、概率解釋和高并發(fā)服務(wù)能力，商業(yè)上爭奪的則是用戶時長、付費轉(zhuǎn)化和資本敘事。

GXaOuDJovOrakGuvV1puNzeLhM5RhrUN7gTYUQdkKyodC1fLqiabicRwiaEGLHWwYr9NxOcYbOYcjpl0ARxiaUibxibeIkNXsBYkmElc2kRBv5TFo.png Kimi月之暗面公眾號

當(dāng)下，AI大模型的競爭早已不局限于單純的參數(shù)榜單，而是從“會聊天”轉(zhuǎn)向“能辦事”，從“比模型”轉(zhuǎn)向“比場景”。然而，《Build for the Future 2025》全球研究顯示，在調(diào)研全球1250多家企業(yè)后，僅5%的公司實現(xiàn)了AI價值的規(guī)?；瘧?yīng)用。Gartner數(shù)據(jù)也顯示，截至2025年底，嵌入真正AI Agent的企業(yè)應(yīng)用占比不足5%。

胡延平觀察到，大模型和智能體正從對話走向任務(wù)，從預(yù)訓(xùn)練走向持續(xù)學(xué)習(xí)，從數(shù)據(jù)語料走向持續(xù)多維的現(xiàn)實感知?！邦A(yù)測世界杯這類探索項目會加速這個進化過程。未來行動智能體所需要的能力體系，也是在走向‘感知－交互－決策－協(xié)同’這個方向?！?/span>

不過，王巖坦言，世界杯預(yù)測可以成為Agent能力的公開壓力測試，但不能自動證明Agent能力提升，大模型在這場押注中訓(xùn)練和檢驗的是長任務(wù)組織、概率校準(zhǔn)和用戶交互能力。

“Kimi的300個Agent代表分析覆蓋面增加，不直接代表預(yù)測準(zhǔn)確率提升。相關(guān)Agent任務(wù)Token消耗研究顯示，同一任務(wù)的Token消耗可相差幾十倍，更多Token并不必然帶來更高準(zhǔn)確率。同樣，相關(guān)Prediction Arena研究也顯示，多個前沿模型在Kalshi真實預(yù)測市場57天交易測試中最終收益為-16.0%至-30.8%，研究量與結(jié)果沒有相關(guān)性?！蓖鯉r向每經(jīng)記者進一步分析道。

正如王巖所言：“當(dāng)前Agent的最大缺口，正在從‘能否給出合理計劃’轉(zhuǎn)向‘能否穩(wěn)定完成長周期真實任務(wù)’?！边@意味著，誰能率先落地“實戰(zhàn)能力”，誰就將有機會在愈發(fā)激烈的爭奪賽中脫穎而出。

（免責(zé)聲明：文章內(nèi)容和數(shù)據(jù)僅供參考，不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。）

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png