每日經(jīng)濟新聞 2026-04-21 19:52:15
每經(jīng)記者|宋欣悅 每經(jīng)編輯|楊軍
連漲十周之后,全球AI(人工智能)大模型的Token(詞元)調(diào)用量踩了剎車。
《每日經(jīng)濟新聞》記者根據(jù)OpenRouter(目前全球最大AI模型應(yīng)用程序編程接口聚合平臺)最新數(shù)據(jù)測算,4月13日至19日全球AI大模型總調(diào)用量為20.6萬億Tokens,連續(xù)兩周走低。
值得注意的是,上榜的AI大模型中,中國AI大模型周調(diào)用量環(huán)比下跌23.77%至4.44萬億Tokens,而美國AI大模型周調(diào)用量環(huán)比增長20.62%至4.91萬億Tokens,近兩個月來首次反超。
這場逆轉(zhuǎn),與一輪席卷全球的算力漲價潮高度吻合。
轉(zhuǎn)折點源于算力成本上漲
全球調(diào)用量從連漲十周到轉(zhuǎn)頭向下,轉(zhuǎn)折點源于全球性的算力成本上漲。
自3月以來,以阿里云、騰訊、百度為代表的云廠商相繼上調(diào)大模型相關(guān)服務(wù)價格。
4月8日,智譜發(fā)布GLM-5.1的同時再度提價10%,從而完成今年第三次調(diào)價。
海外AI巨頭Anthropic同樣調(diào)整了定價策略,將旗下企業(yè)級產(chǎn)品Claude Enterprise的訂閱模式從每月每用戶最高200美元固定費用改為按實際算力消耗計費,另加每月20美元固定費。
這意味著,輕度用戶月費可能有所下降,但重度用戶反而更貴。軟件授權(quán)談判協(xié)助公司Redress Compliance聯(lián)合創(chuàng)始人Fredrik Filipsson表示,新定價可能導(dǎo)致重度用戶成本翻倍甚至3倍。
國產(chǎn)模型產(chǎn)品力迎大考
“Token資費普遍上漲,成本增高,用戶不得不控制總量節(jié)約成本?!鄙虾X斀?jīng)大學特聘教授胡延平告訴《每日經(jīng)濟新聞》記者,當價格優(yōu)勢不再突出,模型的產(chǎn)品力便成為左右用戶選擇的關(guān)鍵。
胡延平分析,上周美國AI大模型調(diào)用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉動。這兩款模型已成為編程領(lǐng)域的“硬通貨”,而國產(chǎn)大模型在這方面的產(chǎn)品力仍需提升。
OpenRouter數(shù)據(jù)顯示,上周,Claude Sonnet4.6沖上榜首,周調(diào)用量達1.38萬億Tokens,環(huán)比增長19%。Claude Opus4.6位居第三,周調(diào)用量達1.22萬億Tokens。兩款模型合計占美國AI大模型周調(diào)用量逾五成。
與此形成對比的,是近期國產(chǎn)模型的過山車行情。
在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66萬億Tokens的周調(diào)用量居全球榜首,但僅過一周(4月13日至19日)便下滑出榜單。
此外,記者注意到,此前多次上榜的Kimi K2.5、智譜GLM系列模型,已連續(xù)三周未登榜。此前一度沖上榜單第二的階躍星辰Step 3.5 Flash,近兩周同樣無緣榜單。
胡延平認為,OpenRouter平臺的用戶以開發(fā)者和中小企業(yè)為主,對模型迭代能力和垂直場景產(chǎn)品力要求極高?!笆袌鲇脩粲型^部主力模型集中的趨向,在能夠觸達的范圍內(nèi),用戶只用最好的。”他指出,用戶場景越來越要求模型具備強工具調(diào)用能力、多Agent(智能體)支持、長程復(fù)雜任務(wù)的持續(xù)達成能力,目前OpenRouter上的大部分模型在這方面還需著力提升。
有業(yè)內(nèi)人士也向《每日經(jīng)濟新聞》記者指出,算力成本上漲后,行業(yè)內(nèi)普遍優(yōu)先選擇性能穩(wěn)定、輸出效果可靠的工具,價格已非首要考量。
消耗量仍處快速增長通道
短期數(shù)據(jù)波動是否意味著AI應(yīng)用熱潮正在消退?
“短期還不宜下結(jié)論?!焙悠教嵝?,OpenRouter的Token調(diào)用量僅占全球消耗總量的2%~4%,其排名波動更多反映的是開源、二線及新發(fā)模型的競爭態(tài)勢,不能代表整個市場的走向。
事實上,成本壓力正在倒逼市場進化。胡延平觀察到,今年初以來,OpenClaw等各類智能體、多Agent應(yīng)用已將Token調(diào)用量拉升至去年底的兩三倍水平。成本大幅抬高,促使企業(yè)和用戶轉(zhuǎn)而采用記憶優(yōu)化、提示詞壓縮等手段主動降耗。
記者了解到,甚至有中小創(chuàng)業(yè)者已將Token使用量納入員工績效考核。市場正從單純追求數(shù)量階段,進化到追求更高投入產(chǎn)出比的提效階段。
更深層的變化在于AI應(yīng)用場景本身的質(zhì)變。國聯(lián)民生證券一份研報提出“Token通脹”的概念。這并非指Token本身變貴,而是指單位時間內(nèi),單位用戶的Token消耗結(jié)構(gòu)性上升。
用戶的需求正從淺層的“問答”轉(zhuǎn)向深度的“干活”。Token不是傳統(tǒng)互聯(lián)網(wǎng)時代邊際成本幾乎為零的流量,而是執(zhí)行生產(chǎn)任務(wù)時必不可少的燃料。
摩根大通在研報中對中國市場作出極為樂觀的預(yù)測,預(yù)計2025年至2030年,中國Token消耗量的年復(fù)合增長率將達330%,5年內(nèi)將實現(xiàn)370倍增長。
胡延平同樣對長期趨勢保持樂觀態(tài)度:“就中長期而言,無論OpenRouter上的統(tǒng)計數(shù)據(jù)如何波動,包括中國在內(nèi),全球Token消耗總量都處在快速增長通道,未來兩三年會有數(shù)十倍甚至數(shù)百倍的增加?!?/p>
眼下的調(diào)用量下滑,或許只是價格沖擊下的一次短暫換倉。真正的問題不是AI熱潮是否消退,而是當Token從免費試用走向真實定價,誰的模型經(jīng)得起市場用真金白銀來投票。
封面圖片來源:新華社
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP