2026-06-18 17:49:37
隨著大模型競賽轉(zhuǎn)向應(yīng)用落地,“Token工廠”成為高增長的底層生意。硅基流動近日完成超20億元B輪融資,同賽道企業(yè)也紛紛宣布融資。資本熱捧下,“Token工廠”業(yè)務(wù)規(guī)模高速擴張,但盈利空間收窄。大廠入場、API價格戰(zhàn)、端側(cè)AI普及使“Token工廠”盈利承壓。業(yè)界認為,可通過提升效率、分級服務(wù)、提供增值服務(wù)破局,未來市場將形成多層次、差異化競爭格局。
每經(jīng)記者|趙雯琪 每經(jīng)編輯|余婷婷
當大模型競賽從“參數(shù)軍備”轉(zhuǎn)向“應(yīng)用落地”,一個隱秘而高增長的底層生意正在浮出水面——“Token工廠”(把人工智能能力拆解成最基礎(chǔ)的計量單位“Token詞元”,像自來水廠一樣按需供應(yīng))。
6月16日,國內(nèi)AI(人工智能)推理服務(wù)企業(yè)“硅基流動”官宣完成超20億元B輪融資,創(chuàng)下2026年以來國內(nèi)第三方MaaS(模型即服務(wù))賽道最大單筆融資紀錄。《每日經(jīng)濟新聞》記者了解到,這家成立不足三年的企業(yè),過去一年日均Token吞吐量達數(shù)萬億量級,營收同比漲超十倍,還曾在11個月內(nèi)連獲三輪融資,成為一級市場炙手可熱的標的。
無獨有偶,5月,同賽道企業(yè)無問芯穹、魔形智能紛紛宣布融資。其中,無問芯穹再獲超7億元融資,累計融資額超22億元。截至4月底,無問芯穹Agentic MaaS大模型服務(wù)平臺的日均Token調(diào)用量相較于去年底已增長超20倍。
資本狂熱加碼的另一面,頭部互聯(lián)網(wǎng)大廠全面落地自研推理算力與MaaS服務(wù)、全行業(yè)API(應(yīng)用程序編程接口)定價陷入白熱化競爭、端側(cè)輕量化模型持續(xù)分流云端Token調(diào)用需求。多重擠壓之下,“Token工廠”普遍陷入業(yè)務(wù)規(guī)模高速擴張、盈利空間不斷收窄的矛盾局面,如何走出增收不增利的困局成為賽道核心議題。
一筆20億元級融資,將“Token工廠”賽道再次推至聚光燈下。
據(jù)硅基流動官方披露,本輪融資由攜程戰(zhàn)投、晶科能源控股、金蝶股份、聯(lián)通新沃、盛奕資本(潤澤集團產(chǎn)業(yè)資本)、壁仞戰(zhàn)投、蔚來資本、商湯戰(zhàn)投、巨人網(wǎng)絡(luò)等二十余家機構(gòu)聯(lián)合投資。至此,硅基流動已獲得能源、芯片、算力基礎(chǔ)設(shè)施、云服務(wù)、大模型及場景應(yīng)用等AI全產(chǎn)業(yè)鏈企業(yè)投資,產(chǎn)業(yè)資本在本輪融資中占比顯著提升。
圖片來源:硅基流動公眾號
這并非賽道首筆大額融資。今年5月,同賽道玩家無問芯穹剛完成超7億元融資;海外市場中,F(xiàn)ireworks AI成立四年目標估值達150億美元,日處理Token規(guī)模15萬億。短短一年時間,“Token工廠”已從AI產(chǎn)業(yè)鏈邊緣環(huán)節(jié),躍升為一級市場的核心賽道。
資本熱捧的底層邏輯,是AI需求結(jié)構(gòu)的根本性切換。
大模型能力每邁上一個臺階,就解鎖一大類應(yīng)用,應(yīng)用反過來又提升了底層Token消耗量。據(jù)國家數(shù)據(jù)局相關(guān)數(shù)據(jù),2024年初中國日均Token調(diào)用量為1000億;至2025年底躍升至100萬億;今年3月已突破140萬億,兩年增長超千倍。
全球知名咨詢機構(gòu)IDC最新發(fā)布的《中國AI軟件市場半年度追蹤,2025H2》數(shù)據(jù)顯示:2024年中國企業(yè)級MaaS市場調(diào)用量僅114萬億Token,2025年躍升至1944萬億Token,同比增長約16倍;2025年公有云MaaS市場規(guī)模達30.7億元,增速遠超AI行業(yè)整體水平。Agent智能體普及、多模態(tài)應(yīng)用落地、行業(yè)數(shù)字化轉(zhuǎn)型三大趨勢,仍在持續(xù)推高Token消耗規(guī)模。
圖片來源:IDC官方公眾號
IDC預(yù)測,2026年中國MaaS市場的Token消耗量將達到40000萬億,較2025年再增約20倍。
從商業(yè)模式本質(zhì)來看,Token工廠并非簡單的算力轉(zhuǎn)售,核心是將芯片適配、模型部署、推理引擎調(diào)優(yōu)、異構(gòu)算力調(diào)度等復(fù)雜工程能力,封裝為標準化API接口??蛻舭葱枵{(diào)用、按量付費,省去了企業(yè)自建集群、組建運維團隊的重投入,大幅降低了AI落地的技術(shù)門檻與成本周期。
面對海量的市場需求爆發(fā),大規(guī)模、高性價比Token的穩(wěn)定供應(yīng),正成為影響AI技術(shù)規(guī)?;涞氐年P(guān)鍵能力。
天使投資人、資深人工智能專家郭濤接受《每日經(jīng)濟新聞》記者采訪時表示,從“賣模型”到“賣Token”是AI產(chǎn)業(yè)商業(yè)化的重要演進。Token作為大模型處理信息的最小單元,具備可計量、可定價、可交易的特性,將AI智能能力轉(zhuǎn)化為可標準化交易的大宗商品,解決了AI能力難以量化的行業(yè)痛點,推動行業(yè)從定制化服務(wù)模式轉(zhuǎn)向標準化、規(guī)?;儸F(xiàn)模式,長期來看這門生意具備較好的可持續(xù)性。
中金公司研報顯示,“Token工廠”模式已成為全球大模型廠商的主流商業(yè)化路徑,海外頭部企業(yè)Anthropic年度經(jīng)常性收入突破300億美元。盈利層面,當前海外頭部大模型API業(yè)務(wù)毛利率普遍在40%至50%,國內(nèi)大模型廠商MaaS API業(yè)務(wù)毛利略低于海外,預(yù)計今年將達到20%至40%,隨著規(guī)模效應(yīng)釋放與技術(shù)優(yōu)化,長期仍有上行空間。
不過,頭部企業(yè)營收十倍增長的亮眼數(shù)據(jù)背后,賽道隱憂始終存在。隨著互聯(lián)網(wǎng)大廠下場布局、API價格戰(zhàn)白熱化,“Token工廠”的商業(yè)模式邊界與增長天花板正被重新審視。
大廠親自下場是最直接的行業(yè)變量。
圖片來源:每經(jīng)記者 張涵 攝
6月8日,阿里巴巴宣布組織架構(gòu)調(diào)整,將通義大模型事業(yè)部與未來生活實驗室整合,成立全新Token Foundry事業(yè)部,由集團CEO(首席執(zhí)行官)吳泳銘直接負責。此前3月,阿里成立ATH(Alibaba Token Hub)事業(yè)群,已經(jīng)喊出了“創(chuàng)造Token、輸送Token、應(yīng)用Token”的核心目標。
將Token生產(chǎn)提升至集團戰(zhàn)略級,背后是大廠對推理服務(wù)入口價值的重估:Token產(chǎn)能既是支撐自身電商、云服務(wù)、本地生活等業(yè)務(wù)AI化的基礎(chǔ),也是阿里云對外輸出MaaS服務(wù)的核心產(chǎn)能。
郭濤認為,大廠全面入場后,獨立第三方“Token工廠”仍有生存空間。他向記者表示,大廠雖有技術(shù)、資源和生態(tài)優(yōu)勢,但市場需求多樣且復(fù)雜,難以覆蓋所有領(lǐng)域和場景。獨立第三方可聚焦特定垂直領(lǐng)域提供個性化、定制化服務(wù),或深耕特定技術(shù)優(yōu)化,針對某類模型或場景提升Token生成效率與質(zhì)量。此外,部分企業(yè)出于數(shù)據(jù)安全、避免過度依賴單一廠商的考量,也會選擇與獨立第三方合作。
API價格戰(zhàn)持續(xù)白熱化,則是當前“Token工廠們”面臨的最直接盈利壓力。
自2023年以來,頭部大模型廠商已累計十余次下調(diào)API價格,部分主流模型千Token價格從最初的數(shù)毛錢降至幾分錢,累計降幅超90%。缺乏核心優(yōu)化能力、僅靠算力差價盈利的中間商型玩家已率先陷入虧損。
今年5月,DeepSeek官方宣布V4-Pro模型API永久降價,整體降幅75%,百萬Token輸出價格為6元。隨后,小米、騰訊云紛紛跟進,小米旗下MiMo-V2.5系列API永久降價,最高降幅達99%,Pro版定價與DeepSeek V4-Pro完全對齊。騰訊云自6月3日0時起,對DeepSeek-V4系列模型調(diào)用價格進行大幅下調(diào),最高降幅達到97.5%,調(diào)整后價格全面持平DeepSeek官方售價。
圖片來源:IDC官方公眾號
業(yè)內(nèi)普遍認為,若“Token工廠”效率提升的速度跟不上價格下降速度,商業(yè)模式的可持續(xù)性將直接面臨挑戰(zhàn)。
此外,端側(cè)AI的快速普及,則從需求端分流市場。隨著手機、PC(個人電腦)等終端設(shè)備的端側(cè)大模型能力升級,大量輕量級推理任務(wù)向端側(cè)遷移,無需調(diào)用云端Token。行業(yè)普遍預(yù)測,未來30%至50%的推理需求將在端側(cè)完成,盡管高復(fù)雜度、多模態(tài)、長上下文的核心推理需求仍依賴云端,但端側(cè)分流無疑收窄了云端“Token工廠”的整體增長天花板。
與此同時,頭部客戶自建推理集群的趨勢也在蠶食第三方市場份額。金融、能源、政務(wù)等數(shù)據(jù)敏感型行業(yè)出于合規(guī)考量,更傾向私有化部署;頭部互聯(lián)網(wǎng)企業(yè)隨著業(yè)務(wù)規(guī)模擴大,自建算力集群的單位成本已低于第三方采購,紛紛轉(zhuǎn)向自建。第三方“Token工廠”的核心客群,可能逐步向中小企業(yè)、長尾應(yīng)用與彈性需求場景集中,市場定位面臨重構(gòu)。
對于“Token工廠”賽道的泡沫爭議,郭濤向記者表示,目前市場確實存在一定泡沫跡象。大量資本涌入下,部分企業(yè)為追求規(guī)模盲目擴張,忽視實際成本與盈利情況。但整體而言,AI發(fā)展是大勢所趨,Token經(jīng)濟作為其商業(yè)化關(guān)鍵模式有著真實需求支撐,只是市場需要經(jīng)歷調(diào)整與整合。
談及破局路徑與行業(yè)終局,郭濤認為,“Token工廠”可通過提升算力利用效率、優(yōu)化能耗降低運營成本,通過分級服務(wù)實現(xiàn)差異化定價獲取溢價,還可配套模型優(yōu)化建議、技術(shù)支持等增值服務(wù)拓展收入來源。
“長期來看,市場更可能形成多層次、差異化的競爭格局:頭部大廠憑借實力占據(jù)通用型大規(guī)模市場,中小‘Token工廠’憑借特色服務(wù)深耕細分領(lǐng)域,形成錯位競爭,共同構(gòu)成多元的市場生態(tài)?!惫鶟硎?。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP