疯狂扩产的“Token工厂”:营收数十倍增长上演资本狂欢,API价格战、端侧分流双重夹击 赛道盈利持续承压

wap (1) 2026-06-18 18:48:38

每经记者|赵雯琪    每经编辑|余婷婷    

当大模型竞赛从“参数军备”转向“应用落地”,一个隐秘而高增长的底层生意正在浮出水面——“Token工厂”(把人工智能能力拆解成最基础的计量单位“Token词元”,像自来水厂一样按需供应)。

6月16日,国内AI(人工智能)推理服务企业“硅基流动”官宣完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模型即服务)赛道最大单笔融资纪录。《每日经济新闻》记者了解到,这家成立不足三年的企业,过去一年日均Token吞吐量达数万亿量级,营收同比涨超十倍,还曾在11个月内连获三轮融资,成为一级市场炙手可热的标的。

无独有偶,5月,同赛道企业无问芯穹、魔形智能纷纷宣布融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。截至4月底,无问芯穹Agentic MaaS大模型服务平台的日均Token调用量相较于去年底已增长超20倍。

资本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与MaaS服务、全行业API(应用程序编程接口)定价陷入白热化竞争、端侧轻量化模型持续分流云端Token调用需求。多重挤压之下,“Token工厂”普遍陷入业务规模高速扩张、盈利空间不断收窄的矛盾局面,如何走出增收不增利的困局成为赛道核心议题。

产业资本扎堆入局 “Token工厂”成AI落地核心赛道

一笔20亿元级融资,将“Token工厂”赛道再次推至聚光灯下。

据硅基流动官方披露,本轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络等二十余家机构联合投资。至此,硅基流动已获得能源、芯片、算力基础设施、云服务、大模型及场景应用等AI全产业链企业投资,产业资本在本轮融资中占比显著提升。

这并非赛道首笔大额融资。今年5月,同赛道玩家无问芯穹刚完成超7亿元融资;海外市场中,Fireworks AI成立四年目标估值达150亿美元,日处理Token规模15万亿。短短一年时间,“Token工厂”已从AI产业链边缘环节,跃升为一级市场的核心赛道。

资本热捧的底层逻辑,是AI需求结构的根本性切换。

大模型能力每迈上一个台阶,就解锁一大类应用,应用反过来又提升了底层Token消耗量。据国家数据局相关数据,2024年初中国日均Token调用量为1000亿;至2025年底跃升至100万亿;今年3月已突破140万亿,两年增长超千倍。

全球知名咨询机构IDC最新发布的《中国AI软件市场半年度追踪,2025H2》数据显示:2024年中国企业级MaaS市场调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS市场规模达30.7亿元,增速远超AI行业整体水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在持续推高Token消耗规模。

IDC预测,2026年中国MaaS市场的Token消耗量将达到40000万亿,较2025年再增约20倍。

从商业模式本质来看,Token工厂并非简单的算力转售,核心是将芯片适配、模型部署、推理引擎调优、异构算力调度等复杂工程能力,封装为标准化API接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重投入,大幅降低了AI落地的技术门槛与成本周期。

面对海量的市场需求爆发,大规模、高性价比Token的稳定供应,正成为影响AI技术规模化落地的关键能力。

天使投资人、资深人工智能专家郭涛接受《每日经济新闻》记者采访时表示,从“卖模型”到“卖Token”是AI产业商业化的重要演进。Token作为大模型处理信息的最小单元,具备可计量、可定价、可交易的特性,将AI智能能力转化为可标准化交易的大宗商品,解决了AI能力难以量化的行业痛点,推动行业从定制化服务模式转向标准化、规模化变现模式,长期来看这门生意具备较好的可持续性。

中金公司研报显示,“Token工厂”模式已成为全球大模型厂商的主流商业化路径,海外头部企业Anthropic年度经常性收入突破300亿美元。盈利层面,当前海外头部大模型API业务毛利率普遍在40%至50%,国内大模型厂商MaaS API业务毛利略低于海外,预计今年将达到20%至40%,随着规模效应释放与技术优化,长期仍有上行空间。

大厂下场、API价格战白热化、端侧AI快速普及⋯⋯“Token工厂”盈利承压

不过,头部企业营收十倍增长的亮眼数据背后,赛道隐忧始终存在。随着互联网大厂下场布局、API价格战白热化,“Token工厂”的商业模式边界与增长天花板正被重新审视。

大厂亲自下场是最直接的行业变量。

6月8日,阿里巴巴宣布组织架构调整,将通义大模型事业部与未来生活实验室整合,成立全新Token Foundry事业部,由集团CEO(首席执行官)吴泳铭直接负责。此前3月,阿里成立ATH(Alibaba Token Hub)事业群,已经喊出了“创造Token、输送Token、应用Token”的核心目标。

将Token生产提升至集团战略级,背后是大厂对推理服务入口价值的重估:Token产能既是支撑自身电商、云服务、本地生活等业务AI化的基础,也是阿里云对外输出MaaS服务的核心产能。

郭涛认为,大厂全面入场后,独立第三方“Token工厂”仍有生存空间。他向记者表示,大厂虽有技术、资源和生态优势,但市场需求多样且复杂,难以覆盖所有领域和场景。独立第三方可聚焦特定垂直领域提供个性化、定制化服务,或深耕特定技术优化,针对某类模型或场景提升Token生成效率与质量。此外,部分企业出于数据安全、避免过度依赖单一厂商的考量,也会选择与独立第三方合作。

API价格战持续白热化,则是当前“Token工厂们”面临的最直接盈利压力。

自2023年以来,头部大模型厂商已累计十余次下调API价格,部分主流模型千Token价格从最初的数毛钱降至几分钱,累计降幅超90%。缺乏核心优化能力、仅靠算力差价盈利的中间商型玩家已率先陷入亏损。

今年5月,DeepSeek官方宣布V4-Pro模型API永久降价,整体降幅75%,百万Token输出价格为6元。随后,小米、腾讯云纷纷跟进,小米旗下MiMo-V2.5系列API永久降价,最高降幅达99%,Pro版定价与DeepSeek V4-Pro完全对齐。腾讯云自6月3日0时起,对DeepSeek-V4系列模型调用价格进行大幅下调,最高降幅达到97.5%,调整后价格全面持平DeepSeek官方售价。

业内普遍认为,若“Token工厂”效率提升的速度跟不上价格下降速度,商业模式的可持续性将直接面临挑战。

此外,端侧AI的快速普及,则从需求端分流市场。随着手机、PC(个人电脑)等终端设备的端侧大模型能力升级,大量轻量级推理任务向端侧迁移,无需调用云端Token。行业普遍预测,未来30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长上下文的核心推理需求仍依赖云端,但端侧分流无疑收窄了云端“Token工厂”的整体增长天花板。

与此同时,头部客户自建推理集群的趋势也在蚕食第三方市场份额。金融、能源、政务等数据敏感型行业出于合规考量,更倾向私有化部署;头部互联网企业随着业务规模扩大,自建算力集群的单位成本已低于第三方采购,纷纷转向自建。第三方“Token工厂”的核心客群,可能逐步向中小企业、长尾应用与弹性需求场景集中,市场定位面临重构。

对于“Token工厂”赛道的泡沫争议,郭涛向记者表示,目前市场确实存在一定泡沫迹象。大量资本涌入下,部分企业为追求规模盲目扩张,忽视实际成本与盈利情况。但整体而言,AI发展是大势所趋,Token经济作为其商业化关键模式有着真实需求支撑,只是市场需要经历调整与整合。

谈及破局路径与行业终局,郭涛认为,“Token工厂”可通过提升算力利用效率、优化能耗降低运营成本,通过分级服务实现差异化定价获取溢价,还可配套模型优化建议、技术支持等增值服务拓展收入来源。

“长期来看,市场更可能形成多层次、差异化的竞争格局:头部大厂凭借实力占据通用型大规模市场,中小‘Token工厂’凭借特色服务深耕细分领域,形成错位竞争,共同构成多元的市场生态。”郭涛表示。

THE END