

新眸原创·作家 | 桑明强
作念科技不雅察这些年,我有个很直不雅的感受:每个行业都有我方的 "战报周期"。
前两年AI圈的战报永久绕不开几个数字:参数范围、高下文窗口、Token价钱、API调用量。每次大厂开发布会,台下东说念主最存眷的问题永久是:你们家模子刻下撑握些许Token了?每百万Token些许钱?
Token就像出动互联网时间的DAU,成了预计一家科技公司AI实力的硬圭表。谁的Token低廉,谁的Token处理量大,谁就简略更接近行业牌桌的中心。
但本年以来,模子API价钱持续快速下探。5月DeepSeek把V4-Pro的价钱打下来之后,缓存射中的输入价钱也曾低至0.025元每百万Tokens。行业里有东说念主算了一笔账,刻下写一篇十万字的演义,模子处理资本不到三块钱。
这激发了一个新规画:当Token越来越低廉,Token自己还攻击吗?
当一件东西的资本无尽趋近于零,它就不再是中枢竞争力,而变成了基础措施。就像今天莫得东说念主会因为宽带低廉就选拔一家互联网职业商,异日也不会有企业只因为Token低廉,就把中枢业务系统交给某一家AI云职业商。
问题随之变化了:当Token最终都会变成水电相通的基础资源,接下来2026世界杯亚盘该拼什么?
谜底不是谁能摧毁更多Token,而是谁能用更少Token完成更复杂的任务;不是谁能把模子单点才气作念得更漂亮,而是谁能把模子、算力、器用、数据和业务经由真确组织起来,委用可考证的结果。
换句话说,AI云的下半场,拼的是谁能落地。
01
落地不是单点才气
而是系统才气
本年5月的百度Create大会,李彦宏提倡了一个值得关注的判断:插足智能体时间,预计一个平台和生态的繁华,更应该看的是DAA这个看法,关注有些许Agent在给东说念主类干活,并委用结果。这比Token摧毁更接近价值,也更接近骨子。
而Agent要真确干活,背后就需要AI云厂商的全栈AI才气。非凡是关于企业级花式,时常不是肤浅接入一个模子API就终局了。它需要芯片和模子适配,需要推理资本优化,需要和既有业务系统买通,把职工原有职责流重新组织起来,作念好数据治理、权限为止……任何一个门径没作念好,Agent都难以从Demo走向坐褥环境。
往日,许多东说念主对全栈AI的认知还停留在工夫栈的完满度上。只须有芯片、有模子、有云、有诳骗,就叫全栈。但在企业客户现场,真确有价值的全栈不是“我什么都有”,而是“我不错把这些才气整合成一个可委用、可运维、可握续优化的业务系统”。
前阵子听百度智能云伐谋里面推敲会的共享,有个制造业大客户的案例印象很久了:这个花式的标的是作念一个资源运营智能体,触及复杂的业务经由、企业数据,委用难度很大。昨年一个雷同的花式,是一个大厂寄予30位高工驻场6个月集会攻关作念的。而百度这个花式只去了两个东说念主,其中一位如故实习生。终末上线到确切的坐褥系统上,错误看法晋升了跳动10%。
这个案例真恐怕得规画的,不是谁派了些许东说念主,而是背后的后果差。几十东说念主的团队,意味着要分好几个小组,每个小组算力、数据、模子、诳骗各管一段,出了问题要层层疏导,需求变更要反复对王人。而两个东说念主的团队,意味着每个东说念主都能买通从底层算力到表层诳骗的全链路,遭逢问题就地就能定位,养息决策今日就能落地。
当一条工夫链路被拆给多个供应商、多个团队分别正经时,客户需求每变化一次,协同的时期和资本就会被放大一次:算力要重新适配,模子要重新调优,推理系统要重新优化,Agent实现也要随着养息。名义上看,客户买到的是不同门径的居品和工夫;执行上承担的,是整条链路反复磨合的资本。
而全栈AI厂商,不错把这些门径买通,裁减委用周期和资本。不仅如斯,因为算力、模子和Agent运行在合并套体系里,厂商不错联动优化、和解调度、握续反映,系统性晋升性能、裁减资本。
这亦然近期全栈AI被各大厂商视为攻击计谋标的的真确原因。

招商银行的例子更有代表性。
刻下招行也曾上线了跳动800个AI智能体,褪色风控、营销、研发、办公险些统统中枢场景,其中一半以上跑在昆仑芯的国产算力上。
试思,如果莫得全栈才气,这些事情需要找芯片厂商、模子厂商、云厂商、集成商好几家公司一齐作念,看似每个门径都有专科供应商正经,但一朝插足委用门径,系统兼容性、委用认知性、累赘畛域离别以及后续运维保险等错误问题会变得极端复杂。
百度此次升级的新全栈AI云,骨子上是把往日在里面跑通的垂直整合才气,变成了对外输出的圭表化居品。Agent层面把单元Token的智能水平作念到最佳,让智能体更好地完成任务;算力层面把每瓦性能和性价比作念到极致。两层才气高效整合,端到端优化,实现全体性能最大化。客户不需要存眷底层的工夫细节,只需要存眷我方的业务问题能不成科罚。
AI落地难,但落地从来都不是工夫问题,是工程问题,是协同问题,是资本问题。全栈AI真确要科罚的也恰是这类问题——要用更高效的系统,让AI更快插足到中枢业务场景,把工夫才气曲折成业务结果。
02卡位战的窗口,正在收窄
如果说昨年公共还在规画智能体是不是噱头,本年一季度中标数据也曾给出更现实的谜底。
数据统计,一季度国内主要云厂商大模子干系的中标花式一共85个,总金额16.5亿。
当行业从“模子才气比拼”插足“落地才气终局”阶段,谁能真确拿下花式、插足客户坐褥系统,驱动成为新的竞争标尺。
在这组数据里,百度智能云的最初尽头彰着:一季度拿下25个花式,中标金额12.48亿元,金额是第二名的五倍以上。
如果把时期再拉长,趋势会更彰着。昨年,百度智能云也曾以48个中标花式、5.1亿元中标金额,成为国内云厂商大模子花式“中标王”。
开云体育·(KAIYUN SPORTS)官方网站这些数字的背后,更值得关注的,是这些花式的属性。金融、制造、动力、通讯、政务、大交通等,都是高信任、高合规、高迁徙资本的行业。非凡是触及到央国企的中枢业务系统,他们落地AI,不是为了短期试点,是要真确把AI才气镶嵌确切业务经由,甚而插足坐褥系统。
比如,2026世界杯指数国度电网的营销供电决策智能体,实现了企业办电经由的全面智能;金融行业的智能助理,也曾浸透到不少银行每个职工的庞大职责;运营商的基础措施花式,时常是数亿级别的历久征战。
而这些,都也曾落到了第一梯队厂商的手里。
市集花式也曾日渐了了:第一梯队的厂商拿走了险些统统的高价值场景,第二梯队的厂商只可抢剩下的角落花式,第三梯队的也曾驱动退出市集。
企业级市集的游戏规章从来都是这么:一朝某个供应商跑通了某个行业的中枢场景,居品与客户经由深度绑定,职工也酿成了新的使用习气,其后者再思插足,就必须面对很高的迁徙资本。企业客户不会为了轻细的模子参数各异,松驰推翻也曾跑在坐褥环境里的系统。
这便是卡位战最夸口的场合:窗口唯有一次,错过了便是错过了。
雷同的逻辑,放到刻下火热的通用智能体赛说念,依旧诞生。无论是国外的Codex,如祖国内的百度搭子DuMate、WorkBuddy、Trae Work……谁能更早插足确切职责流,谁就更有契机抢先占据用户心智、培养用户习气。刻下来看,百度搭子DuMate率先插足了企业级范围落地阶段。以华硕案例来讲,依托百度智能云建壮的Skills生态,用户只需通过当然谈话下达教唆,即可转念腹地软硬件,实现如邮件自动整理、数据多维分析、PPT智能生成等多项功能。
智能体真确的价值,并不来自某一个惊艳Demo,而来自洪水横流个具体场景中的后果晋升。比如自如的遐想师,基于秒哒代码智能体不错快速搭建AI遐想平台。“遐想师跟业主现场聊决策,就地就能出图。业主有新的思法,现场就改。”当这么的优化不休鸠合,从一个门径彭胀到更多经由,从一个岗亭褪色到更多扮装,从一个行业复制到更多行业……就会组成产业智能化简直切红利。
这个红利,只会属于最早卡位得手的厂商。
而这个卡位的窗口,正在快速关闭。
03AI云,是一门好生意
百度本年一季度的财报出来的时候,许多东说念主耀眼到AI业务收入占比初次跳动50%。但从AI云角度看,更错误的是两个数字:AI云收入88亿,同比增长79%;GPU云收入同比增长184%。 更艰巨的是,这一增长是树立在2025年AI云全年同比增长34%的基础之上,是相接高增长后的进一步提速。这么的增速,即便放在全球AI云市集里,也称得上亮眼。
毫无疑问,AI云当作百度中枢增长引擎之一,是一门高增长的好生意。
不仅如斯,这个增长不是树立在单纯卖Token之上,而是来自智能体、模子、算力需求的共同放大。这给AI云带来了可不雅的利润空间。
在财报会上,百度暗示:GPU云在结构上具有高利润率特征。究其原因,GPU云不仅门槛更高、需求强盛,况兼高质地供给殷切、客户对资本接管度高。而自研芯片和全栈才气有契机进一步优化资本。更永久看,为AI智能体和诳骗自己付费的市集范围,可能会大于单纯按Token计费的市集。
放眼全球市集,雷同趋势也在发生。拿谷歌来讲,本年一季度,谷歌云收入同比增长63%,营业利润率达32.9%,同比晋升15.7%,其中,未完成订单量环比险些翻倍,数据号称亮眼。亚马逊、微软、甲骨文等头部公司,“AI云”业务也有不同进度的增长。
AI云是一门好生意,但它并不是一门减轻的生意。
硬币的另一面是,AI云竞争正在演变成芯片、模子、推理平台、数据工程和诳骗委用的系统工程竞争。只卖算力,容易堕入价钱战;只卖模子,容易被更低廉的API替代;只卖诳骗,又会受制于底层资本和才气畛域。
真确有契机树立壁垒的,是充分弘扬全栈AI的后果上风,把AI曲折成客户空闲握续付费的业务结果。
04好生意要握续检修的是计谋的耐烦
但很少有东说念主看到,这些亮眼数字的背后,是更难受的计谋选拔。
尤其当GPU资源殷切时,云厂商必须请问一个现实问题:贵重的算力,到底应该优先投向那儿?
接近百度智能云的东说念主士告诉《新眸》,就在前不久一次里面治理层推敲会上,这个问题也当作中枢议题被反复规画。
这不是一个肤浅的计算打算问题,而是对异日AI买卖模式的判断。
如果把资源过度投向MaaS,短期内Token数据一定面子。但Token生意骨子上是流量生意,莫得护城河。一朝价钱战持续下探,终末公共都没钱赚。相悖,如果把错误资源投向自研模子和智能体基建,历久会酿成更高质地的买卖化才气,但短期内销售团队会面对重大压力。
这很容易让我联思到微软和谷歌,在AI时间,他们的中枢治理层都阅历过雷同的难受抉择。
百度智能云刻下的旅途,更接近后者:不把GPU全部投给短期Token收入,而是优先保险自研模子和历久工夫底座的征战,再笔据花式情况空洞ROI分派资源。同期,持续强化软硬件协同优化,晋升训推系统性能,用历久系统才气换异日更高质地的买卖化。
这是一条更难也更慢的路。据里面东说念主士显现,此前沈抖还给统统治理层和全员共享了《论握久战》的片断。按照沈抖的说法,作念ToB业务,应该作念的是树而不是草:只如果树,就会无时无刻的孕育;如果是草,无论何等焕发,一到秋天就会枯萎,第二年只可重来。
AI行业往日两年的竞争,时常被包装成一场百米竞走,谁模子发布得快,谁价钱降得多,谁调用量冲得高,谁简略就要赢了。
但AI云是一场马拉松。短期战报攻击,但更攻击的是能否把中枢资源投向历久价值,能否树立起真确的全栈才气,能否握续拿到高价值落地场景,并在这些场景里不休裁减资本、将每一个Token都曲折成故道理的业务结果。
Token战也曾终结了。
接下来,是属于落地者的时间。