中国AI堆栈竞争:效率重于规模,令牌变现成新战场
核心论点
中国AI竞争已从孤立模型创新转向全堆栈竞争,涵盖芯片、云和令牌。在美国出口管制下,中国企业被迫优化算力效率而非仅依赖规模。这一约束加速了国产芯片与美国同行的性能趋同,并通过令牌消费激增创造变现飞轮。胜出者将是那些垂直整合芯片设计、云基础设施和令牌定价的企业,而非拥有最大训练集群的玩家。
市场可能低估之处
市场低估了中国AI公司在供应限制下缩小GPU性能差距的速度。2026年3月至4月的多份报告显示,在架构优化和先进封装支持下,中国自研AI加速器正在缩小与英伟达最新产品的性能差距。此外,以推理令牌量衡量的令牌经济正以超预期速度加速,AI云收入于2026年上半年进入变现阶段。那种认为中国落后2-3算力代的普遍观点已经过时;真实故事是压缩式追赶曲线和令牌变现周期,它反映了2017-2019年早期云收入增长的轨迹。
证据链
证据1:国产芯片通过全栈自研削弱英伟达护城河
中国AI领导者正投资定制ASIC和GPU架构以摆脱对英伟达的依赖。《中国AI之路:通过自研芯片拥有全AI堆栈》(2026年3月11日)指出战略转向专有加速器。同时,《中国AI GPU——缩小与美国差距》(同日)基准测试显示,最佳国产芯片在关键推理工作负载上达到H100代的60-70%性能,预计2027年底达到80%。这不是孤例;4月26日的《中国AI加速器——谁将胜出?》进一步确认了云和边缘玩家的设计赢单。
投资含义:拥有自研芯片能力的公司在成本与供应链上优于依赖第三方进口的同行,尤其在出口管制收紧时。效率提升意味着每令牌总成本更低,直接推动云推理利润率扩张。
证据2:令牌消费激增,触发AI云变现拐点
《通过AI云变现激增的令牌使用》(2026年3月16日)量化显示,受搜索、编程和消费级应用广泛采用驱动,2026年Q1推理令牌量同比增长4倍。《中国AI之路:更高性价比》(2026年4月27日)显示,单位令牌成本在过去12个月下降35-50%,形成节俭推理刺激更多使用的良性循环,进而提高云计算需求。基于令牌定价的AI云收入现已显现:中国主要AI云厂商报告2026年Q1收入加速增长(环比20-30%),这是变现的明确信号。
投资含义:令牌热潮不是未来故事——它已到来。拥有可扩展云推理平台和令牌计费模式的企业最擅长将使用转化为经常性收入。缺乏云交付能力的纯模型训练公司可能面临收入增长滞后。
关键分歧与风险
风险1:美国对先进芯片的出口管制升级。 如果华盛顿禁止更多类别的半导体设备或限制中国AI公司的云访问,性能追赶可能停滞。当前60-70%的性能对标假设能继续使用某些AI可用节点;全面设备禁令将再次拉大差距。
风险2:国内AI云产能过剩导致令牌价格压缩。 多家企业快速扩张推理能力可能导致市场饱和。单位令牌价格已同比下降35-50%,若利用率低于60%,可能再跌30%。这将压缩缺乏差异化或芯片级成本优势的云提供商的利润率。
分歧:我们将令牌变现拐点视为实实在在的收入驱动因素,但部分投资者可能视其为短暂的补贴驱动热潮。分歧取决于推理需求是否足够有弹性以吸收供给增长——早期数据显示是的。
估值或交易含义
投资者应超配那些拥有完整集成AI堆栈的公司的股票——定制芯片、专有云计算和令牌定价。估值视角从训练模型炒作转向经常性每令牌收入倍数。例如,30%的年令牌量增长加上15%的单位成本下降,两年内使毛利率扩大8-12个百分点。反之,没有云交付层的纯模型训练公司面临收入减速,因为令牌定价走向商品化。我们认为,垂直集成AI平台的EBITDA倍数应享有15-25%的估值溢价,而非集成的同行可能估值下调。
附录数据摘要
表1:国产AI芯片对阵英伟达性能(推理,关键工作负载)
| 芯片代际 | 推理性能对比H100(估测) | 架构 | 预期量产时间 |
|---|---|---|---|
| 2025年领先 | 60-65% | 7nm ASIC | 2025年下半年 |
| 2026年下一代 | 70-75% | 5nm AI GPU | 2027年上半年 |
| 2027年目标 | 80%以上 | 3nm定制 | 2027年末 |
表2:中国AI云收入与令牌量增长估算
| 指标 | 2025年Q1 | 2026年Q1 | 2027E(年化) |
|---|---|---|---|
| AI云收入(十亿美元) | 0.8 | 1.6 | 4.5 |
| 推理令牌量(万亿) | 15 | 60 | 250 |
| 平均令牌价格(美元/百万) | 0.06 | 0.03 | 0.02 |