🤖 AI总结
主题
关于亚马逊云科技(AWS)自研AI芯片业务的高速发展与市场影响。
摘要
AWS自研AI芯片需求火爆,性价比优势显著,其AI辅助开发模式正重塑工程效率,展现了在AI算力市场的强大竞争力。
关键信息
- 1 AWS自研芯片Trainium性价比超越英伟达GPU约30%。
- 2 两家大客户试图买断AWS自研CPU芯片Graviton的全部产能。
- 3 6人团队借助AI工具在76天内重建了核心推理引擎Mantle。
![]()
亚马逊云科技(AWS)的芯片业务正处于爆发式增长阶段,自研芯片Trainium的性价比已超越英伟达,企业客户对AI算力的渴求甚至达到了试图买断全部可用容量的程度。
这些信息来自亚马逊CEO安迪·贾西在2025年年报中写给股东的一封长达八页的信。贾西的表态清晰反映出企业界对AI的全力押注,以及亚马逊主导这场技术变革的雄心——在他看来,AI将像电力一样深刻改变世界。
Info-Tech研究集团顾问研究员斯科特·比克利指出:”综合来看,AWS正在深入布局,全面掌控AI技术栈的每一层:底层是电力和数据中心,中间层是自研芯片,顶层是训练与推理能力。”
算力供不应求,两家大客户试图买断Graviton全部产能
AWS在2025年新增了3.9GW的电力容量,并预计到2027年底将总电力容量翻倍。但贾西坦言:”即便如此,我们仍面临容量瓶颈,存在无法满足的需求。”
他特别透露,有两家大型客户因AI算力需求极为迫切,希望买断AWS自研CPU芯片Graviton在2026年的全部实例容量。他强调,考虑到其他客户的需求,AWS无法答应此类请求。
Moor Insights & Strategy副总裁兼首席分析师马特·金博尔表示:”两家大客户试图买下AWS全年的Graviton产能,这已经说明了市场现状的一切。”
他认为,这不仅仅是供应链问题,更是一种”战略性依赖”——企业争抢算力,不只是为了自身需要,更是为了在竞争对手之前锁定资源。”AWS面临的风险不是建设速度不够快,而是受限的客户可能转向Azure或谷歌云平台(GCP)。”
这一现象也说明Graviton的受欢迎程度已远超预期。金博尔指出,Graviton如今承载的不再是”轻量级芯片支撑轻量级工作负载”,而是覆盖了多种不同计算需求的复杂工作场景。他预测,随着Azure Cobalt和谷歌云Axion处理器的成熟,类似需求同样会出现,届时Arm与x86架构之间的市场竞争将更加有趣。
比克利也认同供应链瓶颈对AI基础设施建设的影响”既广泛又深远”。即便有报道称2026年约50%的规划AI数据中心产能将无法落地,”眼下市场上的资源依然全面售罄”。
Trainium超越英伟达?性价比领先30%
进入2026年,贾西用”烈火燃烧”来形容亚马逊的芯片业务。尽管AWS与英伟达保持着紧密合作并广泛使用其半导体产品,但贾西认为处理器市场正在经历一场”新的转变”——客户越来越看重性价比。
亚马逊于2024年底发布了第二代自研AI芯片Trainium2,Amazon Bedrock平台目前已将大部分推理任务迁移至这款新一代加速器。贾西声称,Trainium2相比同类GPU性价比提升约30%,且”基本售罄”。
刚刚开始出货的Trainium3,性价比较Trainium2又提升了30%至40%,目前”几乎已被全额预订”。更值得关注的是,距离大规模上市还有约18个月的Trainium4,其相当一部分产能已提前被预留。
“我们芯片的需求旺盛到了一个程度,以至于未来很可能会向第三方整机架销售,”贾西表示。
比克利指出,亚马逊的目标并非取代英伟达,而是在”AWS具备经济性优势的领域”降低对英伟达的依赖。AWS能够通过与Bedrock的深度集成、自研互联架构、更高效的Token经济模型,以及基于PyTorch/JAX/vLLM标准工作流构建的软件栈,提供差异化的性价比方案。
Trainium的核心应用场景是大语言模型、多模态模型及扩散Transformer的训练与推理,参数规模覆盖数千亿至万亿级别。Anthropic和Uber等知名客户正在实际验证AWS的效率承诺;而Cohere和Stability AI等则更倾向于英伟达成熟的工具链和更强的芯片设计能力,并对AWS的服务稳定性提出了质疑。
金博尔还提到,AWS与Cerebras的合作同样值得关注。Trainium擅长预填充(prefill),Cerebras CS-3擅长解码(decode),两者结合可在无需用户干预的情况下实现最优推理性能。”这正是企业用户所追求的’即点即用’的简单体验。”
在他看来,贾西正在用Trainium复制Graviton当年颠覆x86的路径——在推理这一”企业AI中增长最快、对成本最敏感的工作负载”领域,Trainium正在取得最为显著的进展。
76天造出推理引擎Mantle,6名工程师完成大规模重建
贾西在信中还强调,敢于推倒重来、”重新定向”的能力至关重要。以Amazon Bedrock为例,它最初快速构建并超预期扩展,但团队随后意识到,平台所需的不是小修小补,而是一套全新的推理引擎。
为此,Bedrock团队借助AWS智能体编程服务Kiro,组建了一支由6名”极具实力的工程师”构成的小组,在76天内交付了全新推理引擎Mantle。Mantle随即成为Bedrock的核心支柱——贾西表示,Bedrock在2026年第一季度处理的Token数量,超过了此前所有年份的总和。
比克利认为,如此小的团队在如此短的时间内完成如此大规模的重建,并同步上线有状态对话管理、异步推理、更高默认配额等功能,”初看之下确实令人印象深刻”。他表示:”Mantle本身就应被视为一款重要的推理产品。”
金博尔则认为Mantle的诞生背后其实是”两个故事”:一是运营层面的(Bedrock需要新架构),二是效率层面的——6名工程师借助智能体工具,完成了40人团队也难以更快交付的工作,”项目周期、团队规模、自研还是采购的决策逻辑,都将因此发生根本性转变”。
“Mantle不只是一次重建,它是AI辅助开发正在改变行业边界的又一个有力佐证,”金博尔说,”不是理论层面,不是营销话术,而是真实发生在生产环境中的事。”
贾西最后写道:”进步不会是线性的。会有加速的时刻,也会有需要调整方向的时刻。我们会持续实验,向重要的事情倾斜资源,在不奏效时果断收手。”
Q&A
Q1:AWS的Graviton芯片为什么会出现被客户试图买断的情况?
A:根据亚马逊CEO贾西的股东信,两家大型客户希望买断AWS自研CPU芯片Graviton在2026年的全部实例产能,原因是AI算力需求极为旺盛。分析师指出,这不只是供应链紧张的问题,更是一种”战略性依赖”——企业争相锁定资源,是为了防止竞争对手抢先占据算力优势。AWS已明确表示无法接受此类独占请求,但这一现象充分说明Graviton已从轻量级芯片演变为承载复杂多样计算需求的核心平台。
Q2:Trainium2和Trainium3相比英伟达GPU性价比究竟高多少?
A:根据贾西的说法,Trainium2相比同类英伟达GPU性价比提升约30%,目前已基本售罄。刚开始出货的Trainium3在此基础上再提升30%至40%,几乎已被全额预订。距离大规模上市还有约18个月的Trainium4也已有相当一部分产能被提前预留。Trainium主要面向大语言模型、多模态模型等大规模AI训练与推理场景,Anthropic、Uber等头部客户正在实际使用中验证其效率表现。
Q3:Bedrock推理引擎Mantle是怎么做出来的,6个人76天完成意味着什么?
A:AWS的Bedrock团队在发现原有推理架构无法满足需求后,借助AWS智能体编程服务Kiro,组建了一支6人工程师团队,在76天内完成了全新推理引擎Mantle的开发。Mantle上线后迅速成为Bedrock的核心,2026年第一季度处理的Token量超过此前所有年份的总和。分析师认为,这说明AI辅助开发正在重塑工程效率的边界,团队规模、项目周期乃至自研与采购的决策逻辑都将因此发生根本性改变。