AWS算力需求爆炸式增长，客户争抢全部可用容量

网易专栏2个月前发布 nxnqh

31 0 0

发布时间：2026-04-13 23:12:04

#AI | #AWS

来源：网易专栏作者：至顶头条
🔗 查看原文

🤖 AI总结

主题

关于亚马逊云科技（AWS）自研AI芯片业务的高速发展与市场影响。

摘要

AWS自研AI芯片需求火爆，性价比优势显著，其AI辅助开发模式正重塑工程效率，展现了在AI算力市场的强大竞争力。

关键信息

1 AWS自研芯片Trainium性价比超越英伟达GPU约30%。
2 两家大客户试图买断AWS自研CPU芯片Graviton的全部产能。
3 6人团队借助AI工具在76天内重建了核心推理引擎Mantle。

AWS算力需求爆炸式增长，客户争抢全部可用容量

亚马逊云科技（AWS）的芯片业务正处于爆发式增长阶段，自研芯片Trainium的性价比已超越英伟达，企业客户对AI算力的渴求甚至达到了试图买断全部可用容量的程度。

这些信息来自亚马逊CEO安迪·贾西在2025年年报中写给股东的一封长达八页的信。贾西的表态清晰反映出企业界对AI的全力押注，以及亚马逊主导这场技术变革的雄心——在他看来，AI将像电力一样深刻改变世界。

Info-Tech研究集团顾问研究员斯科特·比克利指出：”综合来看，AWS正在深入布局，全面掌控AI技术栈的每一层：底层是电力和数据中心，中间层是自研芯片，顶层是训练与推理能力。”

算力供不应求，两家大客户试图买断Graviton全部产能

AWS在2025年新增了3.9GW的电力容量，并预计到2027年底将总电力容量翻倍。但贾西坦言：”即便如此，我们仍面临容量瓶颈，存在无法满足的需求。”

他特别透露，有两家大型客户因AI算力需求极为迫切，希望买断AWS自研CPU芯片Graviton在2026年的全部实例容量。他强调，考虑到其他客户的需求，AWS无法答应此类请求。

Moor Insights & Strategy副总裁兼首席分析师马特·金博尔表示：”两家大客户试图买下AWS全年的Graviton产能，这已经说明了市场现状的一切。”

他认为，这不仅仅是供应链问题，更是一种”战略性依赖”——企业争抢算力，不只是为了自身需要，更是为了在竞争对手之前锁定资源。”AWS面临的风险不是建设速度不够快，而是受限的客户可能转向Azure或谷歌云平台（GCP）。”

这一现象也说明Graviton的受欢迎程度已远超预期。金博尔指出，Graviton如今承载的不再是”轻量级芯片支撑轻量级工作负载”，而是覆盖了多种不同计算需求的复杂工作场景。他预测，随着Azure Cobalt和谷歌云Axion处理器的成熟，类似需求同样会出现，届时Arm与x86架构之间的市场竞争将更加有趣。

比克利也认同供应链瓶颈对AI基础设施建设的影响”既广泛又深远”。即便有报道称2026年约50%的规划AI数据中心产能将无法落地，”眼下市场上的资源依然全面售罄”。

Trainium超越英伟达？性价比领先30%

进入2026年，贾西用”烈火燃烧”来形容亚马逊的芯片业务。尽管AWS与英伟达保持着紧密合作并广泛使用其半导体产品，但贾西认为处理器市场正在经历一场”新的转变”——客户越来越看重性价比。

亚马逊于2024年底发布了第二代自研AI芯片Trainium2，Amazon Bedrock平台目前已将大部分推理任务迁移至这款新一代加速器。贾西声称，Trainium2相比同类GPU性价比提升约30%，且”基本售罄”。

刚刚开始出货的Trainium3，性价比较Trainium2又提升了30%至40%，目前”几乎已被全额预订”。更值得关注的是，距离大规模上市还有约18个月的Trainium4，其相当一部分产能已提前被预留。

“我们芯片的需求旺盛到了一个程度，以至于未来很可能会向第三方整机架销售，”贾西表示。

比克利指出，亚马逊的目标并非取代英伟达，而是在”AWS具备经济性优势的领域”降低对英伟达的依赖。AWS能够通过与Bedrock的深度集成、自研互联架构、更高效的Token经济模型，以及基于PyTorch/JAX/vLLM标准工作流构建的软件栈，提供差异化的性价比方案。

Trainium的核心应用场景是大语言模型、多模态模型及扩散Transformer的训练与推理，参数规模覆盖数千亿至万亿级别。Anthropic和Uber等知名客户正在实际验证AWS的效率承诺；而Cohere和Stability AI等则更倾向于英伟达成熟的工具链和更强的芯片设计能力，并对AWS的服务稳定性提出了质疑。

金博尔还提到，AWS与Cerebras的合作同样值得关注。Trainium擅长预填充（prefill），Cerebras CS-3擅长解码（decode），两者结合可在无需用户干预的情况下实现最优推理性能。”这正是企业用户所追求的’即点即用’的简单体验。”

在他看来，贾西正在用Trainium复制Graviton当年颠覆x86的路径——在推理这一”企业AI中增长最快、对成本最敏感的工作负载”领域，Trainium正在取得最为显著的进展。

76天造出推理引擎Mantle，6名工程师完成大规模重建

贾西在信中还强调，敢于推倒重来、”重新定向”的能力至关重要。以Amazon Bedrock为例，它最初快速构建并超预期扩展，但团队随后意识到，平台所需的不是小修小补，而是一套全新的推理引擎。

为此，Bedrock团队借助AWS智能体编程服务Kiro，组建了一支由6名”极具实力的工程师”构成的小组，在76天内交付了全新推理引擎Mantle。Mantle随即成为Bedrock的核心支柱——贾西表示，Bedrock在2026年第一季度处理的Token数量，超过了此前所有年份的总和。

比克利认为，如此小的团队在如此短的时间内完成如此大规模的重建，并同步上线有状态对话管理、异步推理、更高默认配额等功能，”初看之下确实令人印象深刻”。他表示：”Mantle本身就应被视为一款重要的推理产品。”

金博尔则认为Mantle的诞生背后其实是”两个故事”：一是运营层面的（Bedrock需要新架构），二是效率层面的——6名工程师借助智能体工具，完成了40人团队也难以更快交付的工作，”项目周期、团队规模、自研还是采购的决策逻辑，都将因此发生根本性转变”。

“Mantle不只是一次重建，它是AI辅助开发正在改变行业边界的又一个有力佐证，”金博尔说，”不是理论层面，不是营销话术，而是真实发生在生产环境中的事。”

贾西最后写道：”进步不会是线性的。会有加速的时刻，也会有需要调整方向的时刻。我们会持续实验，向重要的事情倾斜资源，在不奏效时果断收手。”

Q&A

Q1：AWS的Graviton芯片为什么会出现被客户试图买断的情况？

A：根据亚马逊CEO贾西的股东信，两家大型客户希望买断AWS自研CPU芯片Graviton在2026年的全部实例产能，原因是AI算力需求极为旺盛。分析师指出，这不只是供应链紧张的问题，更是一种”战略性依赖”——企业争相锁定资源，是为了防止竞争对手抢先占据算力优势。AWS已明确表示无法接受此类独占请求，但这一现象充分说明Graviton已从轻量级芯片演变为承载复杂多样计算需求的核心平台。

Q2：Trainium2和Trainium3相比英伟达GPU性价比究竟高多少？

A：根据贾西的说法，Trainium2相比同类英伟达GPU性价比提升约30%，目前已基本售罄。刚开始出货的Trainium3在此基础上再提升30%至40%，几乎已被全额预订。距离大规模上市还有约18个月的Trainium4也已有相当一部分产能被提前预留。Trainium主要面向大语言模型、多模态模型等大规模AI训练与推理场景，Anthropic、Uber等头部客户正在实际使用中验证其效率表现。

Q3：Bedrock推理引擎Mantle是怎么做出来的，6个人76天完成意味着什么？

A：AWS的Bedrock团队在发现原有推理架构无法满足需求后，借助AWS智能体编程服务Kiro，组建了一支6人工程师团队，在76天内完成了全新推理引擎Mantle的开发。Mantle上线后迅速成为Bedrock的核心，2026年第一季度处理的Token量超过此前所有年份的总和。分析师认为，这说明AI辅助开发正在重塑工程效率的边界，团队规模、项目周期乃至自研与采购的决策逻辑都将因此发生根本性改变。

网易专栏 # AI # AWS

文章版权归作者所有，未经允许请勿转载。

AWS算力需求爆炸式增长，客户争抢全部可用容量

🤖 AI总结

主题

摘要

关键信息

新型勒索团伙通过帮助台网络钓鱼攻击数十家高价值企业

Adobe Reader现存数月的零日漏洞，利用PDF文件悄然锁定攻击目标

相关文章

自动化为智能体网络运营铺平道路

谷歌警告两个正在被利用的Chrome浏览器零日漏洞

AI众包评测平台Yupp宣布关闭，曾获a16z领投3300万美元

容器化智能体平台NanoClaw：更安全的OpenClaw替代方案