🤖 AI总结
主题
GitHub因算力成本压力暂停Copilot个人版新用户注册并调整计费模式。
摘要
GitHub因AI智能体工作流导致算力需求激增和成本失控,宣布暂停Copilot个人版新订阅,并调整使用限制与计费模式,以寻求可持续的商业模式。
关键信息
- 1 GitHub暂停Copilot Pro等新用户注册,以保障现有服务质量。
- 2 智能体工作流导致算力需求远超预期,成本压力巨大。
- 3 平台正从固定订阅转向基于Token的计费模式以控制成本。
- 4 同时调整使用限制并更新模型,部分用户可申请退款。
![]()
微软旗下的GitHub已暂停接受新的Copilot个人订阅,原因是该代码托管平台正在努力寻找在不超出成本预算的前提下履行服务承诺的解决方案。
GitHub产品副总裁乔·宾德在周一发布的一篇博客文章中写道,平台已暂停GitHub Copilot Pro、Pro+及学生计划的新用户注册,以便更好地服务现有用户。
宾德表示:”智能体工作流从根本上改变了Copilot的算力需求。长时间运行的并行会话所消耗的资源,已经远远超出了当初方案架构所能支撑的规模。随着Copilot智能体能力的快速扩展,智能体承担的工作越来越多,越来越多的用户触碰到了为维护服务稳定性而设定的使用上限。若不采取进一步措施,所有人的服务质量都将下降。”
微软并未明确说明暂停注册的具体原因,但今年2月AI应用热潮的爆发似乎让各大AI基础设施提供商措手不及,难以跟上持续攀升的需求。
Anthropic曾尝试调整使用限额、将流量引导至非高峰时段,并加强执行有关第三方工具使用的相关政策,以此来缓解需求压力。谷歌也对其AI开发环境Gemini CLI及Gemini Code Assist实施了类似政策。OpenAI则在本月初进行了自己的用量调配。
云服务提供商同样面临跟不上需求增长的困境。据报道,AWS去年因无法满足AI需求而将部分业务拱手相让给谷歌云。微软Azure近期也遭遇了算力方面的困难,GitHub同样在可用性方面承受压力。
科技行业去年大力鼓吹软件智能体的前景,但支撑大规模自主软件与AI工作负载所需的基础设施建设仍在推进之中,部分为承载这些负载而兴建的数据中心项目已陷入停滞、放缓乃至被放弃的困境。与此同时,随着Anthropic和OpenAI相继筹备上市,头部模型厂商正承受着压缩亏损的压力,这使得耗资巨大的数据中心建设更加难以为继。
就GitHub而言,此次算力短缺危机的最新体现,是平台上周以”滥用”为由暂停了GitHub Copilot Pro的免费试用。目前,GitHub Copilot的免费版仍可正常使用。
作为GitHub降本增效与服务重组的一部分,宾德表示平台将收紧个人计划的使用限制。
GitHub Copilot采用两种使用节流机制:会话限制和每周限制,均与Token消耗量及特定模型的乘数系数挂钩。
宾德介绍,会话限制旨在确保模型在使用高峰期保持可用状态。GitHub将对其进行调整,以”在可靠性与需求之间寻求平衡”。一旦超出会话限制,用户需等到使用窗口重置后方可继续使用Copilot。
每周限制则对用户在一周内可消耗的Token总量设定上限。宾德表示,引入这一机制是为了”控制并行化、长链路请求带来的成本——此类请求往往长时间持续运行,产生的费用高得难以承受”。
此外,本月早些时候还单独推出了针对高端模型的高级使用限制,对相关请求量设有上限。
GitHub Copilot目前按请求次数计费,即用户与Copilot的每一次交互均计为一次请求,而非按Token数量计费。这种统一定价模式——叠加模型乘数系数后——仍可能导致微软的实际成本超出收费金额,尤其是当某次请求触发后端模型进行超乎预期的长链思维推理时。
因此,据悉此次最新调整实际上是向基于Token计费模式转型的一次尝试,逐步告别提供固定Token消耗量的订阅方案。
作为向更可持续商业模式转型的举措之一,宾德表示Anthropic的Opus 4.5和4.6模型将从Pro+订阅中移除。
上周发布的Opus 4.7将面向Pro+、团队版及企业版用户开放,在4月30日前的促销期内,将配合7.5倍的高级请求乘数系数。此前已停用的Opus 4.6对应的乘数为3倍,因此新版本在账面上成本更高——不过,对于某些特定类型的请求,其处理效率的提升或许能在一定程度上抵消较高的成本。
Opus 4.7扩展了更多Token,使其成本比前代高出20%至40%,但在某些特定场景下表现更为出色。
Copilot Pro及Pro+订阅用户若对上述变更不满,可在5月20日之前申请退款——这几乎涵盖了在GitHub社区论坛上就本次调整发表意见的所有用户。
Q&A
Q1:GitHub为什么要暂停Copilot新用户注册?
A:GitHub暂停Copilot Pro、Pro+及学生计划新用户注册,主要原因是智能体工作流大幅增加了算力需求。长时间运行的并行会话消耗的资源远超原有方案设计上限,导致越来越多的用户触碰使用限额,服务质量面临下降风险。暂停注册是为了更好地保障现有用户的服务体验,同时寻找在成本可控前提下的可持续解决方案。
Q2:GitHub Copilot的会话限制和每周限制有什么区别?
A:两者都是使用节流机制,但作用不同。会话限制与Token消耗及模型乘数挂钩,旨在高峰期保障模型可用性,超出限制后需等使用窗口重置才能继续使用。每周限制则对用户一周内可消耗的Token总量设定上限,主要是为了控制并行化、长链路请求带来的高额成本,防止单个用户长时间占用大量资源。
Q3:Opus 4.7和Opus 4.6相比有什么变化,订阅费用会更贵吗?
A:Opus 4.7上周发布,将面向Pro+、团队版及企业版用户开放。与已停用的Opus 4.6相比,Opus 4.7扩展了更多Token,性能在特定场景下更强,但成本也高出20%至40%。在账面定价上,新版本配合7.5倍高级请求乘数,高于Opus 4.6的3倍乘数,因此整体费用更高,但部分请求类型可能因处理效率提升而抵消成本增加。