🤖 AI总结
主题
微软发布Copilot Cowork新功能,旨在实现自主执行多步骤任务的AI智能体。
摘要
微软推出Copilot Cowork,这是一个能自主执行复杂多步骤任务的AI助手,通过多模型协作和人工监督提升工作准确性与效率。
关键信息
- 1 Copilot Cowork可处理需人工监督的长期多步骤任务。
- 2 采用GPT与Claude多模型协作,提升准确性并减少幻觉。
- 3 基于Work IQ框架,旨在提升工作效率并确保安全合规。
![]()
微软公司正在向实现自主人工智能智能体愿景迈进,这些智能体不仅能够聊天,还能执行更复杂的任务。
今天,微软宣布推出Copilot Cowork,这是Microsoft 365平台中的一项新功能,能够处理此前只能在持续人工监督下完成的”长期运行的多步骤任务”。
Copilot Cowork由微软工作AI首席营销官Jared Spataro在博客文章中宣布。他表示,这项新功能通过公司的Frontier项目提供,该项目允许企业在前沿AI功能正式发布前进行测试。
微软的Copilot工具已经存在几年时间,但直到现在主要专注于生成任务,比如总结邮件或起草邮件和博客文章的文本。而Copilot Cowork则是为委派任务而构建的,因此人们不需要在复杂工作流中执行每一个步骤,而是可以描述他们想要的结果,让AI自主完成所有这些任务。
Spataro表示,用户只需告诉Copilot Cowork他们想要完成什么,它就会制定计划并立即执行必要的任务来实现目标,在各种Microsoft 365应用程序和文件之间进行推理。不过人工监督仍然存在。在工作过程中,人类能够监控智能体的进度,并在其偏离轨道时介入”引导”它朝正确方向发展,Spataro说。
该系统基于Work IQ框架,旨在教会Copilot了解组织数据的具体环境,同时确保遵循安全和治理协议。Spataro表示,Copilot Cowork的核心是提高工作效率,消除人类在不同应用程序之间不断跳转的需要。
即使是相对简单的任务,如完成月度预算审查,也需要人类在Excel、Outlook、Teams和SharePoint等平台之间不断切换。需要收集所需数据并与同事协调,然后将所有内容编制成报告。
Copilot Cowork消除了所有这些麻烦。它充当”协调者”,执行日常简报和日历管理等任务,无需提示完成每个单独的步骤。
早期采用者Capital Group Companies Inc.的企业技术高级副总裁Barton Warner表示,Copilot Cowork是关于采取实际行动,而不是生成内容和答案。”它连接步骤、协调任务并在日常工作流中跟进执行,”他解释说。
多模型研究
Copilot Cowork最大的优势之一是其多模型方法,同时集成了OpenAI集团的GPT模型和Anthropic的Claude。这在公司新增强的”研究员”智能体中可以看到,该智能体现在通过新的”批评”层利用这两个AI模型。
其工作方式是OpenAI的GPT模型起草回应,然后由Claude审查准确性并确保引用正确。Spataro表示,这种组合使研究员智能体在DRACO基准测试中的得分提高了13.8%。
此外,还可以颠倒角色,让Claude起草回应,GPT进行事实核查。然后,通过新的”模型委员会”功能,用户可以比较每个模型的结果,看看它们在哪里一致,在哪里分歧,在哪里产生独特的输出。这很像让多个研究员在同一个项目上工作。
通过允许不同模型扮演不同角色,一个用于起草回应,一个用于批评,微软正试图构建一个更具弹性的系统,减少困扰早期AI系统的”幻觉”问题。通过允许人类交叉参照不同AI的工作,企业可能能够以更高的信任度扩大AI自动化规模。
Q&A
Q1:Copilot Cowork与普通Copilot有什么不同?
A:普通Copilot主要专注于生成任务,如总结邮件或起草文本。而Copilot Cowork是为委派任务而构建的,能够处理长期运行的多步骤任务,用户只需描述想要的结果,它就能自主完成所有相关任务,无需人工执行每个步骤。
Q2:Copilot Cowork如何保证工作准确性?
A:系统采用多模型方法,集成OpenAI的GPT模型和Anthropic的Claude。一个模型起草回应,另一个进行审查和事实核查。同时保持人工监督,人类可以监控进度并在必要时进行引导,通过”模型委员会”功能还能比较不同模型的结果。
Q3:普通企业如何使用Copilot Cowork?
A:目前Copilot Cowork通过微软的Frontier项目提供,该项目允许企业在AI功能正式发布前进行测试。它基于Work IQ框架,能够学习组织数据的具体环境,同时确保遵循企业的安全和治理协议。