为企业”近人类级智能体”部署做好准备的三大最佳实践

🤖 AI总结

主题

企业部署AI智能体的三大最佳实践与挑战

摘要

Databricks专家提出企业部署AI智能体需落实治理、评估与成本三大实践,治理确保数据安全,评估验证输出质量,成本需早期规划,已有企业实现显著回报。

关键信息

  • 1 治理是智能体安全部署的第一原则,需强制执行数据访问权限。
  • 2 评估应贯穿智能体全生命周期,覆盖推理过程各环节。
  • 3 成本需从项目伊始规划,小处着手逐步构建能力。

微软AI首席执行官穆斯塔法·苏莱曼近日在《麻省理工科技评论》撰文指出,计算领域正处于”近人类级智能体”的临界点。然而,通往这一目标的道路并不平坦——企业正面临重新设计工作流程、厘清智能体AI可访问数据范围等重重挑战。

为企业"近人类级智能体"部署做好准备的三大最佳实践

数据库技术巨头Databricks在其最新发布的《AI智能体现状报告》中指出,”目前仅有19%的组织部署了AI智能体,且大多数仍处于有限范围内。”

Databricks AI负责人克雷格·怀利在接受ZDNET采访时表示,许多首席财务官共同关注三大核心问题:”能否对智能体进行管控?它输出的内容是否真正有价值?以及运营成本几何?”

为此,怀利建议企业在部署智能体之前,提前落实以下三大最佳实践。

一、治理:掌控数据访问权限

“能否管控”这一问题,本质上指向治理实践,其核心在于规范智能体的数据访问范围。

AI智能体不同于ChatGPT等工具所提供的简单对话式交互,它能够接入企业数据库、执行大语言模型之外的代码、调用邮件系统等外部程序,并将多个操作串联起来完成完整的业务流程。

治理的首要原则是”不造成伤害”。以Databricks客户、拥有7500万用户的女性健康应用Flow为例,该平台在为用户提供个性化建议的同时,必须防止不同用户之间的数据泄露。怀利指出,完善的治理体系应能精确区分”所有人可访问的公共数据”与”仅限特定用户访问的私有数据”。

资产管理公司富兰克林邓普顿在向客户发送投资组合报告时采取了同样严格的数据隔离措施。怀利强调,数据访问控制”必须被强制执行,而不仅仅是在提示词中加以建议”。

治理的另一层面,是将用户问题与最恰当的数据源及模型精准匹配,从而避免智能体沦为一问一答式的聊天机器人。

汽车买卖平台Edmunds打造的内部智能体工具”Edmunds Mind”是一个典型案例。该工具能够综合交通数据、人口数据、车源列表及定价信息,以更全面的视角分析哪些汽车经销商存在市场服务缺口,而不是简单回答”最好的敞篷车是什么、售价多少”。

在技术实现层面,数据目录扮演着关键角色:一方面为IT管理员提供统一的可视化视图,涵盖智能体可访问的结构化与非结构化数据、外部工具调用协议及已启用的工具;另一方面负责管理智能体与用户的身份认证,确保数据访问权限贯穿智能体全生命周期,始终处于受控状态。

怀利总结道,将治理作为”设计的第一原则”,企业将比”随意放任”的做法更容易将智能体成功推向生产环境。

二、评估:持续验证输出质量

第二大实践是对智能体输出结果进行严格、持续的评估。

以Flow为例,在评估智能体响应是否准确时,参与者并非程序员,而是医生。软件开发人员负责编写管理智能体的编排系统,而医生则负责判断某条回复是否需要补充背景信息或上下文说明。

怀利强调,评估工作必须贯穿程序的整个生命周期,且不局限于最终输出,还应覆盖智能体推理过程的每一个中间环节——”它在每一步究竟在做什么,是否与得出正确答案的目标保持一致?”

一旦发现偏差,应立即将智能体回滚至评估阶段,重新部署并持续迭代。他指出,能够对智能体输出进行有效评估的企业,其成功进入生产环境的概率是其他企业的六倍。

三、成本:做好前期规划

第三个关注点是成本,而这在很大程度上取决于前两项实践是否做到位。怀利表示,一旦治理与评估到位,”其余的都只是实现细节”。

但成本必须从项目伊始就纳入考量。怀利建议从小处着手,逐步构建可治理、可验证的智能体能力,而非一开始就试图用智能体替换整套业务系统。

他举例说明:便利店连锁品牌7-Eleven为现场维修技术人员部署了智能体,让他们能够随时检索所有历史故障记录和设备手册,有效降低了对”打电话问同事”的依赖;贝勒大学则利用智能体分析与潜在学生的每一通通话录音,深入了解学生的择校决策因素,实现了以往人工无法达到的洞察深度。

在投资回报方面,目前行业内仍缺乏系统性数据,但已有部分积极成果浮现:富兰克林邓普顿通过智能体自动化投资组合分析,发现了超过1500万美元的新产品机会;7-Eleven则实现了设备首次修复率提升25%、维修时长缩短40%。

怀利最后强调,成功部署智能体的关键,在于从一开始就确保数据的整洁性与合理组织。”如果你的数据状态良好,我们今天下午就能部署完成;如果数据一团糟,真正的挑战将是整理数据所需的时间。”

Q&A

Q1:AI智能体和普通AI聊天机器人有什么区别?

A:AI智能体不同于ChatGPT等传统聊天机器人的简单对话交互模式。智能体可以直接接入企业数据库、在大语言模型之外执行代码、调用邮件等外部系统,并将多个不同类型的操作串联起来,自动完成整套业务流程,无需用户逐步手动提问引导。

Q2:企业部署AI智能体时,数据治理为什么这么重要?

A:数据治理是智能体能否安全上线的核心前提。以女性健康应用Flow为例,7500万用户的敏感健康数据必须严格隔离,绝不能在不同用户之间泄露。治理体系需要在系统层面强制执行数据访问权限,而不能仅靠提示词建议来约束。Databricks的数据显示,将治理作为设计第一原则的企业,成功将智能体推向生产环境的概率显著更高。

Q3:企业现在投资AI智能体的回报如何?

A:目前行业整体ROI数据尚不完善,但已有积极案例。富兰克林邓普顿通过智能体自动分析投资组合,发现了超过1500万美元的新产品机会;7-Eleven部署设备维修智能体后,首次修复率提升25%,维修时长缩短40%。Databricks认为当前行业处于类似”2001年互联网”的早期阶段,长期价值仍在持续显现中。

© 版权声明

相关文章