🤖 AI总结
主题
关于数据保护公司Commvault推出AI智能体治理与数据利用新产品的报道。
摘要
Commvault发布AI Protect等新产品,旨在解决企业AI智能体治理难题,通过监控、回滚及数据再利用提升AI系统安全与效率。
关键信息
- 1 Commvault推出AI Protect,用于监控云环境AI智能体行为并回滚异常操作。
- 2 新产品Data Activate可将备份数据转化为AI训练可用格式。
- 3 强调保护向量数据库对AI系统韧性的重要性。
![]()
随着企业加速部署AI智能体,如何有效治理这些智能体正成为一大难题。数据保护公司Commvault近日推出了一系列新产品,其中核心产品AI Protect能够发现并监控运行在AWS、Azure和GCP云环境中的AI智能体,并在出现问题时回滚其操作。
Commvault成立已有30年,此次产品发布旨在将自身定位于”AI韧性”领域的核心位置。这一领域工具需求正在快速增长。值得注意的是,身份访问与管理平台Okta上个月也宣布正式推出Okta for AI Agents,支持用户定位智能体、查看其行为并在必要时将其关闭。
Commvault此次还同步推出了另外两款新产品:Data Activate和AI Studio。前者专注于将备份数据整备成可供机器学习流水线使用的格式,后者则为企业提供构建和部署自有智能体的工具集。
Commvault首席技术官(现场)Vidya Shankaran在接受采访时表示,这些产品的推出恰逢其时,因为企业正争相部署AI智能体,却在治理层面力不从心。
“很多组织往往忽视了一个事实:你需要开始保护向量数据库,而它本质上是整个AI技术栈的大脑。”Shankaran说道。
她解释说,向量数据库存储着大语言模型所依赖的嵌入向量。一旦向量数据库遭到破坏或丢失,企业要么需要从头重建,要么需要重新训练模型。”如今没有任何企业能承受这样的时间代价。”
AI Protect的设计目标是跨云环境追踪和响应AI智能体的行为,覆盖AWS、Azure和GCP。该工具可自动发现智能体、梳理其依赖关系,并监控其行为是否出现异常。Shankaran将其描述为一种基线偏差模型:系统持续采集事件数据,建立正常行为模式,随后对偏离基线的行为进行标记——例如某个智能体突然获取了此前无权访问的薪资数据。
“我们会将任何异常行为浮出水面。首先发出通知,然后提供回滚该智能体配置文件或修复受保护数据的选项。”她表示。
一旦出现问题,AI Protect可以恢复智能体的配置,或将其损坏的数据回滚至已知的正常状态。不过,Shankaran也坦承,该工具目前只能监控和回滚,无法直接停止或控制第三方智能体。
“我们更愿意专注于自己的职责范围,而不是越界去对Salesforce的智能体发号施令。”她说。
Data Activate则让企业能够利用Commvault已管理的备份副本来训练AI模型,从而减少对生产系统的压力。这些备份副本可经过分类处理以剔除个人身份信息,再以Apache Iceberg和Parquet等格式发布,供Snowflake、Databricks等平台使用。这为Commvault客户提供了一种从原本闲置数据中挖掘更多价值的途径。
“你已经在用Commvault保护这些数据了,现在只是把这些受保护的副本用于驱动AI流水线。”Shankaran说。
当然,Commvault在帮助企业管控智能体的同时,也在持续扩充智能体生态:AI Studio提供了一套预构建智能体,可供Commvault客户用于常见的数据保护任务,同时也为企业提供自建智能体的工具。其核心理念是让Commvault的智能体与其他平台的智能体协同工作——例如,Salesforce的智能体可以与Commvault的智能体协作,确保数据既可访问又受到保护。AI Studio还支持Commvault的模型上下文协议(MCP)服务器,以便与其他企业系统集成。
Q&A
Q1:Commvault AI Protect能做什么?
A:AI Protect是Commvault推出的智能体监控工具,能够自动发现运行在AWS、Azure和GCP云环境中的AI智能体,梳理其依赖关系,并监控其行为异常。当智能体出现越权访问等异常时,系统会发出通知,并支持回滚智能体配置或修复被破坏的数据,但不能直接控制或停止第三方智能体。
Q2:为什么向量数据库对AI系统这么重要?
A:向量数据库存储着大语言模型运行所依赖的嵌入向量,是整个AI技术栈的核心。一旦向量数据库遭到破坏或丢失,企业将面临从头重建或重新训练模型的高昂代价,耗费大量时间和资源。因此,对向量数据库的保护是AI系统韧性管理中不可忽视的关键环节。
Q3:Commvault Data Activate是如何帮助AI训练的?
A:Data Activate允许企业将Commvault已管理的备份数据副本用于训练AI模型,从而避免直接占用生产系统资源。这些备份副本可经过分类处理以去除个人身份信息,并以Apache Iceberg和Parquet等通用格式发布,兼容Snowflake和Databricks等主流AI平台,让原本闲置的备份数据发挥更大价值。