发现了一个特别有想象力的「智能体协作舱」

🤖 AI总结

主题

介绍AI Agent产品PilotDeck的核心功能与创新点

摘要

PilotDeck是一款创新的AI Agent产品,通过WorkSpace工作舱提供白盒记忆管理、智能路由降本和常驻任务功能,展示了在项目隔离、成本控制和主动执行方面的突破性解决方案。

关键信息

  • 1 PilotDeck通过WorkSpace实现项目级记忆隔离与白盒管理
  • 2 内置智能路由功能可自动优化模型调用成本
  • 3 支持Always-on常驻任务与游戏设计等创意场景

发现了一个特别有想象力的「智能体协作舱」

18世纪,亚当斯密提出了分工理论。

20世纪初,福特T型车,开创了全自动的汽车流水线。

到了21世纪,NetFlix创立了他们的管理哲学,Context not Control,并被字节等公司发展演化。

而近些年,随着模型的进化和AI产品的涌现,新的生产关系和效率模型也在诞生。

今天,用DAU、ARR很难衡量一款AI产品的价值,看Task数、算Token量,似乎也有局限。

所以当我看到「智能体协作舱」、「任务为核心的操作系统」这样的表述时,很觉得眼前一亮。

发现了一个好玩的新产品,叫:PilotDeck。

发现了一个特别有想象力的「智能体协作舱」

官网:https://pilotdeck.openbmb.cn/

01一个项目一个舱,记忆效果响当当

上手PilotDeck,能看到他们有个核心设计,叫WorkSpace(工作舱)。

Claude Code、Codex、OpenCLaw,都有项目文件夹,但上手用了发现这个工作舱跟他们都不一样。

别的工具里的WorkSpace是一个目录,打开一个文件夹,告诉AI这个项目的东西放这儿。

但PilotDeck的WorkSpace,是一个智能体的完整生存环境。

这个舱里有三层东西:文件系统、记忆、技能。

发现了一个特别有想象力的「智能体协作舱」

文件系统好理解,就是这个项目能访问哪些文件夹。

关键是记忆这一层。效率场景,记忆几乎伴随了我使用的所有情况。

我让它帮我整理一份关于AI Agent行业的研究报告,需要从二十多篇论文和博客里提取关键信息。

给了它一个任务清单:先搜集近三个月的相关文章,然后提取每个文章的核心观点,最后按照技术路线、应用场景、成本三个维度整理成表格。

一个小时后回来,再打开PilotDeck,看到它已经完成了任务。

发现了一个特别有想象力的「智能体协作舱」

其中两篇论文我尤其感兴趣,希望能被长期记忆、索引。

于是打开WorkSpace的Memory模块,找到处理这两篇论文时的记录。

很直观能看到它记了什么,有哪些背景信息,引用论文之间的相互联系。

发现了一个特别有想象力的「智能体协作舱」

还尝试了一个写公众号、公众号排版设计的场景。

希望帮我设计一套有科技感的公众号排版版式。

于是打开项目A的WorkSpace,点进Memory模块,看到了所有记忆条目。

之前在其他AI产品里,都遇到过公众号排版格式的问题,但在PilotDeck里记忆条目非常清晰好找。

还会针对我的公众号的风格调性,个性化设计符合定位的排版风格。

发现了一个特别有想象力的「智能体协作舱」

如果遇到问题,直接删掉那条从项目B串进来的记忆,改回正确值。两秒钟的事。

还有Dream记录,很有意思。

PilotDeck有个机制叫Dream,就是AI在空闲时段会自动回顾整理记忆。昨天半夜它Dream的时候,把两个项目的排版要求合并了。我甚至能一键回滚这次Dream,恢复到整理前的状态。

这就叫白盒记忆。

我看到AI记住了什么,我知道它什么时候记的,我能改,我能追溯来源。

发现了一个特别有想象力的「智能体协作舱」

不算什么花哨的功能,这是生产力工具的基本要求。但市面上99%的AI工具做不到。

我还测试了记忆的隔离性。

同时开了三个WorkSpace,分别处理三个不同客户的项目。每

个项目有自己的文件目录、自己的记忆库。我让AI在项目A里学习了一套技术术语的定义,在项目B里学习了另一套完全不同的术语体系。两个项目跑了一整天,没有任何串扰。

这是真正的项目级隔离。

每个舱有自己的记忆空间,检索只在舱内进行。不会出现你问项目A的问题,AI用项目B的背景来回答。

对于同时处理多个项目的从业者来说,这个功能不是锦上添花,是雪中送炭。

02用PilotDeck设计游戏,比玩游戏还上头

说完了正经工作,我聊点好玩的。

我这个人除了写代码,还有个隐藏身份:桌游和RPG爱好者。

我一直想自己设计复杂游戏,但每次都是开了个头就放弃了。

和那种小游戏还不一样,大型游戏的世界观要编,角色要写,数值要算,技能要平衡,光是文档就能写几十页。

看别人做、也亲手试了几个方向,每一个都让我觉得以前那些烂尾的项目有救了。

PilotDeck呈现的案例,有一个让我印象最深:从0开始设计一个「塞尔达风格」的游戏。

主角在一个开放世界里探索神庙、解谜、打怪,设计初始区域的地图布局、三个新手神庙的谜题、以及主角的基础能力获取顺序。

操作里,看到先读取了所有的参考资料,然后在Project Memory里自动生成了当前项目进度:世界观设定完成度30%,地图设计完成度0%,谜题设计完成度0%,角色能力列表待补充。

PilotDeck会自动拆分任务。

它先设计草原的地形,用文字描述的方式输出了一张网格地图,标注了高地、河流、草丛和怪物营地。

然后它设计第一个神庙,这个神庙教主角使用炸弹能力。

再看最终游戏的效果,不管是3D动态效果的呈现,还是角色实际的行进探索,可玩性都挺好,左上角的数值能实时变动。

一个细节,连右下角的小地图都称得上清晰准确。

整个的玩法、流程,一套下来很丝滑。

我自己也动手试了下,把最爱的动漫《七龙珠》变成一个游戏,效果也是同样的高水准。

想做一个龙珠主题的卡牌RPG,玩家收集Z战士卡牌,每个角色有自己的气力值和必杀技,战斗系统基于猜拳机制。

我以前试着写过设计文档,写到贝吉塔的技能就写不下去了,因为要考虑角色平衡、技能搭配、以及和原作的贴合度。

这次我用PilotDeck建了一个新WorkSpace,叫龙珠Z-卡牌传说。

发现了一个特别有想象力的「智能体协作舱」

我先把原作的关键设定喂给它:赛亚人篇到沙鲁篇的主要角色、每个角色的经典招式、战斗力大致排名。这些信息存在Project Memory里。

然后我让它帮我设计角色卡牌模板。

它先输出了一个通用模板:卡牌包含角色名、生命值、气力值、三个普通技能、一个必杀技、一个被动特性。然后它开始逐个设计角色。

发现了一个特别有想象力的「智能体协作舱」

悟空的设计是:生命值1200,气力值150。普通技能有龟派气功、残像拳、界王拳。必杀技是元气弹,消耗所有气力,每消耗10点气力造成50点伤害。

然后我让它设计战斗系统。

基于猜拳机制,每个回合玩家和对手同时选择攻击、防御、蓄气三种行动之一。

PilotDeck帮我产出了一套完整的卡牌角色设计文档,包含十二个可玩角色和六个敌方BOSS。

发现了一个特别有想象力的「智能体协作舱」

每个角色的技能都有数值和描述,战斗系统的规则写了两千多字。

很快游戏就做好了。

我拿给做独立游戏的朋友看,他说这个设计可以直接拿去prototype了。

发现了一个特别有想象力的「智能体协作舱」

时常有朋友问我,怎么学AI。

想到可以做一个「游戏化的AI白话词典」。

平时看到很多AI术语,什么Transformer、自注意力机制、RLHF、MoE、RAG。

每个词条的定义,讲给身边人都有点枯燥,想学的朋友也容易忘记。

我就想,能不能做成游戏的形式,边玩边学?

在PilotDeck里建了一个WorkSpace,叫「AI白话词典-学渣拯救计划」。

发现了一个特别有想象力的「智能体协作舱」

我给它下达的任务是:把一百个核心AI术语做成闯关游戏。

每一关是一个术语,玩家需要先看一个生活化的类比解释,然后回答三道选择题,全部答对才能解锁下一关。每解锁十个术语,获得一个游戏成就徽章。

这个WorkSpace我打算继续维护,能长期保留。

每次我遇到新的术语,可以直接加进去,AI会自动按同样的风格生成类比和题目。

而且不同术语之间如果有关联,比如RAG和Embedding,AI会在题目里设计交叉知识点,帮助建立知识网络。

忽然觉得,PilotDeck在创意类工作上的潜力可能比在重复劳动上更大。

发现了一个特别有想象力的「智能体协作舱」

设计游戏需要大量的世界观构建、规则定义、数值平衡、文档整理,这些恰恰是AI擅长、人做起来又很耗时的环节。

而PilotDeck只是安安静静地在WorkSpace里干活,你随时可以看它记住了什么、改了什么、为什么这么改。

这种透明感,让我愿意把更多不成熟的想法丢进去试错。

03钱省了,觉也睡了

AI工具的成本是个很现实的问题。

我上个月用某个顶级模型跑了一个复杂的数据分析任务,跑了一晚上,第二天一看账单,花了我将近800美元。我当时就一个想法:这玩意儿我用不起。

PilotDeck内置了一个叫智能路由的功能。它自动判断任务难度,简单任务走便宜的小模型,复杂任务才调用能力最强的大模型。你什么都不用做,它自动帮你省。

我做了个对比测试。

用小红书风格写一篇产品种草文案,五百字左右。

发现了一个特别有想象力的「智能体协作舱」

不开智能路由,全程用Opus 4.5跑,花了12.58美金。开了之后,主模型Opus 4.5配子模型Sonnet 4.5,花了2.83美金。一模一样的输出质量,省了百分之七十。

PilotDeck把判断自动化了,做得比人还准。

它会从四个维度评估任务难度:步骤数量、依赖关系、外部知识需求、输出格式要求。

简单任务直接交给小模型,复杂任务才上大模型。语音生成类的任务还能自动部署端侧模型,数据不上传云端,隐私也保住了。

再说Always-on,也就是常驻任务。AI不用等你触发,它自己发现问题、自己推进、自己汇报。

我测试了一个「每日AI日报」场景。

我需要监控AI技术社区的讨论动态,每天抓取热度变化,生成简报。以前我得每天早上打开工具,输入指令,等它跑完,复制结果。

发现了一个特别有想象力的「智能体协作舱」

现在我在PilotDeck里设定好规则:每天早上八点,主动抓取过去二十四小时的数据,分析热度变化,识别新兴话题,生成简报并保存到文件夹。

然后我就可以放心去睡觉了。第二天醒来,简报已经在那儿了。

很多Agent,表面上在我帮我节省时间,实际上也在消耗我的注意力带宽。

希望都能像PilotDeck一样,让人在离线状态下,更省心。

发现了一个特别有想象力的「智能体协作舱」

04最后说几句

有时候觉得,AI产品经理、AI创业者,不要再在旧的框架里打转了。

完全可以从头开始,像原创设计一个太空舱、空间站一样,去创造一款AI Agent应用。

PilotDeck就给我这种感觉。

它跟OpenCLaw的共性是:有Agent哲学。

发现了一个特别有想象力的「智能体协作舱」

GitHub地址:https://github.com/OpenBMB/PilotDeck

每个项目应该有自己的生存空间,记忆应该是白盒的,成本应该是可控的,AI应该是主动的。

发现了一个特别有想象力的「智能体协作舱」

面壁智能的团队和清华THUNLP,在这个项目上展现的工程能力和产品判断,超过了我对学术团队的预期。

模型能力本身不再是壁垒,顶级模型之间的差距在缩小。

真正的Agent壁垒,可能就在三个方向:

记忆管理的精细度、成本控制的能力、主动执行任务的可靠性。

谁把这三个问题解决好,谁就能活下来。

PilotDeck已经都拿出了可验证的解决方案,接下来也将给更多Agent产品持续带来科研、工程、产品上的启发。

官网链接在这儿:

https://pilotdeck.openbmb.cn/

发现了一个特别有想象力的「智能体协作舱」

© 版权声明

相关文章