发现了一个特别有想象力的「智能体协作舱」

网易专栏3天前发布 nxnqh

5 0 0

发布时间：2026-05-28 15:00:49

#AI | #PilotDeck

来源：网易专栏作者：AI异类
🔗 查看原文

🤖 AI总结

主题

介绍AI Agent产品PilotDeck的核心功能与创新点

摘要

PilotDeck是一款创新的AI Agent产品，通过WorkSpace工作舱提供白盒记忆管理、智能路由降本和常驻任务功能，展示了在项目隔离、成本控制和主动执行方面的突破性解决方案。

关键信息

1 PilotDeck通过WorkSpace实现项目级记忆隔离与白盒管理
2 内置智能路由功能可自动优化模型调用成本
3 支持Always-on常驻任务与游戏设计等创意场景

发现了一个特别有想象力的「智能体协作舱」

18世纪，亚当斯密提出了分工理论。

20世纪初，福特T型车，开创了全自动的汽车流水线。

到了21世纪，NetFlix创立了他们的管理哲学，Context not Control，并被字节等公司发展演化。

而近些年，随着模型的进化和AI产品的涌现，新的生产关系和效率模型也在诞生。

今天，用DAU、ARR很难衡量一款AI产品的价值，看Task数、算Token量，似乎也有局限。

所以当我看到「智能体协作舱」、「任务为核心的操作系统」这样的表述时，很觉得眼前一亮。

发现了一个好玩的新产品，叫：PilotDeck。

发现了一个特别有想象力的「智能体协作舱」

官网：https://pilotdeck.openbmb.cn/

01一个项目一个舱，记忆效果响当当

上手PilotDeck，能看到他们有个核心设计，叫WorkSpace（工作舱）。

Claude Code、Codex、OpenCLaw，都有项目文件夹，但上手用了发现这个工作舱跟他们都不一样。

别的工具里的WorkSpace是一个目录，打开一个文件夹，告诉AI这个项目的东西放这儿。

但PilotDeck的WorkSpace，是一个智能体的完整生存环境。

这个舱里有三层东西：文件系统、记忆、技能。

发现了一个特别有想象力的「智能体协作舱」

文件系统好理解，就是这个项目能访问哪些文件夹。

关键是记忆这一层。效率场景，记忆几乎伴随了我使用的所有情况。

我让它帮我整理一份关于AI Agent行业的研究报告，需要从二十多篇论文和博客里提取关键信息。

给了它一个任务清单：先搜集近三个月的相关文章，然后提取每个文章的核心观点，最后按照技术路线、应用场景、成本三个维度整理成表格。

一个小时后回来，再打开PilotDeck，看到它已经完成了任务。

发现了一个特别有想象力的「智能体协作舱」

其中两篇论文我尤其感兴趣，希望能被长期记忆、索引。

于是打开WorkSpace的Memory模块，找到处理这两篇论文时的记录。

很直观能看到它记了什么，有哪些背景信息，引用论文之间的相互联系。

发现了一个特别有想象力的「智能体协作舱」

还尝试了一个写公众号、公众号排版设计的场景。

希望帮我设计一套有科技感的公众号排版版式。

于是打开项目A的WorkSpace，点进Memory模块，看到了所有记忆条目。

之前在其他AI产品里，都遇到过公众号排版格式的问题，但在PilotDeck里记忆条目非常清晰好找。

还会针对我的公众号的风格调性，个性化设计符合定位的排版风格。

发现了一个特别有想象力的「智能体协作舱」

如果遇到问题，直接删掉那条从项目B串进来的记忆，改回正确值。两秒钟的事。

还有Dream记录，很有意思。

PilotDeck有个机制叫Dream，就是AI在空闲时段会自动回顾整理记忆。昨天半夜它Dream的时候，把两个项目的排版要求合并了。我甚至能一键回滚这次Dream，恢复到整理前的状态。

这就叫白盒记忆。

我看到AI记住了什么，我知道它什么时候记的，我能改，我能追溯来源。

发现了一个特别有想象力的「智能体协作舱」

不算什么花哨的功能，这是生产力工具的基本要求。但市面上99%的AI工具做不到。

我还测试了记忆的隔离性。

同时开了三个WorkSpace，分别处理三个不同客户的项目。每

个项目有自己的文件目录、自己的记忆库。我让AI在项目A里学习了一套技术术语的定义，在项目B里学习了另一套完全不同的术语体系。两个项目跑了一整天，没有任何串扰。

这是真正的项目级隔离。

每个舱有自己的记忆空间，检索只在舱内进行。不会出现你问项目A的问题，AI用项目B的背景来回答。

对于同时处理多个项目的从业者来说，这个功能不是锦上添花，是雪中送炭。

02用PilotDeck设计游戏，比玩游戏还上头

说完了正经工作，我聊点好玩的。

我这个人除了写代码，还有个隐藏身份：桌游和RPG爱好者。

我一直想自己设计复杂游戏，但每次都是开了个头就放弃了。

和那种小游戏还不一样，大型游戏的世界观要编，角色要写，数值要算，技能要平衡，光是文档就能写几十页。

看别人做、也亲手试了几个方向，每一个都让我觉得以前那些烂尾的项目有救了。

PilotDeck呈现的案例，有一个让我印象最深：从0开始设计一个「塞尔达风格」的游戏。

主角在一个开放世界里探索神庙、解谜、打怪，设计初始区域的地图布局、三个新手神庙的谜题、以及主角的基础能力获取顺序。

操作里，看到先读取了所有的参考资料，然后在Project Memory里自动生成了当前项目进度：世界观设定完成度30%，地图设计完成度0%，谜题设计完成度0%，角色能力列表待补充。

PilotDeck会自动拆分任务。

它先设计草原的地形，用文字描述的方式输出了一张网格地图，标注了高地、河流、草丛和怪物营地。

然后它设计第一个神庙，这个神庙教主角使用炸弹能力。

再看最终游戏的效果，不管是3D动态效果的呈现，还是角色实际的行进探索，可玩性都挺好，左上角的数值能实时变动。

一个细节，连右下角的小地图都称得上清晰准确。

整个的玩法、流程，一套下来很丝滑。

我自己也动手试了下，把最爱的动漫《七龙珠》变成一个游戏，效果也是同样的高水准。

想做一个龙珠主题的卡牌RPG，玩家收集Z战士卡牌，每个角色有自己的气力值和必杀技，战斗系统基于猜拳机制。

我以前试着写过设计文档，写到贝吉塔的技能就写不下去了，因为要考虑角色平衡、技能搭配、以及和原作的贴合度。

这次我用PilotDeck建了一个新WorkSpace，叫龙珠Z-卡牌传说。

发现了一个特别有想象力的「智能体协作舱」

我先把原作的关键设定喂给它：赛亚人篇到沙鲁篇的主要角色、每个角色的经典招式、战斗力大致排名。这些信息存在Project Memory里。

然后我让它帮我设计角色卡牌模板。

它先输出了一个通用模板：卡牌包含角色名、生命值、气力值、三个普通技能、一个必杀技、一个被动特性。然后它开始逐个设计角色。

发现了一个特别有想象力的「智能体协作舱」

悟空的设计是：生命值1200，气力值150。普通技能有龟派气功、残像拳、界王拳。必杀技是元气弹，消耗所有气力，每消耗10点气力造成50点伤害。

然后我让它设计战斗系统。

基于猜拳机制，每个回合玩家和对手同时选择攻击、防御、蓄气三种行动之一。

PilotDeck帮我产出了一套完整的卡牌角色设计文档，包含十二个可玩角色和六个敌方BOSS。

发现了一个特别有想象力的「智能体协作舱」

每个角色的技能都有数值和描述，战斗系统的规则写了两千多字。

很快游戏就做好了。

我拿给做独立游戏的朋友看，他说这个设计可以直接拿去prototype了。

发现了一个特别有想象力的「智能体协作舱」

时常有朋友问我，怎么学AI。

想到可以做一个「游戏化的AI白话词典」。

平时看到很多AI术语，什么Transformer、自注意力机制、RLHF、MoE、RAG。

每个词条的定义，讲给身边人都有点枯燥，想学的朋友也容易忘记。

我就想，能不能做成游戏的形式，边玩边学？

在PilotDeck里建了一个WorkSpace，叫「AI白话词典-学渣拯救计划」。

发现了一个特别有想象力的「智能体协作舱」

我给它下达的任务是：把一百个核心AI术语做成闯关游戏。

每一关是一个术语，玩家需要先看一个生活化的类比解释，然后回答三道选择题，全部答对才能解锁下一关。每解锁十个术语，获得一个游戏成就徽章。

这个WorkSpace我打算继续维护，能长期保留。

每次我遇到新的术语，可以直接加进去，AI会自动按同样的风格生成类比和题目。

而且不同术语之间如果有关联，比如RAG和Embedding，AI会在题目里设计交叉知识点，帮助建立知识网络。

忽然觉得，PilotDeck在创意类工作上的潜力可能比在重复劳动上更大。

发现了一个特别有想象力的「智能体协作舱」

设计游戏需要大量的世界观构建、规则定义、数值平衡、文档整理，这些恰恰是AI擅长、人做起来又很耗时的环节。

而PilotDeck只是安安静静地在WorkSpace里干活，你随时可以看它记住了什么、改了什么、为什么这么改。

这种透明感，让我愿意把更多不成熟的想法丢进去试错。

03钱省了，觉也睡了

AI工具的成本是个很现实的问题。

我上个月用某个顶级模型跑了一个复杂的数据分析任务，跑了一晚上，第二天一看账单，花了我将近800美元。我当时就一个想法：这玩意儿我用不起。

PilotDeck内置了一个叫智能路由的功能。它自动判断任务难度，简单任务走便宜的小模型，复杂任务才调用能力最强的大模型。你什么都不用做，它自动帮你省。

我做了个对比测试。

用小红书风格写一篇产品种草文案，五百字左右。

发现了一个特别有想象力的「智能体协作舱」

不开智能路由，全程用Opus 4.5跑，花了12.58美金。开了之后，主模型Opus 4.5配子模型Sonnet 4.5，花了2.83美金。一模一样的输出质量，省了百分之七十。

PilotDeck把判断自动化了，做得比人还准。

它会从四个维度评估任务难度：步骤数量、依赖关系、外部知识需求、输出格式要求。

简单任务直接交给小模型，复杂任务才上大模型。语音生成类的任务还能自动部署端侧模型，数据不上传云端，隐私也保住了。

再说Always-on，也就是常驻任务。AI不用等你触发，它自己发现问题、自己推进、自己汇报。

我测试了一个「每日AI日报」场景。

我需要监控AI技术社区的讨论动态，每天抓取热度变化，生成简报。以前我得每天早上打开工具，输入指令，等它跑完，复制结果。

发现了一个特别有想象力的「智能体协作舱」

现在我在PilotDeck里设定好规则：每天早上八点，主动抓取过去二十四小时的数据，分析热度变化，识别新兴话题，生成简报并保存到文件夹。

然后我就可以放心去睡觉了。第二天醒来，简报已经在那儿了。

很多Agent，表面上在我帮我节省时间，实际上也在消耗我的注意力带宽。

希望都能像PilotDeck一样，让人在离线状态下，更省心。

发现了一个特别有想象力的「智能体协作舱」

04最后说几句

有时候觉得，AI产品经理、AI创业者，不要再在旧的框架里打转了。

完全可以从头开始，像原创设计一个太空舱、空间站一样，去创造一款AI Agent应用。

PilotDeck就给我这种感觉。

它跟OpenCLaw的共性是：有Agent哲学。

发现了一个特别有想象力的「智能体协作舱」

GitHub地址：https://github.com/OpenBMB/PilotDeck

每个项目应该有自己的生存空间，记忆应该是白盒的，成本应该是可控的，AI应该是主动的。

发现了一个特别有想象力的「智能体协作舱」

面壁智能的团队和清华THUNLP，在这个项目上展现的工程能力和产品判断，超过了我对学术团队的预期。

模型能力本身不再是壁垒，顶级模型之间的差距在缩小。

真正的Agent壁垒，可能就在三个方向：

记忆管理的精细度、成本控制的能力、主动执行任务的可靠性。

谁把这三个问题解决好，谁就能活下来。

PilotDeck已经都拿出了可验证的解决方案，接下来也将给更多Agent产品持续带来科研、工程、产品上的启发。

官网链接在这儿：

https://pilotdeck.openbmb.cn/

发现了一个特别有想象力的「智能体协作舱」

网易专栏 # AI # PilotDeck

文章版权归作者所有，未经允许请勿转载。

AI对就业影响仍有限传统指标或无法反映真实冲击

网易专栏 # AI # 就业影响

3个月前

Akash Systems押宝钻石技术突破AI散热瓶颈

网易专栏 # AI # Akash Systems

2个月前

挖漏洞何必Mythos，国产智能体早跑通了

网易专栏 # 360漏洞挖掘智能体 # AI

1个月前

Intuit裁员逾3000人，大力押注AI转型

网易专栏 # Intuit # IT

5天前

发现了一个特别有想象力的「智能体协作舱」

🤖 AI总结

主题

摘要

关键信息

一个 AI 写了自己 90% 的代码，然后估值涨了 25 倍

AI正在重写软件行业？8岁孩子做操作系统，一人公司拿下千万订单

相关文章

AI对就业影响仍有限传统指标或无法反映真实冲击

Akash Systems押宝钻石技术突破AI散热瓶颈

挖漏洞何必Mythos，国产智能体早跑通了

Intuit裁员逾3000人，大力押注AI转型

发现了一个特别有想象力的「智能体协作舱」

🤖 AI总结

主题

摘要

关键信息

一个 AI 写了自己 90% 的代码，然后估值涨了 25 倍

AI正在重写软件行业？8岁孩子做操作系统，一人公司拿下千万订单

相关文章

AI对就业影响仍有限 传统指标或无法反映真实冲击

Akash Systems押宝钻石技术突破AI散热瓶颈

挖漏洞何必Mythos，国产智能体早跑通了

Intuit裁员逾3000人，大力押注AI转型

AI对就业影响仍有限传统指标或无法反映真实冲击