🤖 AI总结
主题
人工生物智能(ABI)如何推动生物学工程化,设计生命的前景与挑战
摘要
人工生物智能(ABI)结合AI与DNA合成技术,有望将生物学工程化,但面临基因组复杂性挑战,需谨慎应对生态与安全风险。
关键信息
- 1 ABI结合AI与DNA合成技术,可设计、构建并启动生命体
- 2 基因组重构面临意大利面条代码难题,AI助力解析生命语法
- 3 未来50年内生物学将成为首选工程材料,但需防范生态风险
![]()
如果生物学不再只是我们研究的对象,而是成为我们主动设计的材料,会怎样?这正是Adrian Woolfson新书《物种的未来:借助人工生物智能创作生命》的核心命题。该书于4月28日由MIT出版社出版。他认为,AI与DNA合成技术的进步正在推动生物学走向一种工程化范式——科学家可以生成全新的基因序列,并最终按需构建生命体。他将这种新兴能力称为”人工生物智能”(ABI),这是一个涵盖设计、构建并最终”启动”生命体的系统的统称。
然而,这一愿景面临一个根本性难题:进化并没有产生整洁、模块化的系统,而是经过数十亿年的渐进变化,塑造出功能相互交叠、结构混乱的基因组,与工程师所依赖的清晰架构相去甚远。部分合成生物学研究者已尝试对遗传密码进行”重构”——就像工程师重组计算机代码一样,对基因组进行重新整理,使其更易于理解和操控。但这种方法能走多远?要让生物学变得足够可预测以供工程化应用,又需要什么条件?在与IEEE Spectrum的对话中,Woolfson阐述了设计生命的前景与局限。
您将基因组描述为进化产生的”意大利面条代码”。是什么让生物学天然与传统工程原则格格不入?
Adrian Woolfson:在人造机器中,各组件通常是相互独立的,每个组件都有预定功能。一旦某个组件损坏,你可以直接替换,或在某些情况下修复它。但遗憾的是,生物学并非如此。生物学涉及的是一个具有涌现行为的复杂网络,这些行为建立在无数组件的微小贡献之上。
生物系统需要具备鲁棒性,能够高效应对损伤,而且它始终必须在已有架构的基础上继续构建,永远无法从头重新发明。生物机器是历史积淀与当前设计的复杂交织,其中包含许多工程师看来荒谬的设计组件。如果你从工程学角度审视人类基因组,你会说:”天哪,这简直是一团乱麻。”因为它是以机会主义、渐进式的方式构建起来的,没有任何预见性或主动设计。
合成生物学家如何改进这套”代码”?研究人员是如何对基因组进行重构的?
Woolfson:Drew Endy是这一领域的先驱。他以一种噬菌体为对象,提出:”如果我们把它当作一段意大利面条代码,对其进行清理、重构,重新整理成更易用的形式,会怎样?”遗憾的是,他提出这个想法的时候,相关技术还远未成熟,无法轻松实现。但他开创了将计算机代码思维应用于基因组的先河,提出了基因组可以被重构的理念。基因组已经大约四十亿年没有经过重构了——想象一下,如果有一段计算机代码四十亿年都没有被重构过,会是什么状态。
这项工作目前进展如何?
Woolfson:最好的例子可能是由Jef Boeke在纽约主导的合成酵母基因组项目Sc2.0。这个项目历时约15年,他一直在将各条合成染色体逐步组装进同一个生命体中。他所做的不仅仅是重构,更是真正意义上的重新设计。例如,酵母菌有16条染色体,而他构建了一条全新的第17条合成染色体。在另一项独立研究中,他还证明可以将这16条染色体合并为两条超大染色体,这是对遗传物质存储方式的重大重组。
但当你开始对这些基因组进行改动和重新配置时,不可避免地会引入代码错误,而这些错误往往会损害功能和生长。这并不意味着重新设计必然会造成生长障碍,只是需要投入时间去找到最优方案。当然,Boeke起步时AI还不存在,而AI的出现让这一切变得容易得多。AI将对我们把DNA转化为可预测工程材料的能力产生深远影响。
说到AI,您提出了”人工生物智能”(ABI)这一概念。AI将赋予我们哪些目前尚不具备的能力?
Woolfson:在AI出现之前,我们没有能力大规模设计DNA,无法凭空创造出能在生命体层面执行功能的全新DNA序列。现在,我们有了所谓的基因组语言模型,它有点像我们用来处理文本的聊天机器人,但操作的不是英文字母表的26个字母,而是DNA语言的4个碱基字母。
在操控DNA语言时,我们需要非常宽的上下文窗口,因为与文本不同——文本的大部分含义集中在句子或段落中——DNA中相距遥远的区域之间也可以相互”对话”。因此,我们需要能够识别这种远程作用关系的AI。以基因组语言模型Evo 2为例,它采用的架构拥有一百万个碱基对的上下文窗口,这意味着它能够识别相距一百万个碱基的碱基对之间的相互作用。
设计代码只是成功的一半。研究人员如何解决大规模物理合成DNA的瓶颈问题?
Woolfson:另一个过去所缺乏的关键能力,是以低成本、高速度、高效率大规模合成任意复杂度DNA的能力。当设计与构建这两种能力结合在一起,你就成为了一名工程师。一项名为Sidewinder的技术实现了成本的大幅降低,它能够以高度并行的方式构建DNA,从而极大地降低了DNA合成的成本,并提升了可扩展性。仅凭这一点,就使得将DNA作为工程材料的设想变得更加可行。
完成DNA的设计与合成之后,如何”启动”一个活的生命体?
Woolfson:这可能是最困难的部分。因为目前我们完全不知道如何构建一个人工细胞。Craig Venter曾证明,可以破坏细菌中的基因组并植入一个新的基因组——换句话说,细胞的行为类似于一台纳米计算机,而基因组则类似于软件。但将基因组导入细胞并非易事。
ABI这一概念涵盖了设计能力和构建能力,同时也包括将其启动为活体生命的能力。如果你同时具备这三种能力,你就完全掌握了作为技术的生物学。到那时,DNA将成为一种可编程材料,可以以可预测的方式加以操控。
如果研究人员真正掌握了这种能力,将会实现什么?
Woolfson:我的预测是,在未来50年内,生物学将成为首选的工程材料,许多读到这篇文章的人将成为生物工程师。生物学能够实现大多数材料所具备的功能,例如蜘蛛丝的抗拉强度堪比钢铁。当我们用AI对其进行重新设计后,其抗拉强度或许能达到钢铁的五倍。而且生物学还有一个额外优势——它能够生成智能材料。试想,如果你能拥有一种智能形态的钢铁,工程师将如何在建筑中加以应用?
从零开始设计一个功能性多细胞生命体,最难突破的技术瓶颈是什么?
Woolfson:我认为是我们对”生命语法”的认知还远远不够。AI恰好是解析这些语法规则的利器,它能够分析海量数据库,从中识别规律。在我们能够更流利地”说”DNA语言之前,我们无法设计出复杂的多细胞生命体;而要做到这一点,我们需要理解其语法;要理解语法,我们需要挖掘更复杂、更细致的数据库。我们需要成为”语法猎人”。每当我们让一个物种灭绝,就是在销毁这本语法书中的一页。我们需要将所有信息汇聚成一本完整的语法书。
最后,在踏上工程化生命这段旅程之初,现实中可能出现哪些失败模式?
Woolfson:我可以从两个角度来理解”失败模式”。一是机械性失败:当你剥离掉所有这些非正交性时,系统会变得脆弱,因为生物机器本是为了不失败而设计的,内置了大量相互重叠的故障保护机制。
另一种失败方式是变得危险。我们对生态系统的理解还远远不够,它们极难进行计算模拟。如果我们将工程化生命体释放到复杂的生态系统中,可能会造成严重破坏。而且,这些技术本身一旦落入错误的手中,就具有内在的危险性。因此,我们需要学会以安全、负责任、合乎伦理、透明且公平的方式使用它们,使其真正造福社会。
Q&A
Q1:什么是人工生物智能(ABI)?它和普通AI有什么区别?
A:人工生物智能(ABI)是Adrian Woolfson提出的概念,指能够设计、构建并最终”启动”活体生命的系统。与通用AI不同,ABI专门针对生物学领域,结合了基因组语言模型、大规模DNA合成技术以及将基因组导入细胞的能力。普通AI处理文本或图像,而ABI操控的是DNA的四个碱基字母,目标是让生物学成为像软件一样可编程的工程材料。
Q2:合成酵母基因组项目Sc2.0取得了哪些成果?
A:Sc2.0由Jef Boeke在纽约主导,历时约15年。项目不仅对酵母基因组进行了重构,更实现了真正意义上的重新设计:在原有16条染色体的基础上,构建了全新的第17条合成染色体;另一项研究还证明可以将16条染色体合并为两条超大染色体,实现了遗传物质存储方式的重大重组。但重新配置基因组不可避免地会引入错误,影响功能和生长,需要持续优化。
Q3:基因组语言模型Evo 2有什么特别之处?
A:Evo 2是一种专门处理DNA序列的AI模型,其最大特点是拥有一百万个碱基对的超大上下文窗口。这一设计至关重要,因为DNA中相距遥远的区域之间也存在相互作用,普通的小上下文窗口无法捕捉这种远程调控关系。Evo 2能够识别相距一百万个碱基的碱基对之间的相互作用,为大规模基因组设计提供了关键的技术支撑。