🤖 AI总结
主题
介绍MIT教授Gabriele Farina在AI博弈论与不完全信息决策领域的研究突破。
摘要
MIT教授Farina以低成本算法击败策戈棋冠军,推动AI在不完全信息博弈中的决策突破。
关键信息
- 1 Farina将博弈论与机器学习结合,推动决策算法理论。
- 2 其团队以不足1万美元成本击败策戈棋人类冠军。
- 3 Cicero系统在需谈判博弈的游戏中击败人类。
![]()
Gabriele Farina成长于意大利北部一个盛产葡萄酒的丘陵小镇。他的父母都没有大学文凭,虽然两人都认为自己”不懂数学”,但他们仍为他购置各类技术书籍,并支持他就读理科高中而非传统的文科高中。
大约在14岁时,Farina便开始专注于一个日后成为其职业生涯基石的想法。
“我很早就对’机器能够比人类做出更好的预测和决策’这一想法着了迷,”他说,”人类创造的数学和算法,能在简单构建模块的基础上,催生出某种意义上超越创造者的系统,这一直让我深感震撼。”
16岁时,Farina编写了一套程序,专门用于解析他与13岁妹妹一起玩的棋盘游戏。
“我用这套程序逐步推算最优落子,向妹妹证明——早在我们任何一个人意识到之前,胜负就已经注定了,”他说,并坦言妹妹对这套系统并不感冒。
如今,Farina是麻省理工学院电气工程与计算机科学系的助理教授,同时担任信息与决策系统实验室的首席研究员。他将博弈论的核心概念与机器学习、优化和统计等工具相结合,致力于推进决策领域的理论与算法基础研究。
本科就读于米兰理工大学期间,Farina主修自动化与控制工程。然而随着时间推移,他逐渐意识到真正激发自己兴趣的并非”单纯应用已知技术,而是理解并拓展其底层原理”。”我慢慢向理论方向转移,但始终非常重视将理论应用于具体实践,”他说。
米兰理工大学的导师Nicola Gatti教授——计算机科学与工程领域的学者——将Farina引入计算博弈论的研究领域,并鼓励他申请博士学位。彼时,作为家中第一个取得本科文凭的人,加之意大利的博士培养体系与其他国家差异较大,Farina坦言自己当时甚至不清楚”博士”意味着什么。
尽管如此,本科毕业仅一个月后,他便踏上了赴卡内基梅隆大学攻读计算机科学博士学位的旅程。在那里,他凭借出色的研究成果和学位论文斩获多项荣誉,并荣获Facebook经济学与计算领域奖学金。
博士毕业之际,Farina曾在Meta基础AI研究院担任研究科学家一年。其中一项重要工作是参与研发Cicero——一款能在涉及结盟、谈判与识别虚张声势的游戏中击败人类玩家的AI系统。
“在构建Cicero时,我们的设计原则是:若结盟对它不利,它绝不会同意;同样,它也能判断出某个玩家是否在撒谎,因为如果对方真的按所说的去做,将违背其自身利益,”Farina说道。
2022年,《MIT科技评论》刊文指出,Cicero或可推动AI在解决需要妥协与博弈的复杂问题上迈上新台阶。
从Meta离职后,Farina加入麻省理工学院担任教职。2025年,他荣获美国国家科学基金会CAREER奖。他的研究以博弈论为核心,借助其数学语言描述不同参与方目标各异时的博弈态势,并量化”均衡点”——即任何一方都没有动机改变策略的稳定状态——同时致力于简化现实世界中那些计算均衡点可能耗时数十亿年的庞大复杂场景。
“我的研究方向是:如何利用优化与算法,高效找到这些稳定点,”他说,”我们的工作试图为相关理论的数学基础带来新的洞见,更好地控制和预测这些复杂动态系统,并将这些思路应用于求解大规模多智能体交互问题。”
Farina尤其关注”不完全信息”场景——即部分参与者掌握其他人不知晓的信息。在这类场景中,信息本身具有价值,参与者必须审慎行动,避免因暴露信息而削弱其价值。最典型的日常案例便是扑克游戏:玩家通过虚张声势来掩盖手中牌面的真实情况。
对此,Farina表示:”我们如今所处的世界,机器在虚张声势方面已经远超人类。”
“不完全信息极为丰富”的场景,将Farina带回了他与棋盘游戏的最初缘分。策戈棋(Stratego)是一款军事策略棋盘游戏,曾吸引研究人员投入数百万美元,试图打造出能击败人类顶尖选手的AI系统。这款游戏要求玩家进行复杂的风险计算与迷惑性的虚张声势操作,在经典游戏领域,它几乎是唯一一个长期未能被AI超越的项目。
然而,Farina和他的研究团队仅花费不足1万美元的算法研发与训练成本——而非此前动辄数百万美元的代价——便成功击败了史上最强的策戈棋选手,战绩为15胜4平1负。Farina表示,以如此低廉的成本取得这一成果令他深感振奋,并希望”这些新技术能够被纳入未来的研究管线之中”。
“我们见证了算法在战略推理和稳健决策方面的持续进步,无论面对庞大的行动空间还是不完全信息,算法都展现出越来越强的能力。我对这些算法融入当前蓬勃发展的AI革命浪潮,充满期待。”
Q&A
Q1:Cicero是什么?它是如何在需要谈判和博弈的游戏中击败人类的?
A:Cicero是由Meta基础AI研究院开发的AI系统,能够在涉及结盟、谈判和识别虚张声势的游戏中击败人类玩家。其核心设计原则是:若结盟对自身不利则拒绝合作,同时能够判断其他玩家是否在撒谎。Cicero通过分析各方利益与行为动机来做出决策,体现了博弈论与AI技术的深度融合。
Q2:Farina团队是如何用低成本攻克策戈棋(Stratego)这一AI难题的?
A:此前攻克策戈棋需要耗费数百万美元的研发成本,但Farina团队通过开发新算法,将成本压缩到不足1万美元。最终,他们的AI以15胜4平1负的战绩击败了史上最强的人类选手。这一突破证明,在算法层面的创新可以大幅降低实现超人表现所需的资源投入。
Q3:什么是”不完全信息”场景?为什么它在AI决策研究中很重要?
A:”不完全信息”是指部分参与者掌握其他人不知晓信息的场景,扑克游戏就是典型例子。在这类场景中,信息本身具有价值,参与者需要审慎行动以避免暴露信息。Farina的研究正是聚焦于如何让AI在此类复杂环境中做出高效、稳健的决策,这对推动AI在现实多智能体交互场景中的应用具有重要意义。