安卡·德拉甘:构建人机协作中的信任——机器人安全与价值对齐自主性的创新
AI名人堂

安卡·德拉甘:构建人机协作中的信任——机器人安全与价值对齐自主性的创新

  • 机器人技术
  • 人机交互
  • 协同自主性
  • 价值对齐
  • 可读自治权
  • AI安全
  • 跨学科研究
  • 教育与职业
  • 安卡·德拉甘
Tina

By Tina

March 25, 2025


早年生活与教育经历

安卡·德拉甘1986年出生于罗马尼亚布加勒斯特,当时该国仍处于共产主义政权末期。在向民主社会转型的环境中成长,她逐渐痴迷于通过数学解决问题的过程,将这门学科视为普世的"逻辑语言"。其早慧天赋很早就显现:14岁时,她已在罗马尼亚全国物理和数学竞赛中名列前茅,并最终代表国家参加国际数学奥林匹克竞赛。德拉甘将其分析思维的锤炼归功于以抽象推理著称的罗马尼亚严格教育体系。

她就读于布加勒斯特大学本科,2005年以数学学士学位最高荣誉毕业。对应用系统的兴趣引领她进入卡内基梅隆大学(CMU),在机器人专家西德哈斯特·斯里尼瓦萨指导下,于2007年获得机器人学硕士学位。其论文探索了人机运动规划的早期概念,预示了她后来对协作式自主系统的研究重点。德拉甘继续在CMU攻读博士学位,2015年完成开创性论文《人类环境中机器人的运动规划》,该研究将机器人预测和适应人类行为的算法形式化,为安全的人机交互奠定了理论基础。

职业生涯与研究贡献

2017年受聘为加州大学伯克利分校助理教授后,德拉甘创立了InterACT实验室(自主系统交互与协作中心),致力于重新定义机器人与人工智能系统与人类的共存方式。其研究围绕两大支柱展开:价值对齐(确保AI目标符合人类意图)与可解释自主性(设计行为可被人类理解的系统)。最具代表性的成果是与皮特·阿比尔、斯图尔特·罗素共同提出的协作逆向强化学习(C-IRL)。不同于传统逆向强化学习假设人类被动观察,C-IRL将人机交互建模为动态博弈,使机器人能推断人类意图同时明确传达自身目标。该框架现已应用于医疗(如辅助外骨骼)和制造业的协作机器人。

德拉甘的贡献超越学术范畴。作为Waymo(谷歌自动驾驶部门)顾问,她参与设计了应对不可预测行人行为的自动驾驶汽车安全协议。其2020年论文《简洁的隐性成本:为何奖励工程不足以实现对齐AI》挑战了对预设奖励函数的过度依赖,主张通过人类反馈学习伦理约束的模型——这一核心理念现已成为她担任首席研究员的伯克利人类兼容人工智能中心(CHAI)的研究重点。

她的跨学科方法融合了控制理论、认知科学与伦理学。代表性项目包括:

  • 共享自主算法:使无人机和手术机器人能根据人类操作者专业水平调整自主程度
  • 亲社会机器人行为:开发在公共场所遵守社会规范(如排队规则)的机器人
  • AI透明度工具:创建实时解释自主决策的可视化系统

德拉甘始终强调"安全不是约束而是核心设计原则",这一理念也体现在她对人工智能部署监管框架的倡导中。

获奖与荣誉

  • 2017年斯隆研究奖
  • 2020年《麻省理工科技评论》35岁以下创新者
  • 2021年IEEE机器人与自动化早期职业奖
  • 2022年AAAI早期职业奖
  • 2019年美国国家科学基金会职业奖





















































































相关文章

首页iconAI名人堂icon

安卡·德拉甘:构建人机协作中的信任——机器人安全与价值对齐自主性的创新

© Copyright 2025 All Rights Reserved By Neurokit AI.