图灵奖得主萨顿联手他山科技，打造“能犯错”的机器人幼儿园

时间：2026-05-29 20:09:01 编辑：袖梨来源：一聚教程网

2025年5月，图灵奖得主萨顿与他山科技在加拿大正式签约，双方将长期合作推进一个名为“机器人幼儿园”的项目。这个项目听起来挺特别——不是让机器人直接干活，而是让它们像一个孩子那样，在真实的物理世界里“犯错”并从中学习。

从理论到实践：萨顿的三十年押注

2024年，强化学习奠基人理查德·萨顿与导师安德鲁·巴托共同获得了图灵奖。这个奖项来得确实不算早——萨顿三十年前写下的理论，支撑了AlphaGo和ChatGPT的进化，但直到今天才被具身智能行业真正理解。2023年，萨顿参与创办非营利研究机构Openmind。2025年4月，他在联合发表的文章《欢迎来到经验时代》中一针见血地指出：“新一代智能体，必须拥有像人类一样在长时间尺度上不断推进的经验流，在真实的物理反馈中实现自我进化。”

凭什么让机器人直接学会所有动作？

传统做法是给机器人灌入海量标注数据，让它们一次就做对。但萨顿不这么看——智能体要从试错中学习，从真实经验里进化。这就好比一个孩子学走路，摔了千百次才站稳，机器人为什么就不能犯错？他山科技CEO马扬给出了一个很直白的判断：机器人要干活，无非解决移动和操作目标物体两个问题。用手去抓、去放、去拧，行为要流畅，不能被上一个动作的偏差打断。

触觉，或许就是那把钥匙

他山科技是一家中国触觉公司，与萨顿的理念一拍即合。机器人缺的是什么？缺的是“第一人称经验”。它们可以在模拟器里跑无数遍，但离开真实的触摸和反馈，就永远学不会“握鸡蛋”和“拧瓶盖”之间微妙的力度差异。萨顿把目光投向了这里——通过“机器人幼儿园”让智能体在真实的物理反馈中自我进化，而不是在虚拟数据里死记硬背。

可以说，这次合作算是给具身智能的下一个十年提前做出了判断：训练机器人的全新路径，也许就在真实的触摸与试错之中。一位图灵奖得主和一家中国公司联手，这事儿本身就挺有意思——它或许真能改变机器人学习的方式。

推荐专题

最新下载

热门教程

图灵奖得主萨顿联手他山科技，打造“能犯错”的机器人幼儿园

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程