一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

图灵奖得主萨顿联手他山科技,打造“能犯错”的机器人幼儿园

时间:2026-05-29 20:09:01 编辑:袖梨 来源:一聚教程网

2025年5月,图灵奖得主萨顿与他山科技在加拿大正式签约,双方将长期合作推进一个名为“机器人幼儿园”的项目。这个项目听起来挺特别——不是让机器人直接干活,而是让它们像一个孩子那样,在真实的物理世界里“犯错”并从中学习。

从理论到实践:萨顿的三十年押注

2024年,强化学习奠基人理查德·萨顿与导师安德鲁·巴托共同获得了图灵奖。这个奖项来得确实不算早——萨顿三十年前写下的理论,支撑了AlphaGo和ChatGPT的进化,但直到今天才被具身智能行业真正理解。2023年,萨顿参与创办非营利研究机构Openmind。2025年4月,他在联合发表的文章《欢迎来到经验时代》中一针见血地指出:“新一代智能体,必须拥有像人类一样在长时间尺度上不断推进的经验流,在真实的物理反馈中实现自我进化。”

凭什么让机器人直接学会所有动作?

传统做法是给机器人灌入海量标注数据,让它们一次就做对。但萨顿不这么看——智能体要从试错中学习,从真实经验里进化。这就好比一个孩子学走路,摔了千百次才站稳,机器人为什么就不能犯错?他山科技CEO马扬给出了一个很直白的判断:机器人要干活,无非解决移动和操作目标物体两个问题。用手去抓、去放、去拧,行为要流畅,不能被上一个动作的偏差打断。

触觉,或许就是那把钥匙

他山科技是一家中国触觉公司,与萨顿的理念一拍即合。机器人缺的是什么?缺的是“第一人称经验”。它们可以在模拟器里跑无数遍,但离开真实的触摸和反馈,就永远学不会“握鸡蛋”和“拧瓶盖”之间微妙的力度差异。萨顿把目光投向了这里——通过“机器人幼儿园”让智能体在真实的物理反馈中自我进化,而不是在虚拟数据里死记硬背。

可以说,这次合作算是给具身智能的下一个十年提前做出了判断:训练机器人的全新路径,也许就在真实的触摸与试错之中。一位图灵奖得主和一家中国公司联手,这事儿本身就挺有意思——它或许真能改变机器人学习的方式。

热门栏目