如果说大语言模型(LLM)的爆发,是因为给它喂了全人类在互联网上敲下的海量文字。
现在,要让一个机器人拥有像人一样灵活的双手,学会倒水、叠衣服、甚至打篮球,它需要吃什么数据?
这也是整个人工智能圈同样最担心的问题。
在屏幕里,人工智能已经能够写出莎士比亚级别的戏剧;但在现实中,大多数机器人连着平稳地端起一杯水都费劲。
今天,我们要讨论的这位硅谷大牛给出了一个极其生猛且创新的答案:人类数据。
他叫徐丹飞。一直把自己定义为一个纯粹的“机器人学家”。
他不是那种只喜欢坐在屏幕前敲代码、调节参数的极客。
他最享受的,就是坐在真实的机器人旁边,看它动起来,看它摔坏,然后再亲手把它修好。
在这个主人都疯狂仰望“大模型”的时代,他却摔死了硬核的物理世界。
看完这两万字的深度对谈拆解,你不仅会看到一个非典型天才的疯狂成长史。
更会彻底看清的一瞬间,在通往“具身智能(机器人)GPT”的路上,其中藏着怎样残酷的路线之争和巨大的商业宝藏。
这不仅是一个技术科普,更是一份给普通人在AI时代的“生存指南”。
01
绝对的兴趣驱动:那奇妙的厌恶应试教育的“差生”
在普通人的想象里,能走进斯坦福的AI大佬,一定是个门门拿个超级学霸。
但徐丹飞完全不是。
他在初中和高中的时候,其实是个不折不扣的“学渣”。
他极度讨厌上课和考试,觉得学校对他来说只是一个社交和打发时间的地方。
他形容自己是一个极端“兴趣驱动”的人。
只要是不愿干的事,比如应付考试,他会绝对的“零努力”,面对老师和家长的压力也无所谓。
但如果是他感兴趣的事情,比如从淘宝买零件自己鼓捣单片机和小车,他就能投入100%的精力。
这种“只为热爱买单”的性格,在他高一那年走了一趟美国后,迎来了彻底的爆发。
他觉得这样的生活方式很有趣,于是下定决心要出国读本科。
一旦找到了目标,那个曾经为学习谋衍了事的男孩,瞬间就变成了拼命三郎。
在那个出国留学还是极少数人选择的年代,他没有找到任何人。
一个人在古早的BBS论坛里混迹,背着书包,自己搞定了所有复杂的申请流程。
他甚至高二读了一半没去学校了,彻底割掉了体制内的应试轨道。
他并没有感到害怕,反而觉得这种“剥离主流”的感觉非常可怕、非常刺激。
或许早年的经历,给他的人生刻下了深深的烙印。
那就是:他极其擅长在那种“没有框架、充满无限不确定性”的环境里完全生存和破局。
这简直就是为了从事前沿科研和配置的精密心灵智。
02
硬核本能:要做机器人,把电话直接打到硅谷
当你还有一大二个本科生的时候,你会好吗?
大多数人都感到茫然,或者按部就班地上课。
但徐丹飞觉得,自己对“做机器人”的渴望,已经到了一个快要爆炸的临界点。
但他所在的文理学院,根本没有这方面的顶尖资源。
换做别人可能就放弃了,但徐丹飞却做了一件奇妙的生猛的事:
他在网上疯狂搜索那些名字里标有“机器人(机器人)”的公司。
然后,一个人给他们打电话!
他大概打了二十多个越洋电话,直接问人家:“你们招不招实习生?”
有一家位于洛杉矶的传感器公司(SynTouch)的老板接到了电话。
老板觉得这个小屁孩简直是个奇葩,怎么会有人打电话来应聘呢?
徐丹飞非常直白地说:“你让我来吧,我们也不要你给钱,我就尝试研究。”
于是,他直接飞到了西海岸,开启了自己的硬件硬核之旅。
那个暑假,他每天和最前沿的传感器、机械手泡在一起。
因为太沉迷于“让东西动起来”,他甚至不小心搞断了实验室里七八根极其昂贵的机械手指。
但这种能亲手触摸辛苦、弄坏它再把它修好的过程,让他彻底上瘾了。
这还不是最夸张的。
后来,为了申请卡内基梅隆大学(CMU)的暑期项目,他给一位教授发了封邮件。
教授只回了一句“你的背景也许合适”,他二话不说,直接开着车,狂飙4个小时到了CMU。
他直接敲开教授办公室的门:“我们当面聊聊吧。”
那个暑假,他每天和另外一个研究人员,坐在一个后备箱塞满6台电脑的零售吉普车里。
一周有两天都在大马路上疯狂跑测试、收集数据。
凌晨三点蹲在实验室里调网络时间同步。
有人觉得这是枯燥的苦力活,他却觉得“这简直太帅、太开心了”。
03
拒绝内卷:为什么偏偏走向“机器人荒漠”的绘画?
凭借着这些精美的硬核履历,徐丹飞在申请博士时,毫无悬念地获得了CMU、UCB、斯坦福等顶级名校的Offer。
但他最后的选择,却让所有者大跌眼镜。
他选择了当今的风景。
要知道,在2015年左右的斯坦福计算机系,几乎所有人都在搞计算机视觉。
搞机器人的人,一个都没有。
用他自己的演讲,当时对于机器人研究的想象来说,就是一片彻底的“荒漠”。
那他为什么去?
因为其他学校给出的路径“太确定了”。
他如果去别的学校,他闭着眼睛都知道自己未来几年要怎样。
但沙漠那片充满了高度不确定性的“荒漠”,反而让他狩猎到了巨大的机会。
他确信,他能够做出一件“更大的事”。
离开斯坦福之后,他在AI女神李飞飞的实验室里轮转。
他当时做了一篇关于场景图的论文,在这个热门领域做得非常出色。
第二年,李飞飞问他:“你要不要继续做这个方向?”
然而,这是非常容易发顶会论文、极容易出名的大热门方向。
但徐丹飞极其干脆地拒绝了:“不要,我做机器人。”
他真的很想自己主导一件事情。
由于斯坦福没有成熟的机器人实验室,那他就从头开始自己搞。
只要导师给他亮了绿灯,他就如同一台不受控制的推土机,轰隆隆地向着自己认定的物理世界碾压过去。
04
行为克隆的逆袭:捅破学术界心照不宣的窗户纸
时间来到2019年,当时的整个AI学术界,陷入了一场对“强化学习”的极度狂热的关注。
大家觉得,既然AlphaGo能够通过对自我弈学会下围棋,那机器人当然也应该通过不断的试错,自己学会干活。
在当时的学术鄙视链里,有一种方法是被所有人看不起的,那就是“行为克隆”。
克隆是什么行为? 简单来说,就是人类手部教机器人怎么动,机器人像复读机一样照着学。
几乎所有大牛的论文创始人,都会无情地嘲笑这种方法:效率太低、智能不足、没有前途。
直到徐丹飞前往当时的全球AI圣地——DeepMind(谷歌命名的AI实验室)做暑期实习。
在那里,他看到了一个让全行业大跌眼镜的秘密:行为克隆不仅有用,而且非常强大!
DeepMind内部其实拥有非常好的遥控操作数据,利用这些数据做出来的行为克隆,效果好得惊人。
但为什么大厂们不对外宣传?
徐丹飞极其尖锐地指出:因为这“政治不正确”。
DeepMind 的招牌就是强化学习,如果承认“手截教”的笨办法更管用,那面子上根本挂不住。
实习结束后,徐丹飞彻底看透了学术界的“皇帝的新装”。
他跑回斯坦福,拉上好兄弟,决定直接遵循整个行业的硬刚观点。
他们花了整整三个月的时间,每天干到凌晨三点,从基础控制到算法架构,全部自己搭了一遍。
结果,他们用这种全网鄙视的“笨方法”,让机器人精密丝滑完成了长达长达30秒的极其复杂的开、放托盘动作。
这种行云流水的操作,在当时的圈子里,简直就是降维打击。
05
终极底牌:把人类变成机器人
虽然行为克隆被证明是走得通的,但很快,整个行业又撞上了一道堵叹息之墙:数据不够了。
想要让机器人干重活、细活,你就需要配备一款独特的笨重的VR设备,就像控制器提线木偶一样,远程遥控机器人去收集数据。
“遥控操作”不仅对人来说是极大的折磨,而且一天根本采不到多少有效数据。
更要命的是,不同的机器人之间,底层硬件的差异巨大,你在这个机器人上收集的数据,换一个机器人就彻底报废了。
就在所有人一筹莫展的时候,徐丹飞在后来的研究中,提出了一个堪称天才的反常识。
他反问道:“一个机器人的差距很大,但一个机器人和另一个机器人的差距,难道不会大吗?”
每个人本质上都是物理世界里的多个骨架和关节。
那只要我们在人的身上挂上足够多的传感器,这不就相当于“把人类变成了机器人”吗?!
于是,极其疯狂的一幕出现了。
徐丹飞团队让人开始戴上Meta的智能眼镜,直接以第一人称视角去记录人类日常生活中的每一个操作细节。
洗碗、切菜、倒水,这些人类每天有意识地完成“不经意的数据”,获得了训练机器人最宝贵的燃料。
这意味着什么?
这意味着我们再也不需要花几百万买一批机器人放在实验室里慢慢熬数据了。
全世界80亿人,每一个在做饭、打扫卫生的人,只要戴上设备,都可以成为生产“机器人灵魂”的超级矿工。
关于防疫机器人的战役,彻底从“比拼硬件配置”,变成了“争夺高质量人类数据”的无限战争。
06
普通时刻人的生存指南:全栈思维与机器人的GPT
在这个技术狂飙的时代,很多年轻人都感到担忧:AI这么强,我们以后到底该咋办?
徐丹飞在采访中提到了一个以人为本的极度反直觉:他讨厌“分工”。
在大厂里,大家习惯用螺丝钉钉住,有人负责视线,有人负责控制。
但徐丹飞要求他的学生,必须拥有“全栈”思维。
你不能只懂写代码,你还要懂硬件,懂数据采集,甚至机器人坏了你要能自己上去焊电路板。
因为在这个时代,纯粹的“算法工具人”是最容易被替代的。
只有当你对整个系统有了深刻而深刻的理解时,你才能在这个错综复杂的物理世界中找到真正破局的答案。
主持人问他,机器人的“GPT时刻”到底长什么样?
徐丹飞给出了一个严格清晰的定义:在任何场景下,让机器人做任何人能做的事情,成功率能达到40%到50%。
一旦跨过这个临界点,海量的资本、数据和应用就会像一样涌入,一个属于疯狂机器人的全新时代将彻底来临。
在这个人类数据即将点燃机器人的前夜,普通人该怎么办?
徐丹飞的回答精准通透,这也正是他一路走来的人生底色:
“不要有那么多的包袱,勇敢地去做你尝试的事。”
在正确的时代,顺应你内心真正的热爱,优先选择一条被主人嘲笑的“笨路”。
干就完了,有什么可失去的呢?
这里是杏仁的第二大脑,我为你拆解全球最聪明的大脑如何思考。如果你也渴望打破认知边界,如果你觉得文章对你有所帮助,随手点个赞、在看、转发三连吧,与我们一起终生进化
~谢谢你看我的文章。
请独立思考,保持批判
将复杂问题进行简化
用行动去证明你的观点