关于机器人的新栏目——“变形纪”
这是一款关于机器人内容的新栏目,名叫“变形纪(GoTransform)”。我们对于机器人的想象早已固定,而这个 AI 时代给了我们一次漫长等待之后的可能。
在这个新栏目中,我们会和你一起发问,一起探寻,一起享受一切关于机器人的岁月静好与光怪陆离。
欢迎你在留言中告诉我们你对于机器人的问题、期许,和吐槽。
看着别人家的机器人一个个活蹦乱跳,Sam Altman 多少有点着急。
过去一年,科技公司们最喜欢的事情,就是隔三岔五地安排自家机器人“登台献艺”——一会儿是叠衣服了,一会儿是削黄瓜皮了,要么就是Say Hi~凹造型,或者派对上斟茶倒水儿。
可 OpenAI 呢,早在2021年,他们就悄然解散了机器人团队,原因是缺乏训练机器人要用到的数据,导致研发受阻。
“不甘心”是第一生产力。蠢蠢欲动的 OpenAI 先是投资了现成的机器人公司,又重启了内部机器人团队。就在这个圣诞节前夕,有外媒曝出,OpenAI 在考虑开发一款人形机器人(humanoid robot)。
OpenAI,欢迎回到机器人世界
OpenAI 在近两年里,投资了三家机器人软硬件公司。
2023年,OpenAI 领投挪威机器人初创公司 1X,1X 主要开发轮式机器人,上半身类人,下半身却好像自动代步车。
产品 EVE 机器人,主要用于仓储打包。工作起来,脸上挂着清澈但愚蠢的笑容,脚踩风火轮,手上二指禅,就凭不拖延和情绪稳定这两点,我一辈子也学不来。
为了让 EVE 看起来更“亲民”一点,它被套上了针织连体衣,仔细一看,还有胸肌和翘臀(我十分怀疑里面是不是套了个活人),哪里恐怖谷了,纯纯搞笑男一个。
像极了离职打包东西走的我丨1X-tech
如今 EVE 内置了更为复杂指令和动作库系统,也接到了一些室内收纳的活儿。
今年 8 月,1X 推出了新款机器人 NEO Beta,集成了 GPT-4o 的语音模式,就像一个大管家,做饭、冲咖啡、收拾衣服、杂物。
今年 2 月,OpenAI 又注资了另一家机器人公司 Figure AI。且很快交出了成绩单。
3 月,Figure01 在演示视频里,表现出具备了大语言模型的常识和简单的思维链能力,简单说就是,看得懂、听得见、做得到。
全铝合金的“身体”里靠几根黑色电管串联到一起,还没等人类说话,它就用充满磁性的英音罗列了面前桌子上的所有物品。头部显示器里闪烁的加载动画,好像它真的会思考似的。
看得懂、听得见、做得到丨Figure AI
对人类提出的要求,它会转化为机器人指令序列,按步执行,比如“递个苹果”,“收下垃圾”,“冲杯咖啡”——打开咖啡机,把咖啡胶囊对准接口(如果没对准,还会手动摆正,确保胶囊入仓),放好杯子等咖啡冲好后,平稳地端给人类。
放错了,纠正丨Figure AI
操作过程中,还会和人类说话互动一下。反观人类在做什么?他就默默呆在一边,也不搭把手。
家政先锋丨Figure AI
就在上个月,OpenAI 又刚刚领投了 Physical Intelligence,一家机器人通用模型开发商,要将通用 AI 带入物理世界,让机器人像人类一样理解环境。
不太能确定它们是否具备了任务泛化能力,但在动作控制上确实做得挺细。两台粗旷、不加修饰的机械臂,能把硬卡纸折成餐盒,把短袖短裤叠得平整,把一打鸡蛋在冰箱里码得整整齐齐。
不是,人,我说你就干看着啊?丨Physical Intelligence
干活儿精细着呢丨Physical Intelligence
这些是 OpenAI 在外部的动作。而公司内部,机器人团队也已经重启。
原先机器人团队的创始成员 Peter Welinder,在团队解散后转为任职 OpenAI 产品副总裁,负责 GPT 的 API 服务。去年 8 月,Peter 成为“新产品探索副总裁”,负责用 OpenAI 的模型探索硬件产品,其中重点之一就是机器人。
11 月,OpenAI 把 Meta 机器人和消费硬件团队的负责人 Caitlin Kalinowski 挖过来,Caitlin 同时也是许多机器人初创公司的顾问。
一切为了数据
与 Figure AI 等公司的合作,让 OpenAI 看到高性能多模态模型如何一点一点推高机器人“智力”水平。
非常早期的探索中,OpenAI 做了实体机器人,单手拧魔方是研究之一。而重新回来给机器人做“大脑”,最有可能的原因是:为了数据。
上周,OpenAI 前首席科学家 Ilya Sutskever 在NeurIPS 2024 发表了观点:大模型预训练方式将走向终结。即人类只有一个互联网,而互联网的数据已经被大模型学的差不多了。
上述提到的机器人,都不是(或目标不是成为)执行单一重复性指令的工业机器人。而是在开放环境中,解决开放式问题的可协作的机器人——与机器人协作,与人类协作。
将机器人置于更多真实环境中,它便能获取到更多丰富和多样的数据。
专属于人类的“视觉”、“嗅觉”、“触觉”等五感数据,此前需要可穿戴设备才能收集,现在换由身披无数传感器的机器人来——一边当生产力,一边收集数据,反哺到更灵活大脑的开发中。
人们对于机器人能干什么早就想好了——你看看,大白、哆啦 A 梦、阿童木……人们只是在等。
另一位人形机器人狂热爱好者马斯克说,别急,他预计,到 2040 年,世界上将有至少 100 亿个人形机器人投入使用。这被人说是给特斯拉市值画上有史以来最大的饼。
马斯克恨不得走哪都带着 Optimus。而且,Optimus 跳起舞来的欢脱劲儿比他本人可一点不差。
不知道,这一次谁会先造出那块通向“通用人工智能”的黑石方碑。
作者:糕级冻雾
编辑:沈知涵
封面图来源:机器人之梦
本文来自果壳,未经授权不得转载.
如有需要请联系[email protected]