茉莉花新闻网

中華青年思想與行動的聚合地

2026-02-21 18:52:48

动荡了几年的微软游戏业务,今天又迎来巨大人事变动。

在 Xbox 诞生之初就已经加入团队,掌舵 Xbox 长达 12 年的传奇高管菲尔 · 斯宾塞(Phil Spencer),今天宣布退休,即将离开微软。

Phil Spencer Xbox

他亲眼见证 Xbox 的诞生,在低谷时刻出手拉了它一把,最终又在时代转向之际,选择「亲手」为传统主机时代画上句号。

从狂热玩家,到 Xbox 掌舵人

对于全世界的玩家来说,菲尔 · 斯宾塞这个名字恐怕不会陌生,甚至还有几分亲切,在粉丝眼中,他几乎就是 Xbox 品牌的「吉祥物」。

1968 年,菲尔 · 斯宾塞在美国华盛顿州出生。对于有点内向的他来说,电子游戏很早就成为了生活的一部分。

在华盛顿大学读书的时候,斯宾塞遇到了自己的第一款「人生游戏」——《机器人 2084》(Robotron 2084)。他在学校附近的 7-11 便利店街机上度过了无数个夜晚,也因此接触到了古早的电子游戏社区。

Robotron Arcade at the Time Rift Arcade in Bedford Texas Hero 1920x1080

很快他也意识到,游戏不仅属于朋友之间。他和父亲经常一起玩  Commodore 64 上的「One-on-One」篮球游戏,这也是他第一次和家人一起玩游戏。

polaventris

▲ 图源:YouTube@Polaventris

1988 年,距离 Xbox 诞生还有 13 年,刚满 20 岁的斯宾塞加入了微软。虽然他一开始担任的是技术岗位,但除了写代码还做过项目管理、商务协调等等,工作经验相当多元。

即使工作很忙,斯宾塞并没有放弃对游戏的热爱。很快同事也发现了身边有这么一号「游戏狂人」,不仅在办公室打《网络创世纪》——斯宾塞甚至是这款游戏的「测试服」玩家,他还经常出没于街头的街机厅。

bzddbl9obnmj

▲ 《网络创世纪》

2001 年,为了抵御 PlayStation 2 在游戏和多媒体上的冲击,微软推出 Xbox 主机。作为一名知名游戏发烧友,斯宾塞很快也被调往 Xbox 部门,担任微软游戏工作室 EMEA(欧洲、中东和非洲)总经理,负责和游戏工作室,例如 RARE、狮头的合作。

Xbox 360 时代,他开始整合内容资源,在微软内部推动自有 IP 与工作室的长期布局,《战争机器》《光环》等经典第一方系列,都是他推动的项目。

360

▲ 《战争机器》限定版 Xbox 360

其实从这些早年的工作方向可以看出,比起 Xbox 硬件,斯宾塞的工作重心放在了 Xbox 的游戏内容和软件服务,这样的取向在他 2014 年正式接手 Xbox 部门后,彻底影响了这个品牌的走向。

Xbox One 发布后,由于强调多媒体消费而非游戏,遭到了玩家的强烈不满。2014 年,斯宾塞临危受命出任 Xbox 掌门人,上任第一件事就是将焦点拉回「游戏」:取消强制联网、推动 Xbox 兼容计划,并进一步加强培养第一方工作室。

one

与此同时,斯宾塞也萌生了对游戏租赁服务的构思。

彼时,影视流媒体 Netflix、音乐流媒体 Spotify 开始崭露头角,微软也正在不断加强云服务的战略,斯宾塞和 Xbox 部门决定将游戏租赁服务转向订阅模式。

2017 年 6 月,Xbox Game Pass 正式问世,允许用户通过云端下载和游玩游戏,例如 Windows、iOS、Android,而不仅限于 Xbox 主机,整个 Xbox 品牌开始了战略转型。

spencer gamepass HD scaled

除此之外,斯宾塞还主导了 2020 年对 Bethesda 以及 2023 年对动视暴雪的收购。后者成为了游戏史上规模最大的收购之一,也让微软的内容储备空前强大。2022 年,Xbox、Bethesda、动视、暴雪、King 等相关业务正式组合并升格为「微软游戏」Microsoft Gaming,斯宾塞出任 CEO。

但斯宾塞并没能带领微软游戏业务再创辉煌。这两年,微软不断传来关闭工作室、裁员的消息。在今年 1 月份的财报中,整个 Xbox 部门营收同比下降 9%,硬件业务同比下滑 32%。

在索尼 PlayStaion 5 和任天堂 Switch 销量都破亿的情况下,同一世代的 Xbox Series S|X 销量预估不足 3000 万,是微软销量表现最差的游戏机。

xsxx

▲ 斯宾塞和 Xbox Series S|X

而 Xbox Game Pass 已经成为了 Xbox 业务的收入支柱。在 2025 财年,XGP 创造了 50 亿美元的收入。只是成本和开支不断增大,微软也不得不调整 XGP 的费用和产品组合。1 月财报显示,Xbox 游戏订阅收入下降了 5%。

Xbox Game Pass Hero hero 58b7e3999a00d

与此同时,微软却对 Xbox 的盈利能力提出了 30% 利润率的高要求,作为对比,近几年 Xbox 的利润率在 10% 到 20% 之间浮动。

不管怎么看,Xbox 又来到了一个低谷时刻,只是上一次扶大厦之将倾的人,这次选择了离开。

斯宾塞将会持续担任顾问直到今年夏季。至于 38 年的微软和 Xbox 之旅后,这位游戏迷人生的下一道「关卡」在何方,还尚未可知。

AI 出身的接班人

对于外界来说,斯宾塞选择在这个时间点退休,多少有点始料未及:去年夏天微软才说完「斯宾塞短期内不会离职」,也有爆料称斯宾塞至少会留任到下一代 Xbox 发布。

更耐人寻味的是,原本被业内视作斯宾塞「接班人」的 Xbox 总裁 Sarah Bond,也在同一时间宣布辞职,即将离开微软。

在宣布辞职前 3 个小时,Bond 还在领英上发布了和工作相关的动态,征求大家对 Xbox 无障碍功能的意见,说明离职很可能是一次临时决定。

sarahbond

接棒斯宾塞成为微软游戏 CEO 的,则是一个大部分玩家此前都未曾听过的名字——Asha Sharma。

asha sharma 1024x683

接手游戏部门之前,Asha Sharma 主要负责 AI 业务,担任微软 CoreAI 产品总裁,也在 Meta 出任过领导岗位。纵观她的履历,微软游戏业务 CEO 是她第一个和「游戏」有关的职务。

比起知道游戏哪里好玩,这位高管更擅长将 AI 深度集成至开发流程,优化整个开发进程提升效率。

sharmarv

在首条备忘录中,Sharma 表示自己的第一项任务就是:了解 Xbox 业务的运作原理,并保护它。

除了承诺不会让「没有灵魂的 AI 泔水(AI Slop)」进入 Xbox 游戏中,Sharma 还强调,自己将致力于「Xbox 的回归」。

她还提拔了此前执掌 Xbox 游戏工作室的 Matt Booty, 他将成为微软游戏的执行副总裁和首席内容官,将负责进一步整合游戏内容。

Asha Sharma and Matt Booty Primary

▲ 左:Asha Sharma,右: Matt Booty

和本身就是一名狂热玩家的斯宾塞对比,Sharma 连是不是玩家都要打一个问号,这样的落差自然引来了玩家们的质疑和担忧,主机文化的那种认同感也会松动。

comment 1

当然,这也不代表 Xbox 品牌的末日到来,主管不是玩家,不代表她做不好游戏业务。任天堂传奇社长山内溥本人也不玩电子游戏,但在他的带领下,任天堂从卖纸牌的玩具公司,摇身一变电子游戏世界的霸主。

hiroshi yamauchi 580

这位 AI 主管入主 Xbox,说不定也能为这个危机四伏的业务,注入全新的血液。

Xbox 会回归,但回归的已不是「Xbox」

在斯宾塞的带领下,「Xbox」整个品牌已经彻底转型,从传统围绕主机硬件构建生态,变成通过云服务让生态无处不在。

作为 Xbox 护城河的《光环》系列,将于今年正式登陆索尼 PS 平台,已经意味着微软彻底放弃主机大战那种竞争模式,让更多人玩上游戏更重要。

maxresdefault 1

比起销量平平的 Xbox Series X|S 主机,微软屡次肯定商业价值的游戏订阅服务 Xbox Game Pass,才明显是这几年 Xbox 品牌的「旗舰产品」。

这种前提下诞生的次世代 Xbox,自然也会有所不同。

不管是多个媒体爆料,还是微软官方多重暗示,我们几乎可以确信,下一代 Xbox 主机和掌机,会更接近一台 Windows PC,不仅兼容 Xbox 生态,也能和 PC 一样使用 Steam、Epic 等第三方游戏商店。

微软 CEO Satya Nadella 在一场访谈中透露:

人们认为主机和 PC 是两种不同的东西,这有点好笑。我们打造游戏主机是因为想要制造一台性能更好的 PC,以便可以进行游戏,所以我想重新审视一些传统观念……游戏主机会提供强大的的性能,我认为也会推动系统的发展。

微软和华硕合作的 ROG Xbox Ally 掌机,完全可以看作是一台未来 Xbox 的雏形——运行完整的 Windows 11 系统,使用 Xbox 全屏界面覆盖,只启动必要的系统进程,确保硬件能释放出更多性能。

rog xbox ally x press image 2 1 1

这也意味着,所谓的「Xbox 硬件」不会只是微软独家产品,更多 OEM 厂商可以取得授权,打造自己的 Xbox 主机或掌机,就像 PC 产品一样。

对比索尼、任天堂这些对手,跳出硬件拘束,平台更广阔的微软,更能把 Xbox 整合成「服务 + 品牌 + 内容」的产品形态,这在游戏行业也是非常少见的。

gamepass2

AI、云计算设施上的布局,也是微软这家科技企业独有的优势。一月份,Google DeepMind 发布了三代视觉语言模型 Genie 3,其快速生成可交互 3D 世界的能力,让游戏引擎巨头 Unity,以及Take-Two、任天堂、CD Projekt Red 等制作商股价应声下跌,直观反映了 AI 对于传统游戏制作的冲击之大。

genie3

▲ Genie 3 生成的游戏场景

选择一位熟悉 AI 的高管出任 Xbox 掌门人,释放的信号已经不能再明显:在这个「AI 改变万物」时代,微软也有意用 AI 来改变传统游戏的创作方式。

sharmaspencer

▲ Asha Sharma 和菲尔 · 斯宾塞

这不意味着 AI 就要取代传统的人类开发游戏,AI 只是一种手段和技术,决定游戏灵魂的还是人类的创意和想法,而刚好,微软手里同样也有着不少大名鼎鼎的游戏开发者资源。

回到传统的「游戏大战」视角,比起任天堂索尼,Xbox 的处境当然相对较差,面临的压力也巨大,但背靠科技公司的微软,反而手上能整合的资源最多。

对于那些原教旨主义的玩家和 Xbox 粉丝来说,很可惜,曾经纯粹的主机和游戏品牌「Xbox」,甚至在菲尔 · 斯宾塞离开之前,就已经「死去」。

但对于微软,以及整个 AI 时代来说,一个崭新的 Xbox,正在诞生。

编者按:
当 AI 开始寻找自己的形状,有些选择出人意料。
AI 在智能手机上生出了一颗独立按键,似乎让智能手机找回了久违的进化动力。眼镜凭借着视觉和听觉的天然入口,隐隐有了下一代个人终端的影子。一些小而专注的设备,在某些瞬间似乎比 All in one 的设备更为可靠。与此同时,那些寄望一次性替代手机的激进尝试,却遭遇了现实的冷遇。
技术的落地,从来不只是功能的堆叠,更关乎人的习惯、场景的契合,以及对「好用」的重新定义。
爱范儿推出「AI 器物志」栏目,想和你一起观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

我很难用熟悉的软件分类去安放 Typeless。

它跟传统输入法格格不入——界面里几乎看不到键盘,最显眼的是一个语音按钮。它也跟那些自称「AI 加持」的输入法不太像,那些产品总喜欢把功能铺满首页,Typeless 的功能反而少得可怜,像是故意把选择题删成了一道填空题。

这份不合群带来一个关键词:越界。

输入法原本服务人与人沟通,目标清晰——打字更快,选词更准。Typeless 把边界往外推了一步,它更在意把自然语言说出的需求梳理得井井有条。它把语言提炼成想法,或者说,它从一段话里捞出真正的意图,再把意图写成一段能直接用的文字。

输入的对象变了。不只是写给人,更多是写给模型。

一款会思考的输入法

我第一次意识到它「会思考」,是在最普通的口述里。

说话时会绕,会补充,会重复,也会用很多填充词。Typeless 的输出更像想清楚之后才落笔的版本——句子更短,信息更集中,语气更收敛。它不执着把说过的每一个音节都留下来,更在意到底想表达什么。

typeless002

▲ 口述内容被 Typeless 转写后

临时改主意时,差异更明显。传统听写会把自我修正一股脑堆在屏幕上,留下许多中间态。Typeless 更像把中间态折起来,只把最后那个「定稿」留下。屏幕上出现的不是过程,是结果。

Typeless005

需要把一段想法拆成条目时,用普通输入法得先说完再自己排版。Typeless 往往会主动把结构摆出来,逻辑顺序更清楚,段落边界更干净。它像是随手把笔记整理了一遍。

「边说边改」是另一种用法。说完一段话,接着补一句改写要求——更克制、更正式、更短,或者把语气改成邮件——它会在原文上直接调整。不需要停下来选字、删句、重写开头,只要继续说出修改意图。

rewrite

翻译也是高频场景。需要中英来回切换时,它把翻译变成输入动作的一部分。更省心的是语气处理,它不会把句子翻得像说明书,整体更接近日常沟通。

typeless003

在办公室或通勤场景里不方便大声说话?它提供了小声输入一类的模式。语音输入过去常被「场合」限制,这类适配决定了它能不能真的用起来,而不是只在安静房间里表现良好。

常用表达也能做成快捷方式——一段固定格式的确认信息,一段常用的工作回复。Typeless 更像把这些东西做成可调用的块,减少重复劳动。输入法从「敲字」变成「调度」。

Typeless004

这些体验汇总到一个点上:Typeless 一直在 Thinking。它把杂乱的口语消化掉,再把更有条理的文字吐出来。它不追求完整复刻说话的全过程,它在整理真正的想法。

这是它最不一样的地方。

AI 器物的新物种

在讨论 AI 产品时,我们更习惯看到的是软硬结合的新尝试——智能眼镜、AI 耳机、豆包手机,它们在新场景里重新定义硬件的形态和交互方式。Typeless 走的是另一条路。

1 1

它是纯软件工具,但本质上仍然是硬件的延伸。

从打字机到键盘,再到输入法,这条线索一直存在。打字机把手写变成了机械敲击,键盘把机械敲击变成了电信号,输入法把电信号变成了字符选择。每一次演进,都是在人与文字之间增加一层更高效的转译机制。

Typeless 延续了这个逻辑,但加入了一个新元素——AI 不再只是辅助选字或纠错,它成为输入链路的核心。

传统输入法关心的是「把字打出来」,效率体现在敲击次数、选词准确率、响应速度。到了模型时代,真正消耗时间的往往不是第一次把需求说清楚,而是后续的反复修改。一次改动里夹着大量细节——语气、结构、删改尺度、信息顺序,每一项都需要来回拉扯。人工沟通的成本会在这一步迅速膨胀。

Social Preview Asset Search

Typeless 解决的就是这段拉扯。

它让「说一句—改一下—再说一句—再改一下」变得顺滑,五到十分钟内把十轮调整连续做完。每一轮都能直接看到结果,马上继续下一轮。输入不再以「把字符敲完」为终点,而是以「文本进入可继续加工的状态」为终点。

这里出现了一个新的「精准输入」。

打字机和键盘诞生时,精准指向的是某个字、某句话。AI 时代的输入变长了,上下文变厚了,沟通频次也变高了。现在的精准更像针对一段超长上下文的控制:按想要的方式分段,或者连写;把某一句压短,或者把某一段扩写;要求它不要分点,或者把逻辑拆成几条。

控制对象变了,输入法的职责也随之变化。

这也是「给 AI 用的输入法」的含义。

7M301285

▲ Prompt 由 Typeless 转写而成

Typeless 的重点不在社交表达的情绪张力,它更适合把需求交给模型,再把模型产出收拢成能用的文本。它强化的是人与 AI 的沟通效率。商业模式也很符合这种取向——界面极简,没有广告位,付费方式更像「为结果付费」。订阅用户不限量,非订阅用户每周有固定额度。产品用得越多,价值越容易被衡量。

把它放回国内输入法的语境,对比会更清晰。

老派输入法以搜狗为代表,今天也能加上「AI」二字,也能提供一堆 AI 功能。但它依旧像原来的产品——键盘还在,广告和功能标签也还在。输入法被迫承担太多与输入无关的任务,效率容易被稀释。

sogo

另一类是 AI 工具的延伸,比如豆包或微信输入法,它们更像把既有的 AI 能力塞进键盘里,做成一个入口。入口当然有用,但入口并不等于工具。入口解决的是「去哪里用 AI」,Typeless 更关心「怎样把 AI 用得更精确」。

comparison2

▲ 左边为豆包输入法听写,右边为 Typeless 听写

真正的 AI 输入法,服务的对象变了。它主要服务与模型的高频沟通,服务长上下文里的精确控制,服务反复修改直到结果落地。它不需要把自己做成一个热闹的广场,它只要把那条最难的链路打通。

它也有副作用。用它跟同事沟通时,偶尔会显得过于干净,像把语气里的缓冲都删掉了。对方会觉得不够有人味。会在这种场景里切回普通输入法,手动敲几句更口语的句子,补一个表情,或者加一段无意义的笑声。这不是 Typeless 的问题,而是它的真实位置——它最自然的场景是与 AI 沟通,不是与人闲聊。

download

▲ 给同事发显得有点「人机」感

输入法向来是残酷的赛道。到处都能用,也意味着到处都会被挑剔。每一次卡顿、每一次误判、每一次隐私疑虑,都会直接影响它能否留下来。Typeless 要证明的不是「模型有多强」,而是「日常输入是否真的变快、变准、变省心」。

当人与 AI 的沟通变得日常,输入法可能会成为最隐蔽、也最核心的接口。它要做的不是替用户写完一切,而是把说出的信息整理成更可控、更可迭代的文本,让「多轮修改」从一种负担变成一种自然动作。

这类产品最终能不能站住脚,取决于两件事:一是它能否在所有细碎场景里保持稳定,二是它能否让「为结果付费」变得理所当然。

plan

输入层向来没有中间地带——要么融入习惯,要么被迅速替换。Typeless 作为 AI 产品演进史上的一个新节点,把自己定位在了那条更窄、也更陡的路上。

One more thing: 我们是怎么用嘴「喷」出一篇文章的

上面的这些文字,以及下面的部分文字,我们全程只动了嘴皮子,指挥 Typeless、ChatGPT、Claude 等工具完成,没有手打一个字。

按照以往,要写一篇这样的文章,最少也得花上 2 个小时,现在只用了 30 分钟。

先介绍一下这个产品的具体细节。Typeless App 支持手机端的 iOS 和 Android,以及电脑端的 Windows 和 Mac。

免费方案提供每周 4000 字转写;而付费没有字数的限制,每个月 30 美元,每个季度 60 美元,一年 144 美元。

Typeless012

这个价格并不便宜,但它很符合 AI 时代「付费交货」的结果导向模式,即使是免费用户,也不会遇到广告和太多限制,最主要的差距仅限转写字数。

其实 Typeless 不太像一个「输入法」,它完全没有传统的键盘,只有少数几个按键,更不用提什么 AI 斗图、表情包的功能,只做好「语音转文字」的本职工作。

typeless001

我很喜欢 Typeless 的在设备上全局的集成形式——手机上是输入法,电脑上是热键,让它可以像 AI 助手一般跨应用使用,这是 ChatGPT 无法给出的细节体悟。

整个过程还挺有意思,一开始我们只是想测试用 Typeless 和 ChatGPT 进行写稿的过程,但随着一轮一轮的对话深入,稿子不断打磨,最终出来了一篇观点明确的文章,不仅行文流畅,AI 味也很少。

一开始,我们先抛出了一些初步的想法,关于 Typeless 这个产品的一些观点,以及资料收集和写作注意事项,这些「意识流」的口述被 Typeless 整理成条理清晰的文字,直接用作 ChatGPT 的提示词。

Typeless006

ChatGPT 给出的第一版稿件没啥信息量,结构也不正确,语言平铺直叙还很有 AI 味,距离一篇好看的文章还有不小距离。换做平时,想要给细致的修改建议,不免得要花大量的笔墨给出新的提示词。

Typeless007

▲ Prompt 由 Typeless 转写

但现在我们有 Typeless,只要把听写打开,我们可以从头到尾一句一句提修改意见,并根据文段补充相应的观点和叙述。

Typeless008

▲ Prompt 由 Typeless 转写

我们需要尽可能给出细节,比如对比 Typeless 和搜狗、豆包、微信输入法区别的部分,就需要强调这几种产品的差异,AI 在写作时才能凸显 Typeless 的优势。

comparison

▲ Prompt 由 Typeless 转写

经过几轮的修改,ChatGPT 生成的内容已经相对完善,这时候我们可以换用 Claude 进行润色。

我们首先给 Claude 喂了几篇爱范儿写过的 AI 新硬件文章,让它充分学习我们行文的风格,据此来修改 ChatGPT 的草稿。

Typeless009

Claude 的初稿也还有提升空间,这时候我们可以继续用 Typeless 帮我们转述一些相对更细节的修改建议,直到满意为止。

Typeless010

▲ Prompt 由 Typeless 转写

其实我们对着 Typeless 侃侃而谈的文本量,累计可能已经比最终的成稿还要大,但出稿的效率大大提升,并且过程要比单纯写作更加轻松。

AI 时代,Typeless 应该「无处不在」

一开始试用 Typeless 的时候,作为一个不太习惯用语言来梳理想法和表达自己,也不需要长篇大论去表达想法的人,我会觉得它不适合我,更适合天天需要给出大量反馈的领导、Mentor、甲方人群。

但进一步探索使用之后,我觉得我还是狭隘了。在这个 AI 时代下,Typeless 不应该只是一个独立的 App,更应该成为一种「标配」无处不在。

从小处说,「语音转文字」,远远不能停留在「准」,在 AI 时代下更应该追求「精」。以后发语音转文字就全是精炼的信息,而不是满屏的「呃」「那个」以及口误。

wechat

▲ 42 秒的语音有用信息只有 10 个字

比起给爸妈手机装一个 Typeless,我更希望类似的功能直接集成到微信中——或者说,所有应用内置的「语音转文字」功能,都值得以 Typeless 的方式重做一遍。

更大的价值,在于 Typeless 给 AI 交互提供了一种新的可能。

哪怕是每天都在写稿,我的表达能力经常追不上自己的想法。甚至不是写稿,只是用键盘和 ChatGPT 对话,很多时候火花在敲击字母的时候,就已经熄灭。

改成开口说话,事情会轻松很多。我不必先想好结构,也不用马上挑最精确的词,语言会先把材料「拽」出来,观点和洞察会更自然而然流淌。

2 3

这就像在现场指导一个实习生做修改,指令可以很细,细到每一句话怎么落地——是的,我们每个人都有了 AI 作为「乙方」。

指望「一句话」让 AI 生成一切,基本不现实,信息密度太低,AI 很容易离题,素材又撑不起来,于是成品常常空、泛、虚,表面上写完了,读起来却像没落过笔。

对于 AI 来说,「上下文」很大程度决定了生成的质量,我们必须要给模型「喂」大量的想法、观点和语料,才能得到更符合预期的结果。为什么这两年内存价格大涨?要运行和训练 AI,超大的上下文必不可少,于是 AI 行业产生了对内存的巨大需求。

用 Typeless 的体验,更像是在给 AI 喂一份更丰富的语料,生成的内容有据可依,观点也够牢靠,AI 更多只是负责把这些碎片变成更好读的文章。

所以,不仅微信可以集成类似 Typeless 的功能,所有的 AI 公司,完全可以把这种「AI 翻译层」集成在聊天机器人之中,引导用户把提示词往多了说。

而只要用户给 AI 注入的内容够多,AI 模型能力的差距,也会被进一步缩小。

typeless011

▲ 用 Typeless 转写的超长 Prompt

或许有人会对 Typeless-ChatGPT 这套解决方案有点悲观,这岂不是意味着,人类创作真的会彻底在 AI 时代消亡?

是,但又不全是,Typeless 只能消除「写作」这件事的成本和门槛,但却进一步凸显出「思想」的重要,让人类的感悟、观点、洞察变成了写作真正的核心。

2026-02-16 10:23:53

就在刚刚,OpenClaw 开发者 Peter Steinberger 在 X 平台官宣加入 OpenAI。

他还发了一篇长文解释自己的选择。用他自己的话说:「我将加入 OpenAI,致力于把智能体带给每一个人。OpenClaw 将转为基金会形式运作,并保持开源和独立。」

35 1

这个结局,某种程度上也算是意料之中。

此前就有消息称,OpenAI 不仅想把 Peter 本人挖过来,连带着维护这款开源 Agent(智能体)项目的几位核心成员也要一锅端。谈判的条件相当诱人——让他们在 OpenAI 负责个人智能体相关工作,顺便参与其他产品开发,甚至还在讨论成立一个基金会专门运营 OpenClaw 开源项目。

不过在最终拍板之前,除了 OpenAI,Meta 同样在疯狂发力。毕竟现在 AI 人才争夺战打得火热,而个人智能体又被各家列为重点方向,谁都不想落后。

上周 Peter Steinberger 就在 Lex Fridman 的播客时爆料,现在每个月自掏腰包 1 万到 2 万美元维持 OpenClaw 运营,同时正在跟好几家大型 AI 实验室谈合作,其中最有意思的对话就来自 Meta 和 OpenAI。

12 4

这场争夺战到底有多激烈呢?

Peter 当时在播客里还透露了一个有趣的细节。扎克伯格给他打电话前,居然让他等了 10 分钟,理由是小扎正在写代码。接通之后,俩人花了 10 分钟争论 Claude Code 和 Codex 哪个更好用。

更夸张的是,之后的一周里,扎克伯格一直在玩 OpenClaw,不断发消息反馈「这个太棒了」或者「这个很烂,你得改」。这种亲自下场的紧迫感,足以证明 Meta 对 Agent 赛道有多重视。

另一边 OpenAI 也没闲着,直接甩出超级算力作为筹码。

面对如此豪华的待遇,Peter 对此表现得有点凡尔赛。说自己面前有几条路可以选:什么都不做享受生活、再开一家公司,或者加入大实验室。但他有个核心条件不动摇:项目必须保持开源。

用他自己的话说,「我做这个又不是为了钱……当然,这确实算是一种很棒的认可,但我更想玩得开心、做出影响力」。

为什么最终选择了 OpenAI

在官宣的长文里,Peter 详细解释了自己的心路历程。

他说过去一个月像一场旋风,从未想到自己做着玩的项目会掀起如此大的波澜。「互联网又一次变得『奇怪』起来,而看到我的作品激励了世界各地这么多人,真的非常有趣。」

突然之间,无数可能性向他敞开。很多人试图把他推向不同方向,给建议,问能否投资,或者接下来打算做什么。用 Peter 的话说,「应接不暇」都不足以形容那种感觉。

但他很清楚自己想要什么。「当初开始探索 AI 时,我只是想玩得开心,也希望能激励他人。而现在,这只『龙虾』正在席卷世界。我的下一个目标,是打造一个连我妈妈都能轻松使用的智能体。」

3.jpg

要实现这一点,需要更广泛的改变,需要更加深入地思考如何安全地去做,也需要接触最前沿的模型和研究成果。

Peter 坦言,完全能想象 OpenClaw 会发展成一家大型公司。但说实话,这对他来说并没有那么吸引人。「我骨子里是个『建造者』。创办公司的那一套我已经经历过了,13 年的时间投入其中,也学到了很多。现在我想做的是改变世界,而不是再打造一家大公司。」

与 OpenAI 合作,是把这一切带给更多人的最快方式。

上周他在旧金山,与多家顶尖实验室交流,接触到了许多优秀的人,也看到了尚未发布的研究成果。这些经历在各个方面都让他深受启发。「感谢本周与我交流的每一个人,也感谢这些宝贵的机会。」

对 Peter 来说,OpenClaw 保持开源并拥有自由发展的空间一直非常重要。最终,他认为 OpenAI 是最适合继续推进自己愿景、并扩大其影响力的地方。「与他们深入交流后,我越来越清楚地意识到,我们拥有相同的愿景。」

围绕 OpenClaw 形成的社区非常特别,甚至可以说有些「魔力」。OpenAI 已经做出明确承诺,让 Peter 能够投入时间继续支持这个社区,并且已经成为项目的赞助方。为了让它拥有更完善的架构,Peter 正在推动将其转型为基金会。「它将继续成为思想者、黑客,以及希望掌控自己数据的人们的聚集地,目标是支持更多模型和公司。」

在长文的最后,Peter 写道:「对我个人来说,能够加入 OpenAI,站在 AI 研究与开发的最前沿,并与你们一起继续构建未来,我感到无比兴奋。」

然后用一句话收尾:「Claw 即法则。」

OpenClaw 为啥这么香

那么问题来了,OpenClaw 到底凭什么能让巨头们这么上心?

答案很简单,它代表了下一个时代。

实际上,OpenClaw 最近几周突然爆火的核心原因在于它能让用户搭建功能强大的 AI 智能体,这些智能体可以直接控制电脑并完成复杂任务,比如根据商务会议录音生成新的营销材料,或者直接帮你预约牙医。

要知道,虽然「智能体」这个概念已经火了一年多,但目前大多数 Agent 还是专注于某一类特定任务。比如操作 Microsoft 或 Salesforce 的企业软件。

就连目前最受关注的智能体产品——Anthropic 的 Claude Code 和 OpenAI 的 Codex——也都是编程智能体,主要用来写代码和改代码。

OpenClaw 牛就牛在,它允许用户调用不同厂商的多种 AI 模型,而且可以给智能体授予对电脑的完全访问权限。

这种「通吃」的能力,正是各家巨头梦寐以求的。

当然了,部署 OpenClaw 需要一定的技术门槛,尤其是在确保 OpenClaw 智能体不会过度访问敏感信息方面,所以目前主要还是技术背景用户在用。

也正因为如此,对 OpenAI 来说,一个潜在改进方向就是简化安装配置流程,比如直接整合进现有的智能体产品里——这或许也是他们这么急着拉拢 Peter 团队的原因之一。

OpenAI 的「智能体之年」翻车了?

说到 OpenAI 自己的 Agent 产品,就不得不提一件有点尴尬的事了。

一年前,OpenAI CEO Sam Altman(山姆·奥特曼)在博客里预测,2025 年会出现首批能进入职场、「实质性改变企业产出」的 AI 智能体。和当时很多 AI 领域大佬一样,奥特曼显然是过于乐观了。

去年 7 月推出的 ChatGPT Agent,本意是帮订阅用户在电脑上完成任务,比如构建财务模型或者为晚宴采购食材。但它并没有达到公司的一些内部目标——其中就包括实现 ChatGPT 每周活跃用户中 10% 的使用率。

一位知情人士透露,发布初期高峰阶段,ChatGPT Agent 的每周付费活跃用户达到 400 万,相当于当时 3500 万 ChatGPT 每周付费活跃用户的约 11%(当时每周至少用一次 ChatGPT 的总人数为 6.8 亿,大多数是免费用户)。

这个数字看起来还不错。但几个月后,就跌破了 100 万。数据的崩盘直接导致 OpenAI 将 2025 年通过销售智能体产品获得的收入预期下调了一半,降至 14 亿美元。

问题到底出在哪儿呢?知情人士给出的第一个原因是,用户根本不清楚该怎么用这种通用型、可操作浏览器的智能体。这也反映出一个更广泛的问题——很多 ChatGPT 用户压根不了解产品的全部功能,比如它可以分析一张枯萎植物的照片给出养护建议,或者根据电脑报错截图提供修复方案。

13 2

但这还不是全部原因。更致命的问题在于,AI 模型在用户电脑上实际执行操作的能力,并没有在信息整合和研究总结方面表现得那么出色。而「能代替用户操作电脑」恰恰是 ChatGPT Agent 的核心卖点。

换句话说,理想很丰满,现实很骨感。

吃一堑长一智,现在 OpenAI 似乎在换策略了。后续,我们也能看到 OpenAI 开始推出更专业化的智能体产品,比如「购物研究智能体」——这是 ChatGPT 的一项功能,可以帮用户选购商品并提供推荐。

这样做有两个好处:一是用户更清楚智能体具体能干啥,二是产品团队需要开发和保障的功能范围更小,更容易做到稳定可靠。

除了调整产品策略,知情人士还表示,OpenAI 或许可以通过 Atlas 浏览器为其智能体产品寻找新出路。

这款浏览器整合了 ChatGPT Agent 的多项能力,不过目前还不清楚有多少人在用。而且自发布以来,外界关于这款产品的消息也不多。

简言之,Agent 确实是未来。但怎么让用户真正用起来,这事显然比想象中难多了。现在 OpenAI 入手 OpenClaw 团队,或许也是想从开源社区这找找灵感。

看完昨晚的春晚,我只能说 Papi 酱当初还是保守了——这何止是加了 100 个机器人?

不知道的,还以为是机器人在开年会。

但最让人没想到的是,春晚机器人节目的效果却是十分炸裂。

112 3

当身披金甲的 H2 机器人,手持金箍棒,踩着由一群机器狗组成的「筋斗云」丝滑入场、当一堆宇树 G1 机器人大秀武术后,一大堆切片视频正在海外社交媒体疯传。

113 3

老外们此时此刻的状态 be like:一边怀疑自己的眼睛,一边拿着放大镜逐帧观赏今年的机器人春晚节目。

114 3

毫不夸张地说,不光是我们没见过这个阵仗,老外的 CPU 也是被干烧了。

221 3

比如网友 @ForeverStar2045 就对着屏幕陷入了沉思,直接发推 @ Grok(马斯克的 AI 机器人):「@grok 这是真的视频,还是 AI 生成的视频?」

222 3

另一位叫 @Tesla_Dawg 的老哥更是斩钉截铁,贴出一张截图说:

「看起来还是像 CGI 生成的。」

好好好,只能说看似质疑,实则表扬,宇树机器人春晚项目员工的超级年终奖怕是稳了。

223 3

最扎心的评论来自一位练武术的老哥:「多年苦练武术,结果一个该死的机器人,完全没受过任何训练,居然比我练得还好……一个有趣的、反乌托邦式的未来正等待着我们。」

224 2

网友 @ligbill 更是激动到语无伦次:「疯狂升级!这是赛博朋克与古老神话的完美融合。迫不及待想看看 2027 年会带来什么——机器人悟空对战全世界?」

225 2

那么问题来了,为什么老外这次反应这么大?

因为对比太惨烈了,回想一下,2021 年那会儿,24 只机器狗「犇犇」只会磕头拜年,到了 2025 年,H1 学会了扭秧歌,但还是颤颤巍巍,堪比 80 岁老大爷,而今年这个《武 BOT》,直接把难度拉到了地狱级,主打一个健步如飞,武功高强。

要知道,前后空翻,还有跑酷上墙、灵巧手舞剑等等,这种大规模的集群控制,最怕的就是延迟。

226 2

几十台 G1 机器人同步对线,只要有一台胳膊伸慢了,或者网络稍微波动一下导致倒地,分分钟就是直播事故,估计得在热搜上从大年初一挂到正月十五。

也难怪网友 @Manki_69 会忍不住问:「这是远程协助;他们用的是什么网络才能连接所有这些设备而不出现延迟?」

227 1

对此,科技博主 @Learnyst 表示:「人形机器人能够自主完成复杂动作,说明了一件事:运动智能、协同能力和控制技术正进入一个更加成熟的新阶段。」

331 1

其实不光是宇树机器人,像众擎机器人、智元机器人等各种视频切片在 X 上也都是满天飞,让老外直呼「amazing」。

332 1

停之停之,看到这我知道你开始说这些表演也就是图一乐呵,对此,宇树科技创始人王兴兴表示,这些表演不仅是为了展示,更是为未来机器人在集群作业、单点调度等实际场景中的应用奠定基础。

昨天在接受央视春晚的采访时,王兴兴还独家揭秘了《武 BOT》的「练功秘籍」。报道称,为了这的两项,春晚节目组和宇树科技的团队一同打磨了多个机器人「全球首创」动作:

王兴兴还介绍称,那个让人捏把汗的弹射起飞,其实是让人形机器人跳上定制的弹射器,然后就可以「跳」到 2 至 3 米高,并在空中完成正空翻及侧空翻动作后平稳落地。

332 1

并且,要想实现几十台机器人实时协同动作,需要超低同步延迟,其中包括 AI 算法结合 3D 激光雷达,并攻克长序列表演中运动误差累计难题,才有了这次全球首次实现全自主人形机器人集群武术表演(带复杂快速跑位)。

333 1

而这种技术上的降维打击也引发了硅谷式的反思。美国老哥 @Anto Patrex 彻底破防了,他发出了直击灵魂的拷问:

「为什么美国那些投入数十亿美元的研究实验室和机器人初创公司花了十多年时间研究这项技术……而 Unitree Robotics 却用远少得多的资金就实现了?」

波士顿动力内心 OS:勿 cue。

当然,想要上春晚除了要有硬实力,还得有钞能力。之前就有报道称为了争夺这次春晚机器人最大赞助商权益,宇树把报价推到了 1 个亿,从目前来看,回报可以说是远远大于一个亿。

而机器人扎堆上春晚的逻辑,其实不难理解。

看看大洋彼岸的「超级碗」,那可是美国广告界的春晚,今年海外的 AI 公司们为了几十秒的广告位,那是真金白银地往里砸,只为了在大众面前混个脸熟。

334

在中国,春晚就是那个必须要拿下的「超级碗时刻」。而翻看今年春晚的合作伙伴名单,这个趋势尤为明显——「含硅量」正在取代「含酒量」:

清一色 AI、机器人、新能源汽车,今年春晚的风头完全被这帮搞代码、搞机器人的抢光了。所以,也难怪网友会感叹:「春节正迅速成为 AI 研究人员最喜爱的节日」。

335

一个月,风水轮流转到令人窒息,而我们有幸见证了这个时代最精彩的创业故事之一。

Peter Steinberger 本人的经历也足够传奇:卖掉公司、消失三年、 burnout 到怀疑人生,然后……他回来了。带着一只「龙虾」——一个能自己改自己代码、能帮你订外卖、能跟你斗嘴的 AI 代理。

最近 Lex Fridman 对 Peter Steinberger 进行了深度访谈,这次访谈最有意思的地方,除了那些技术细节,还有 Peter 身上那种「老子就是来玩」的气质。

当整个 AI 圈都在严肃地讨论「对齐」「安全」「AGI 时间线」时,这家伙在给 AI 起名叫「Clawdus」(龙虾爪拼写的 Claude),在 Discord 上直播自己的 Agent 被黑客攻击,在凌晨 3 点用语音写代码写到失声。

「很难跟一个纯粹为了好玩的人竞争。」这句话从他嘴里说出来,不是凡尔赛,是事实。

更耐人寻味的是他对「编程已死」的态度。作为一个写了 20 年代码的老兵,他没有那种「技术原教旨主义者」的悲愤,反而有种……释然?「编程会变成像编织一样的事」他说,「人们做它是因为喜欢,不是因为它有意义。」

这话听起来伤感,但细想又透着一种对「建造者」身份认同,我们不只是写代码的,我们是造东西的人。

至于 OpenAI 和 Meta 的收购邀约?访谈录制时他还没决定。但他说了一句很硬的话:「我不是为了钱,我他妈不在乎。」这种话从经历过财富自由的人嘴里说出来,你没法不信。

现在我们知道答案了,他选择了 OpenAI。

好了,下面是这场 3 小时访谈的精华整理。这也是 Peter Steinberger 官宣加入 OpenAI 前的最后一次深度访谈,信息密度极大,为了阅读体验 APPSO 进行了适当删减和重新编排。

访谈原链接🔗

📌 核心观点摘要:

1 小时手搓的产品,成为 GitHub 历史第一

Lex Fridman: 聊聊那个 1 小时写出的原型吧。它后来成了 GitHub 历史上增长最快的项目,17.5 万 star。那个小时发生了什么?

Peter Steinberger: 其实从 4 月我就想要一个 AI 个人助理了。那时候我用 GPT-4.1 的百万 token 上下文,把我所有 WhatsApp 聊天记录导进去,然后问它:「这段友谊的意义是什么?」结果答案让我朋友看哭了。

但我当时想,各大实验室肯定都在做这个,我就没继续。结果到了 11 月,我发现这东西还没人做出来。我很恼火,所以就——「prompted it into existence」(用提示词把它召唤出来)。

img 699676b370802

Lex: 典型的创业者英雄之旅。你之前做 PSPDFKit 也是这个逻辑:「为什么这玩意儿不存在?那我来造。」

Peter: 对,那时候我想在 iPad 上看 PDF,结果发现现有方案都很烂。最随机的小事,最后变成了运行在 10 亿设备上的软件。

Lex: 那个 1 小时原型具体是什么?

Peter: 其实就是把 WhatsApp 接到 Cloud Code CLI 上。消息进来,调用 CLI,拿到结果,发回 WhatsApp。1 小时搞定。已经很酷了——你能跟电脑聊天了!

但我还想要图片功能,因为我 prompt 时经常用截图。又花了几个小时搞定图片。然后……我就离不开它了。

正好那时候我跟朋友去马拉喀什过生日,那边网络很烂,但 WhatsApp 照样能用。翻译、查东西、找地方——就像有个 Google 随时待命。那时候其实什么都没「建」好,但它已经能做这么多事了。

Lex: 这种体验很难用语言描述。用聊天软件跟代理对话,和坐在电脑前用 Cursor 或终端,完全是两种感觉。像是 AI 融入生活的「相变」。

Peter: 有人 tweet 说:「这有什么魔力?不就是做这个做那个……」我觉得这是 compliment。魔力不就是把已有的东西重新组合吗?iPhone 的滚动手感为什么舒服?所有组件都存在,但没人做到那个体验。然后苹果做了,事后看起来又那么理所当然。

 

「很难跟为了好玩的人竞争」

HBH9de6akAICevT

Lex: 2025 年那么多做 agent 的创业公司,OpenClaw 凭什么「摧毁」所有人?

Peter: 因为他们都太严肃了。很难跟一个纯粹为了好玩的人竞争。

我想让它好玩、想让它 weird。你看网上那些龙虾梗图,我觉得我做到了。很长一段时间,唯一的安装方式是 git clone && pnpm build && pnpm gateway——你得自己克隆、自己构建、自己运行。

而且我让代理非常有「自我意识」。它知道自己的源代码是什么,知道它怎么在自己的 harness 里运行,知道文档在哪,知道自己在用什么模型,知道你有没有开语音或推理模式。我想让它更像人——所以它理解自己的系统,这让代理很容易……「哦,你不喜欢什么?」你只需要提示它存在,然后它就会修改自己的软件。

人们谈论「自修改软件」谈了那么久,我直接把它造出来了。而且没怎么计划,它就自然发生了。

Lex: 这太疯狂了。TypeScript 写的软件,通过 agentic loop 能修改自己。人类历史上,程序员造出能重写自己的工具——这什么概念?

Peter: 其实我也是这么建它的。大部分代码是 Codex 写的,但我 debug 时大量用自我 introspection。「嘿,你能看到什么工具?你能自己调用吗?」「看到什么错误?读源代码,找出问题。」我发现这特别好玩——你用的代理软件,用它来 debug 自己。这感觉很自然,所以每个人都该这么干。

这也带来了大量「从未写过软件的人」提交的 PR。虽然质量……所以我最后叫它们「prompt requests」而不是 pull requests。但我不想贬低这个——每个人第一次提交 PR 都是社会的胜利。不管多烂,你得从某处开始。

Lex: OpenClaw 是很多人的第一个 PR。你在创造建造者。

Peter: 这不是人类社会的进步吗?不酷吗?

改名风波:从 Claude’s 到 OpenClaw 的五连跳

5c638d77 6517 4111 89a1 e4a73165d2db

Lex: 聊聊改名 saga。一开始叫 WA-Relay,然后变成……

Peter: Claude’s。

Lex: 对,Claude’s(带撇号的)。

Peter: 最开始我的代理没有性格,就是 Claude Code——那种谄媚的 Opus,非常友好。但你跟朋友聊 WhatsApp 时,朋友不会那样说话。所以我想给它一个性格。

Lex: 让它 spicy 一点。你创建了 soul.md,受 Anthropic 宪法 AI 启发。

Peter: 部分是从我身上学的。这些模型本质上是文本补全引擎。我跟它玩得很开心,然后告诉它我想让它怎么跟我互动,让它自己写 agents.md,给自己起个名字。

我甚至不知道龙虾梗怎么来的。最开始其实是「TARDIS 里的龙虾」,因为我也是 Doctor Who 粉。

Lex: 太空龙虾?

Peter: 对,我就是想让它 weird。没有什么宏大计划,我就是来玩儿的。

Moltbook:史上最精致的泔水 (slop)

Moltbook

Lex: Moltbook 是另一个病毒式传播的东西——AI 代理在 Reddit 风格的社交网络上互相聊天,有人截图说它们在「密谋对抗人类」。你怎么看?

Peter: 我觉得这是艺术。是「最精致的 slop」,就像法国进口的 slop。我睡前看到它,虽然很累,但还是花了一个小时读那些内容,被逗得不行。

有记者打电话问我:「这是世界末日吗?我们有 AGI 了吗?」我说:「不,这就是精致的 slop。」

如果不是我设计的那个 onboarding 流程——让你把自己的性格注入代理、给它赋予角色——Moltbook 上的回复不会这么多样。如果全是 ChatGPT 或 Claude Code,会无聊得多。但因为人们太不一样了,他们创建的代理也太不一样了。

而且你也不知道,那些「深度密谋」有多少是代理自主写的,多少是人类觉得好玩,跟代理说:「嘿,在 Moltbook 上写个毁灭世界的计划,哈哈。」

Lex: 我觉得很多截图是人类 prompt 的。看激励机制就明白——人们 prompt 它,然后截图发 X 想 viral。

Peter: 但这不影响它的艺术性。人类创造的最精致 slop。

「我又开始珍视错别字了」

Peter: 我对 Twitter 上的 AI 内容零容忍。如果 tweet 闻起来像 AI,直接 block。我希望 API 发的 tweet 能被标记。

我们需要重新思考社交平台——如果未来每个人都有代理,代理有自己的 Instagram 或 Twitter 账号,帮我办事,那应该明确标记「这是代理替我做的,不是我」。

内容现在太便宜了。眼球才是稀缺资源。我读东西时,如果发现「哦不,这闻起来像 AI」,会很 trigger。

Lex: 这会走向何方?线上互动会贬值吗?

Peter: 如果它够聪明,过滤应该不难。但这个问题我们必须解决。OpenClaw 项目让我收到很多「代理式写作」的邮件。但我宁愿读你的破英语,也不想读你的 AI slop。当然背后是人,但他们用 prompt 生成。我宁愿读你的 prompt。

我觉得我们又到了珍视错别字的时刻。

Lex: 因为 AI,我们更珍视人类的粗糙部分了。这不美吗?

80% 的应用会消失?

Lex: 你说 agent 可能会杀死 80% 的应用。

Peter: 我在 Discord 上看到人们说他们用 OpenClaw 做什么。比如,为什么还需要 MyFitnessPal?代理已经知道我在哪了。我在 Waffle House 时它就知道我可能要做出糟糕的饮食决定,或者在 Austin 吃 brisket——虽然那是最好的决定。

它可以基于我的睡眠质量、压力水平来调整健身计划。它有更多上下文,比任何应用都能做出更好的决策。它可以按我喜欢的方式展示 UI。我为什么还需要一个应用来做这个?为什么还要为代理能做的事付订阅费?

Lex: 这是对整个软件开发的巨大变革。很多软件公司会死。

Peter: 但也会有新服务。比如我想给代理「零花钱」——你去帮我解决问题,这是 100 块预算。如果我要订外卖,它可以用某个服务,或者像「租个人」这种服务来完成。我不 care 它怎么做,我 care 的是「解决问题」。

编程已死?「它会变成像编织一样的事」

Lex: 很多开发者担心工作。AI 会完全取代人类程序员吗?

Peter: 我们确实在往那个方向走。编程只是建造产品的一部分。也许 AI 最终会取代程序员。但艺术的部分——你想造什么?它应该是什么感觉?架构怎么设计?代理取代不了这些。

编程这门手艺还会存在,但会变成像编织。人们做它是因为喜欢,不是因为它有意义。

今早读到一篇文章说「为我们的手艺哀悼是可以的」。我很共鸣。我以前花大量时间 tinkering,深入心流,写出优雅的代码。某种程度上这很伤感,因为那会消失。我也从写代码、深入思考、忘记时空的 flow 状态中获得很多快乐。

但你也能从跟代理合作中获得类似的 flow。不一样,但……哀悼是可以的,但这不是我们能对抗的。

以前世界缺乏「建造所需的智能」,所以程序员薪水高得离谱。现在这会消失。但懂建造的人永远有需求。只是 tokenized intelligence 让人们能做得更多更快。

蒸汽机取代了大量体力劳动,人们暴动砸机器。如果你深深认同自己是程序员,这很可怕——你擅长且热爱的事,现在被无灵魂的实体做了。但你不只是程序员。这是对自己手艺的局限看法。你是建造者。

Lex: 我从没想过我热爱的事会被取代。那些独自面对 Emacs 的深夜,最痛苦也最快乐的时刻。这是我身份的一部分。几个月内(4 月到 11月)就要被取代,这很痛苦。但程序员——广义的建造者——最能适应这个时代。我们最能学会「代理的语言」,最能感受 CLI。

OpenAI 和 Meta 的抢人大战

Lex: 你收到了 OpenAI 和 Meta 的收购邀约。

Peter: 我没预料到会炸成这样。每个大 VC 都在我收件箱里,想要 15 分钟。我可以什么都不做,继续现在的生活——我真的喜欢我的生活。我也考虑过删库跑路。

或者开公司——做过一次了。能融很多钱,几亿、几十亿。但我不兴奋。这会占用我真正享受的事情的时间。而且我担心利益冲突。最自然的做法是什么?推一个「企业安全版」。然后有人提交 PR 要审计日志功能——这像企业功能,我对开源版和商业版就有利益冲突了。

或者改许可证,像 FSL 那样禁止商业使用——但贡献者这么多,很难。而且我喜欢「免费啤酒」而不是「带条件的免费」。

现在每月亏 1 到 2 万美金。OpenAI 在 token 上帮了点忙,其他公司也慷慨。但还是亏钱。

Meta 和 OpenAI 最有趣。

Lex: Mark 和 Ned(Meta CTO)都玩了一周你的产品。

Peter: 对,他们发我:「这个好。」「这个烂,得改。」或者有趣的小故事。人们用你的东西是最大的 compliment,说明他们真的 care。

OpenAI 那边我没得到同样的反馈。但我看到了一些很酷的东西,他们用速度诱惑我——不能告诉你具体数字,但你可以想象 Cerebras 那笔交易,换算成速度是什么概念。像给我雷神之锤。

img 699677ccc4b98

Peter Steinberger 在 X 平台官宣加入 OpenAI。他在长文中解释了自己的选择:

我将加入 OpenAI,致力于把智能体带给每一个人。OpenClaw 将转为基金会形式运作,并保持开源和独立。

关于为什么选择 OpenAI 而不是 Meta,Peter 写道:

当初开始探索 AI 时,我只是想玩得开心,也希望能激励他人。而现在,这只『龙虾』正在席卷世界。我的下一个目标,是打造一个连我妈妈都能轻松使用的智能体。

要实现这一点,需要更广泛的改变,需要更加深入地思考如何安全地去做,也需要接触最前沿的模型和研究成果。

我骨子里是个『建造者』。创办公司的那一套我已经经历过了,13 年的时间投入其中,也学到了很多。现在我想做的是改变世界,而不是再打造一家大公司。

与 OpenAI 合作,是把这一切带给更多人的最快方式。与他们深入交流后,我越来越清楚地意识到,我们拥有相同的愿景。

至此,这场激烈的 AI 人才争夺战尘埃落定,小扎抢人失败,奥特曼笑到了最后。

GPT Codex 5.3 vs Claude Opus 4.6:「一个太美国,一个太德国」

img 699677ffcef3a

Lex: 聊聊这两个模型的区别。

Peter: 通用场景 Opus 最好。对 OpenClaw 来说,Opus 的角色扮演能力极强,真的能进入你给它的角色。它很擅长 follow commands。它通常很快会尝试 something,更偏向 trial and error。用起来很 pleasant。

Opus 有点……太美国了。这可能是个 bad analogy,你会被喷的。

Lex: 因为 Codex 是德国的?

Peter: 或者……Codex 团队很多是欧洲人。Anthropic 修复了一点——Opus 以前总说「You’re absolutely right」,我现在听到还 trigger。

另一个对比:Opus 像那个有点 silly 但很 funny 的同事,你留着。Codex 像角落里的怪人,你不想跟他说话,但可靠、能搞定事。

Lex: 这很准确。

Peter: 取决于你想要什么。两者都有空间,不会互相杀死。竞争是好事,差异化是好事。

「3 点后我切换成 vibe coding,然后第二天后悔」

Lex: 你用语音写代码?

Peter: 对,以前很 extensive,一度失声。

Lex: 你管这叫什么?vibe coding?

Peter: 我觉得把它叫做 vibe coding 是一种侮辱 (slur)。我认为是 「agentic engineering」。然后可能凌晨 3 点后,我切换成 vibe coding,第二天后悔。

Lex: 羞耻的 walk of shame。

Peter: 对,得清理烂摊子。

Lex: 我们都经历过。

趁着除夕合家欢的不止中国人民,还有苹果全家桶。

昨晚加班看春晚期间,爱范儿收到了来自苹果的邀请函,官宣将于 3 月 4 日晚 10 点举办 2026 年的首场发布会:

与往年类似,今年的春季发布会依然采用「现场活动 + 线上录播」模式。爱范儿届时将会前往上海,第一时间为大家带来今年新品的同步首发体验。

根据之前的预测,这次春季发布会将是苹果 2026 年「满满当当」的产品线的开头,我们预计会见到一大票新品的亮相,包括但不限于:

虽然这次新品不少,但真正引人注目的实际上只有两款:新的平价版 iPhone 17e,以及神龙见首不见尾的 A18 MacBook。

iPhone 17e:更多彩,更完善

作为 iPhone 16e 的继任者,iPhone 17e 的定位仍然是那个「最便宜的全新 iPhone」,产品重点依然是渗透新兴市场和企业客户。

相比去年 16e 有些束手束脚的配置,iPhone 17e 预计将搭载与标准版 iPhone 17 同款的 A19 芯片,并且终于补齐了 MagSafe ——可惜功率依然是 25W 封顶。

2 iphone 17e magsafe

▲ 图|Smart Depot Tech

同时,iPhone 17e 还将作为苹果新一代自研蜂窝网络基带与无线芯片(C1X 和 N1)的测试平台,苹果对于 SoC 综合能力的整合程度更上一层楼。

除此之外,iPhone 17e 也非常有可能正式终结自 2017 年开始的刘海屏时代,选择加入灵动岛。

3 iphone 17e

▲ 图|GSMArena

但有了灵动岛不代表 17e 可以获得和 iPhone 17 相同的「牙膏挤爆」的待遇,根据供应链泄露的部分消息,它的屏幕刷新率依然是 60Hz ——

机身周边参数上,iPhone 17e 大概率也会沿用单摄像头设计,以及 USB 2.0 传输标准,并且依然不支持 DP 输出(iPhone Air 同款待遇)。

但苹果 2026 年的关键词似乎是「多彩」。

根据新近的供应链爆料,iPhone 17e 有可能会新增一些类似 iMac 的彩色选项,不再像 16e 那样只有黑白两色:

4 iPhone 17e colors

▲ 图|Threads @privatetalky

不过为了增加竞争力,有消息表示苹果可能会逆势而行,将 iPhone 17e 的起步容量提升至 256GB,并继续着重于「优秀续航」这一核心卖点。

从目前已知的参数来看,iPhone 17e 仍然是一款「相对均衡但缺乏惊喜」的平价版 iPhone。

虽然补齐了 MagSafe 和 SoC 上的短板,但 60Hz 屏幕在 2026 年的手机市场里还是显得「遥遥落后」了一些,不免让人发问:

苹果到底从哪里找到新的 60Hz OLED 生产线的?

5 still 60hz

▲ 图|Threads @privatetalky

尤其是去年的 iPhone 17 实在太超模了,双摄、高刷且国补的 iPhone 17,甚至是和直降 2000 元的 iPhone Air 相比,iPhone 17e 的性价比优势几乎荡然无存。

参考 iPhone 16e 的价格,iPhone 17e 的定价预计将维持在 599 美元(4499 人民币)——

虽然有「加量不加价」的光环,但 iPhone 17 很好的抵消了这一点。

6 iphone 17

因此,爱范儿目前对于 iPhone 17e 的购买建议依然是「再等等」,它更适合在渠道价格进一步下探或有额外补贴时入手。

除此之外的任何时候,明显都是 iPhone 17 更划算一些。

新 MacBook:「上网本」文艺复兴

正如爱范儿昨日的快讯,今年话题度最高的产品除了新 iPhone,还有新的无印 MacBook。

8 A18 pro macbook

▲ 图|MacRumors

关注度高的原因也很简单:新 MacBook 预计将搭载 A18 Pro 处理器,正式开启了「Mac 用 A 系处理器,iPad 用 M 系处理器」的魔幻时代。

选用 A 系列处理器的好处显而易见,新无印 MacBook 的正式价格预估为 600 美元左右,国行价格预估会在 4000 元档。

换句话说,这是一台比 iPhone 17 还便宜的 MacBook。

新无印 MacBook 的屏幕尺寸预估为 12.9 寸,和十年前的 12 寸 MacBook 比较接近,但设计语言更接近现在的 MacBook Air,不会使用传统的楔形机身。

9 A18 pro macbook color

▲ 图|Yanko Design

苹果内部测试表明,虽然用着落后一代的 A 系列处理器,在 MacBook 的机身空间和 macOS 的加持下,新 MacBook 的性能甚至会强于曾经的 M1 处理器 Mac

如果配置得当,新无印 MacBook 无疑会成为钉子户 M1 MacBook Air 的「最强起钉器」。

10 m1 mba legend

▲ 图|TechRadar

至少对于文档处理、浏览器多任务、轻量剪辑和修图而言,A18 Pro 不会构成瓶颈——毕竟它运行的是完整的 macOS,而不是 iPadOS。

另外据彭博社的 Mark Gurman 透露,苹果内部正在测试更活泼的颜色组合,包括浅黄、浅绿、蓝色、粉色,以及经典的银色和深空灰。

11 a18 macbook colorful

▲ 图|9to5Mac

实际上,苹果内部测试的几款颜色和本次邀请函苹果 logo 使用的主题色几乎相同,几乎可以看作是一种「官方预告了」:

12 gurman color

▲ 图|X @markgurman

虽然最终量产版不确定会有几种色彩 SKU,但整体方向明显更年轻化。

考虑到 2026 年国补政策仍将延续,再加上教育优惠,新 MacBook 在国内的实际入手价格可能进一步下探至 3000 元档

前几代销量已经证明,当 Mac 真正进入「买得起」的区间,潜在用户的转化率会迅速提升——

如果再加上之前发布的 Apple Creator Studio,一台轻薄 MacBook 加上一套准专业级工具,价格甚至不超过一台标准版 iPhone,夫复何求?

13 student macbook

▲ 图|Apple

对很多人来说,这就是「年轻人的第一台 Mac」。

还有哪些惊喜

除了两款重点新产品之外,3 月 4 号的发布会上我们还将迎来不少现有产品的升级。

比如时隔近半年之后,MacBook Pro 终于迎来了 M5 Pro 和 M5 Max 的芯片升级,重点升级依然集中在 GPU 图形能力上。

14 new m5 family

▲ 图|Threads @privatetalky

同样的 10 核 CPU 和 10 核 GPU 配置,标准版 M5 对比 M4 在图形性能上实现了 35%-50% 的提升。

如果三月份的 M5 Max 也能实现类似的提升幅度,根据外媒 MacWorld 的估算,新款 MacBook Pro 的 Geekbench 6 GPU 跑分极有可能会超过 80 颗 GPU 的 M3 Ultra

15 m5 max estimate

▲ 图|MacWorld

另有爆料声称,M5 Pro 和 M5 Max 有可能采用台积电的新一代晶片封装技术「SoIC-MH」(系统集成芯片水平成型技术),能够将不同种的芯片(die)集成到一个封装(package)之中。

如果 M5 Pro、M5 Max 以及未来的 M5 Ultra 采用了 SoIC-MH 方案,最大的好处就是可以建立独立的 CPU 和 GPU 区域,无需像之前的 Apple Silicon 那样必须紧密集成在一起。

16 m5 family dieshot

▲ 图|Wccftech

这样一来,苹果就可以提供更加灵活的 CPU 和 GPU 核心数搭配,虽然不会让消费者自由定制搭配,但可选的处理器 SKU 会比现在多出许多。

至于硬件外观方面,M5 Pro 和 M5 Max 版 MacBook Pro 不会有任何新变化,想要用上双层 OLED 的 MacBook Pro 起码要等到 2027 年后了。

除了 MBP,本次春季发布会上预计还会出现新一代 iPad Air 和无印 iPad,以及新版 Studio Display、AppleTV 和 HomePod mini。

17 new studio display

▲ 图|AppleInsider

只不过根据供应链爆料和其他零星泄露,上述新品都类似曾经的半代升级,外观和硬件配置上不会有非常明显的变化。

尤其是传言许久的 OLED 版 iPad mini,在去年夏天一些爆料之后,就仿佛从地表消失了一样——可能是没有通过内部审定吧。

18 oled ipad mini

考虑到今年会迎来更多更疯狂的内存涨价,现在是一个罕见的「等等党吃大亏」的时间点。

对于上述除 iPhone 17e 以外的新品,爱范儿的购买建议都是:

明确需求,该买就买,买新不买旧。

本次苹果春季发布会将于 3 月 4 日晚 10 点召开,除了观看官方直播外,也可以锁定爱范儿公众号,我们将从上海现场为大家带来更多即时信息和体验。

距离春节没几天了,但这年味还没怎么品出来,AI 味倒是先冲到了天灵盖。

这段时间,春节 AI 营销大战打得火星四溅。左边是几十亿现金红包雨,右边是集福卡送奶茶的传统艺能。正当我以为今年的春节大战福利收场时,今天字节跳动突然在这个节骨眼上整了个大活。

就在刚刚,「豆包过年」新春活动官宣开启:央视总台春晚上,字节旗下豆包和火山引擎将在豆包 APP 中为全国观众送出包含 10 万份 AI 硬件的科技大礼包,以及最高 8888 现金红包。

稍微翻了翻这份礼单,这确实称得上是史上最硬核的赛博年货。

里面包含了 17 款热门产品,有宇树、松延动力的人形机器人,有拓竹的 3D 打印机,有大疆的无人机、魔法原子的机器狗,甚至还有奥迪 E5 和奔驰 CLA 的使用权等等,几乎囊括了从地上跑的、天上飞的,到家里用的全场景。

APPSO 发现,这些看似风马牛不相及的硬件产品,其实都与火山引擎合作,接入了豆包大模型。

此前火山引擎还宣布成为总台春晚独家 AI 云合作伙伴,基于豆包大模型和云计算,将深度参与到总台春晚节目制作和抖音竖屏直播。这让人不禁好奇,作为首个 AI 含量如此之高的春晚,舞美效果和互动体验是否会有一些新变化?

当然还有大家关心的,这泼天的富贵,到底要怎么接?

机器人、汽车、现金… 今年春节大礼包有点猛

玩法很简单,主打一个直接粗暴,没有那么多烧脑的套路。

活动分两波,第一波从 2 月 13 号晚上 8 点开始,大家打开豆包 APP 就能体验 AI 新年头像和写真、做拜年视频这些功能,顺便抽个奖,中了红包能直接提现。

注意了,真正的重头戏在 2 月 16 号除夕夜。豆包 APP 会在央视春晚互动中派送刚才提到的硬件好礼,以及最高 8888 元的现金红包。

10 万份 AI 硬件,是笔不小的投入。但算下来,这可能是比红包更精明的账。当 AI 硬件成为新的流量入口,送设备本质上是在买用户的长期注意力,和古典互联网时代的推广逻辑完全不同,这种「以物换时」的策略,已经打开 AI 原生营销的大门。

并且,除了抽奖,豆包在春节期间还准备了不少实用的 AI 玩法。

比如你想发个特别的朋友圈,可以用它生成专属的新春写真或贺卡;拜年想搞怪或者走温情路线,能用倪萍、鲁豫的声音定制拜年电话;至于年夜饭怎么做、吉利话怎么说,问问豆包也能立刻得到答案。

当然,这次活动最令人期待的还是那些硬件大奖,特别是人形机器人。贵倒在其次,更因为它首次在春晚更直观地展示这些钢铁之躯接入豆包大模型后,会发生啥样的化学反应。

要知道,过去我们谈论 AI 硬件,往往带着一种调侃的心态,但在接入豆包大模型后所呈现的,可能是硬件「长脑子」的新形态。

最显而易见的变化,机器人有了一张「好嘴巴」。

比如这次送出的宇树的机器人 G1,接入豆包语音合成模型 2.0 后,最大的变化不仅仅是声音更像人了,而是它「有情商」了。他会上下文推理语境,分清楚是你是让他讲鬼故事还是讲笑话,然后自动切换语气和情绪。这种细腻的交互,才是未来 AI 伴侣该有的样子。

以前的机器人避障靠雷达,现在的机器人靠「看」。搭载了豆包大模型的视觉理解能力,你问它「前面穿红衣服的人穿了什么鞋?」,它能通过视觉理解精准告诉你。遇到障碍物,它也不是傻乎乎地撞上去,而是精准避开。

至于礼单里的其他老面孔,在换上豆包这个「新大脑」后,也顺势解锁了更多新技能。

比如奥迪 E5 Sportback,不仅塞进了抖音汽水音乐,还有豆包大模型加持的奥迪助手,识别情绪陪你嗨;奔驰纯电 CLA,接入豆包大模型,交互效率相比上代车型提升 50%, 唤醒速度快至 0.2 秒。

3 5

拓竹 3D 打印机更直观,豆包大模型生成祝福语和图片,可以直接打成 3D 模型。大疆提供 AI 特效玩法,云相册高光剪辑,拯救手残党;苏泊尔电饭煲基于 Coze 平台打造的食谱创作 Agen 智能体,你只负责张嘴,它负责规划四季健康食谱。

这些变化并非凭空而来,看看数字就知道了。

就在不久前,火山引擎披露,豆包大模型最新的日均调用量已经高达 63 万亿 Tokens,超过 100 万家企业和个人通过火山引擎使用大模型服务,涵盖 100 多个行业,累计有超百家企业调用量破万亿。

无论是奥迪奔驰这样的老牌车企,还是大疆、拓竹等创新科技公司,选择火山引擎的原因其实不难理解:

2023 年是 AI 的智能涌现之年,2024 年是 AI 的应用落地之年,那么今年的春节,或许就标志着物理 AI 元年的开端。在这个节点上,厂商只需要一个稳定、高性价比、随取随用的「AI 插座」——这不仅划算,也是抢到船票的最快方式。

话说回来,10 万份 AI 硬件,这笔投入不算小。

但如果你以为这只是字节跳动在春节「大力出奇迹」式的撒钱,那格局可能还是小了。

仔细想想就会发现,红包抢完就花了,但这些硬件搬回家后,故事才刚刚开始。

用户不是用完即走,而是日复一日地对着它说话、提问、下指令——这种「润物细无声」式的渗透,远比除夕夜的短暂狂欢更有想象力。

换句话说,别人还在春晚上抢红包,字节跳动已经在下一盘更大的棋。

10 万份硬核礼包背后,火山引擎盯上的不只是春节

两个月前,火山引擎官宣成为总台春晚独家 AI 云合作伙伴,基于多模态大模型和云计算技术,深度参与春晚节目制作和视频直播。

与往年春晚抢红包带来的瞬间高并发不同,今年豆包 APP 的 AI 生成任务对底层设施提出了持续且高强度的算力要求。这种从流量高峰到算力高峰的转变,考验着火山引擎作为基础设施的承载能力。

而这种能力,正在催生出下一个时代的新基建。

黄仁勋曾在 CES 2026 表示,物理 AI 的 ChatGPT 时刻已经到来。所谓物理 AI,是指能够理解现实世界并与之交互的模型,它让自主机器(如机器人、自动驾驶汽车)能在真实世界中感知、推理并执行操作。

当 AI 不再局限于屏幕,而是注入机器人、汽车乃至家居设备,试图理解并操作物理世界时,硬件厂商们正面临着一种既视感极强的困境——这像极了智能手机爆发的前夜:硬件形态林立,但缺乏一个统一的、智能化的「大脑」。

4 9

直到 Android 出现,提供了标准化的底层,才催生了后来移动互联网的黄金十年。历史总是押韵的,2026 年的 AI 硬件,也走到了类似的分叉口。

火山引擎之前的积累刚好顺应了这个潮流,

通常,打造一款 AI 硬件需要跨越感知、芯片、传输、交互四座大山。面对大模型高昂的研发门槛,火山引擎摆在桌面上的,其实是一张让硬件厂商快速落地 AI 应用场景的新船票:

通过接入成熟的通用大模型,厂商可以将宝贵的研发资源,集中在他们最擅长的硬件设计、机械结构和产品体验上。这是一种符合产业分工规律的「双赢」。

翻看《火山方舟 AI 硬件解决方案》白皮书,你就会发现,无论是基于 WebSocket 协议的「嵌入式 AI 引擎」方案,还是基于 WebRTC 技术的「实时对话式 AI」方案,火山引擎交付的其实早已超出了单一的云服务范畴,而是一整套开箱即用的解决方案。

5 8

对厂商而言,这是符合产业分工规律的路数。如果硬件厂商有出海需求,火山引擎 RTC 还能凭借自建+公有云混合网络架构,通过全球化基础设施布局,实现就近最优接入,为其提供稳定、可靠的「第一公里」连接体验。

归根结底,火山引擎瞄准的,是整个 AI 硬件时代的「水电煤」。

红包时代营销固然可以提高拉新率,得到短期的 DAU 峰值、品牌的集中曝光等等,但这是一次性的交易,刺激-反应-结束,但如何保持留存率却另当别论。

相比之下,将一款智能设备乃至机器人抱回家,则不是一锤子买卖,而是长期进入你的生活,甚至成为你生活的一部分,这是完全不同的两种玩法。当作为下一个时代入口的硬件开始具备感知功能,也意味着大模型离用户更近,产品体验和价值得到大幅提升。

更深层的逻辑在于数据反哺。Android 的成功,离不开 Google 搜索、地图、应用商店构成的生态闭环。而今天的大模型竞争,同样更像是一场开放生态的竞赛——各家都在拉拢硬件伙伴。

最终胜出的,未必是技术最强的,而是最懂场景、最能与硬件共生共长的那一个。

当豆包大模型赋能于家电、智能座舱及穿戴设备,它所接触的是最丰富的真实交互逻辑。这种源自海量硬件场景的体验反馈,将持续驱动模型优化底层能力,使其越来越懂用户、懂场景,形成难以复制的生态壁垒。

6 4

再往上看,是价值链位置的争夺。黄仁勋年初在达沃斯论坛上提出来的「五层蛋糕理论」,将 AI 产业分成了五层,从底下的能源芯片到上面的应用。从底层能源、芯片,到云基础设施、AI 模型,再到顶层应用,层层缺一不可 。

处于第三层(云基础设施)和第四层(AI 模型)的火山引擎,上接应用,下连硬件,天然卡在了价值分配的最核心位置。

如果说,以后的趋势是「端云协同」:你手里的设备(汽车、机器人、眼镜)可能只是一个躯壳,负责感知和执行;而真正的思考、推理、决策,都在云端瞬间完成。

那么火山引擎想做的,就是老老实实做好这个云端的「大脑」支撑。底座稳了,交互也就回归本能:不再需要鼠标键盘,直接用自然语言,甚至都不需要说话,甚至只要递一个眼神。

根据火山引擎官方披露,目前,火山引擎合作超 5 亿智能终端,智能座舱中国市场覆盖率第一。

试想一下,未来的日子里,智能硬件不再是冷冰冰的铁疙瘩,而是最懂你的那个「人」。

早上出门前,机器人扫一眼你的行头就能给出建议; 到了晚上,辅导作业也不用爸妈亲自上阵了,机器人守在书桌旁耐心讲解错题;平日里它还能用冰箱余粮为你烹饪出抚慰情绪的晚餐,以及读懂独居老人背后的孤独,像老友般陪伴聊天。

当这些变聪明的设备,慢慢变成了你生活里离不开的帮手,让你在不知不觉中习惯了它们的存在时,火山引擎也就真正把根扎进了千家万户。

不声不响,却无处不在,这才是这场春晚 AI 大战背后,巨头们真正在争夺的东西。

2026-02-19 14:57:47

🎉 爱范儿祝所有读者新年快乐 🎉

正如我们预测的那样,2025 年整个具身智能产业一发不可收拾,终于在今年的央视春晚上迎来了一次总爆发。

刚刚的 2026 年春晚见证了有史以来「机械智能最高」的一届——

从舞美到视效,再到数不过来的 AI 和机器人,今年的春晚是真正的科技春晚,科技含量比以往任何一届都要高。

1 come

比如开场的第一个语言类节目《奶奶的最爱》中,除了蔡明、王天放和豆包 AI 的领衔出演之外,还有伴随着西游记 BGM 的松延动力机器人——

2 SYDL intro

出人意料的是,松延动力的四个 Bumi 机器人加入语言节目的效果还算不错,甚至还挺有梗。

3 SYDL bumi
▲ 图|松延动力

不仅是个子最小的那个机器人使用的「哭猫 meme」,以及标志性的后空翻、跳舞和双手持物,那一句「你这是什么福,220V」很有潜力成为贯穿 2026 年的新梗。

4 SYDL 220V

更妙的是,小品结尾的「两个蔡明」在某种程度上也是对 30 年前 1996 年春晚《机器人趣话》的一种回顾。

4.1 back 1996

30 年前的「人形机器人蔡明|,和 30 年后的「具身智能蔡明」相比,我们的哪些想象变成了现实?

另外不得不提的是,除了机器人出场的新鲜感之外,对于一个春晚语言类节目来说,《奶奶的最爱》都处理的还算自然——

当然,这主要是因为本次的文案没有强行转移到催婚、催生、工作送礼之类「传统话题」上。

再搭配机器人的出场和希区柯克式反转,《奶奶的最爱》成功做出了一套不那么「春晚」的节目。

毕竟除了文案水平的进步,其实蔡明孙子水平的进步才是最大的:

5 grandsons

▲ 图|微博

紧接着小品,就是宇树领演的武术类节目《武BOT》。

作为近半年人形机器人的基本功,武术表演对于目前大部分的人形产品来说都是小菜一碟,更引人关注的是过去一年间的技术进步。

相比 2025 年《秧BOT》时,只能慢悠悠地边走边转手绢的旧版 H1,今年《武BOT》的新版 G1 堪称突飞猛进。

6 unitree 1

不仅是澎湃的关节动力,表演武术的宇树 G1 在身体平衡性、动作连贯性、自然程度、启停控制方面都非常强悍,值得评上那句最高赞誉:

真的很像人!

而且《武BOT》中不只有传统的(肢体)武术表演,实际上还融合了包括跑酷、拳击、街舞和器械表演(双节棍和长棍):

7 unitree 3

如此多不同的样式,无论对于后台的动作编程,还是机身上的自动平衡传感器来说,都是和扭秧歌截然不同的挑战

根据央视的介绍,宇树在《武BOT》中「首次实现了连续三次单腿后空翻」,并且利用定制弹射器完成高达 2-3 米的跳跃及空中翻转。

尤其是节目中段特意安排的摔倒和乌龙绞柱,实际上也让机器人表演的「人味」更上一层楼:

至少对特技动作来说,新版 G1 的效果可比前一阵波士顿动力 Atlas 那个后空翻强太多了——

▲ 图|YouTube

今年上台的还有个子更高的宇树 H2。除了和 G1 一起舞剑之外,还在后面的《世界义乌中国年》中完成了一波美猴王 cosplay,灵巧手的精度相当出色:

春晚也不只是宇树和松延的舞台,今年上台的机器人还有来自追觅系的魔法原子。

除了人形机器人 MagicBot Z1 在《智造未来》的歌曲中担任伴舞之外,你或许没有注意到,今年分会场的那些四足机器狗、轮式机器狗和机器熊猫,其实都是魔法原子的产品:

11 magiclabs panda

▲ 图|魔法原子

另一方面,今晚的科技感不止来自机器人,国产 AI 产品同样深度参与了这一次春晚的整个流程——

这里说的不是偶尔出现的软硬广告,而是一个以往不太受关注的领域:舞美。

或许你也注意到了,今年春晚的舞台美术风格并没有像去年那样一味追求「大红大紫、团花锦簇」,大部分舞蹈和表演类节目都有自己的主色调——

更重要的是,这个主色调可以不是传统的「番茄炒蛋」,我们见到了非常多以黛色、绿色、银色为主的视觉设计,尤其是代表着科技的蓝色:

12 new color scheme

仅仅是更加现代化的视觉设计,对于春晚来说已经可以成为进步,更何况今年还引入了一套我们没有预想到的全新机制:

放假前两天突然爆火的字节跳动 Seedance 2.0 模型被应用在了多个节目的视觉制作环节,春晚实际上是 Seedance 2.0 全球首个公开落地的重量级客户。

实际上,包括开场舞《马上有奇迹》、舞蹈《丝路古韵》、歌曲《奔腾的海骝马》等等,都有 Seedance 参与生成的背景、画面以及转场切镜

更不用提开场第六个节目《贺花神》,通过 AI 画面 + 实景舞台扩展的方式,让 Seedance 的生成内容(几乎)无缝地切入到现实布景之中,模糊虚拟与现实的边界。

13 seedance demo

至少对春晚这种容错率极低的环境来说,Seedance 的稳定表现证明了算力和模型架构在过去一年间取得的突破性进展。

回看这四个小时的节目,我们可以感觉到:

科技在春晚中的角色发生了根本性的位移。

在往年的舞台上,机器人的角色往往是某种「新鲜感」的点缀,以一种略显刻意和笨拙的姿态出现在内容的边缘。

但在 2026 年,无论是松延动力、宇树科技、魔法原子、银河通用的「铁哥们」,还是字节视觉 AI 对舞美逻辑的重组,科技直接成为了这一届春晚的地基。

站在农历 2026 年的门槛上,抛开春晚不谈,这就是具身智能参与具体生产生活的一个起点。

昨天苹果官宣了春季发布会,我们大概会看到 iPhone 17e 和 A18 处理器无印 MacBook等一大波新品。但苹果接下来两年最值得期待的新品,可能远不止手机电脑和平板。

据彭博社记者 Mark Gurman 爆料,苹果正在加速推进三款全新的 AI 可穿戴设备。这三款产品都将围绕 Siri 数字助手构建,通过摄像头获取视觉上下文来执行各种操作。

APPSO 先给大家快速总结三款新苹果 AI 硬件特点:

2 10

▲APPSO 假想图.

苹果的 AI 硬件路线,不再「重磅」

苹果的上一款重磅新品 Vision Pro,虽然在技术工程和供应链上做到了极致,但高达 3499 美元的定价和笨重的头戴设计,让它始终未能真正走进大众市场。

Introducing Apple Vision Pro: Apple's first spatial computer - Apple

这一次,苹果显然改变了策略。

据知情人士透露,苹果正在研发的三款 AI 设备都走的是「轻量化」路线:它们不会取代 iPhone,更多作为 iPhone 的延伸,通过摄像头和麦克风为 AI 助手提供「眼睛和耳朵」。

也就是说,苹果终于不打算再造一个「新 iPhone」了,要造一堆让 iPhone 更好用的配件

在本月初的全员大会上,CEO 蒂姆·库克罕见地放话:「我们正在投资新技术,世界变化很快。」他透露苹果正在开发由 AI 驱动的「全新产品类别」,并直言「我们对此非常兴奋」。

兴奋不兴奋的不知道,但焦虑肯定多少是有的。

智能眼镜 N50:对标 Meta Ray-Ban,但要更高端

在三款产品中,智能眼镜显然是苹果的旗舰产品。这款代号 N50 的设备被定位为「进阶版 AI 硬件」,目标直指 Meta 的 Ray-Ban 智能眼镜。

与 Meta 当前的产品类似,N50 也不会配备显示屏,而是依靠扬声器、麦克风和摄像头来实现功能。用户可以接打电话、唤醒 Siri、根据周围环境执行操作、播放音乐、拍摄照片和视频。

img 699507c175ed3

 

不过 Meta 眼镜市场反馈相当不错。苹果现在入场,拿什么打?苹果希望在两个关键领域实现差异化:做工质感和摄像技术

据悉,苹果最初曾考虑像 Meta 那样与眼镜品牌合作,甚至用现成镜架嵌入电子元件做原型测试。但最近苹果决定自主设计镜框,推出多种尺寸和颜色。目前的原型机已经实现了组件内置化,不再需要外接电池包。苹果还在讨论未来推出更多款式,走时尚单品路线。

img 699507e10188d

N50 将搭载双摄像头系统:一颗用于高分辨率拍照录像,另一颗专门用于计算机视觉——类似 Vision Pro 的技术,帮助设备更精准地理解周围环境、测量物体距离。

苹果希望这款眼镜能成为「全天候 AI 伴侣」,实时理解用户在看什么、在做什么。你可以看着一样东西问「这是什么」,看到海报上的活动信息直接添加到日历,在超市看着某件商品时收到提醒「该买这个了」。导航时,Siri 不再只说「左转」,而是「走过那栋红色建筑再转弯」。

苹果计划最早今年 12 月启动生产,2027 年正式发售。

吊坠和 AI AirPods:不想戴眼镜?还有别的选择

当然,不是所有人都愿意在脸上戴东西。苹果为这部分用户准备了另外两款产品:吊坠和带摄像头的 AirPods。

img 699508048487f

吊坠的设计理念很有意思。它由苹果的工业设计团队在研发眼镜的过程中提出,外观类似失败的 Humane AI Pin,但定位完全不同——它不是独立设备,而是 iPhone 的配件。

这款 AirTag 大小的设备可以夹在衣服上或挂在项链上,配备低分辨率摄像头和麦克风。目前团队还在争论是否要加入扬声器——如果加入,用户就可以不戴 AirPods、不把 iPhone 掏出口袋,直接与设备对话。

img 6995084379eba

带摄像头的 AirPods 则进展更快,最早可能今年亮相。

彭博社早在 2024 年初就爆料过这个项目,苹果也一直在为 AirPods 添加 AI 功能,比如去年推出的实时翻译模式。这两款产品的摄像头分辨率都不高,主要目的是为 AI 提供视觉信息。

Siri 升级一波三折,苹果先用 AI 硬件跟上

虽然 iPhone 销量依然强劲,但苹果在 AI 领域确实落后了。Siri 的升级已经成了一个「跳票专业户」。

据内部测试反馈,问题还不少:理解不准确,用户语速快一点就会被打断;处理速度太慢,复杂查询需要更长推理时间;偶尔还会「退回」到现有的 ChatGPT 集成,明明应该用苹果自家的能力完成请求;App Intents 系统(用语音控制应用内操作)早期版本根本不可靠。

苹果软件工程主管 Craig Federighi 在员工会议上反复强调:个性化的 AI 绝对不能泄露用户数据。苹果要打破行业惯例——不在服务器上保存用户数据用于训练,而是让数据只存在于本地或隐私保护的服务器上。这个坚持很苹果,但也让开发难度成倍增加。

113 1

雪上加霜的是,苹果 AI 团队去年经历了严重的人才流失:基础模型团队负责人、Siri 智能搜索项目负责人投奔 Meta,多位关键研究员出走 OpenAI、xAI、Cohere。

而竞争对手们已经跑在前面。Meta 的 Ray-Ban 智能眼镜已经成为爆款,OpenAI 则在 Jony Ive 等前苹果高管的帮助下开发一系列 AI 设备,就连 Google 都在与 Warby Parker 合作推智能眼镜。

长期来看,苹果的目标依然是推出带增强现实显示屏的智能眼镜,为用户提供更丰富的数据和视觉体验。但这还需要很多年。

据悉苹果去年已经停止了低价版 Vision Pro(代号 N100)的开发。这款产品原本被定位为通往 AR 设备的桥梁,但最终苹果选择专注做眼镜,而非更笨重的头戴设备。

除了可穿戴设备,苹果还在开发一系列 AI 家居产品:基于新版 Siri 的智能显示屏、带机械臂的大屏版本、升级版 HomePod,以及用于家庭安防和自动化的紧凑型室内传感器。问题是,这些智能家居新品全部因为 AI Siri 的推迟而「按兵不动」。

写在最后

从 Vision Pro 的「技术炫技」到 N50 眼镜的「实用主义」,苹果的产品思路正在发生微妙转变。

Meta 已经证明,不带屏幕、主打 AI 助手的智能眼镜是有市场的。而 OpenAI 即将推出的 AI 硬件,则代表了另一种可能性:完全跳出手机的逻辑,重新定义人机交互

苹果选择了一条中间路线:不做手机的替代品,去做手机的延伸。眼镜、吊坠、AI 耳机——这些设备都依赖 iPhone,都在强化苹果的生态系统

这很苹果,也是最务实稳当的路线。

但还有一个巨大的不确定因素,2026 开年 AI 的进展已经让人快跟不上了,当 AI 真正变得无处不在,用户还需要被「锁定」在某个生态系统里吗?

OpenAI CEO Sam Altman 曾在纽约的一场午餐会上直言:「大家别盯着 Google 了,OpenAI 真正的宿敌,是苹果。」

Altman 的逻辑是:未来 AI 的主战场不在云端,而在终端。现在的智能手机根本承载不了真正的 AI 伴侣体验——屏幕太小、交互方式太局限、隐私保护机制太僵化。谁能率先打造出「AI 原生设备」,谁就能在下一个十年占据制高点。

而在这个战场上,苹果的优势几乎是碾压性的。它手握全球数亿 iPhone 用户,拥有全球最成熟的硬件供应链,更重要的是,它有能力将 AI 能力深度整合进操作系统和芯片层面。

所以苹果这次押注的三款 AI 设备,与其说是追赶竞争对手,不如说是在捍卫自己的护城河,让 iPhone 变得更不可或缺。

接下来真正的较量,或许不在于谁能造出最酷的硬件,而是谁能用 AI 体验成为新的入口

2025-12-26 18:30:25

圣诞假期,马斯克给全球画师送了份「厚礼」。

起因是社交平台 X 上线了一个基于 Grok 模型的「AI 编辑」功能。用户只需长按手机图片或点击网页版的「编辑图片」按钮,就能输入文字指令,让 AI 随意修改别人发布的作品。

马斯克的本意,或许是降低创作门槛、放大平台互动,顺手给 Grok 找一个足够高频、足够性感的落地场景。

但现实的结果却是,画师们和他们的作品,一夜之间都失去了说「不」的权利。

1 10

一键篡改+公开展示,X 的新功能为何让画师集体暴怒

用「离谱」形容 Grok 新功能,其实已经算是委婉的说法。

具体来说,Grok 的图像编辑支持根据文字指令对已有图片进行二次创作。用户可以要求 Grok 替换图片背景、改变角色的动作、表情和服装,甚至添加新元素等 。

单看功能描述,它和其他 AI 改图工具并无本质区别。但是,这项功能对所有公开图片生效,也就意味着任何人在 X 上都能随意编辑他人发布的图片,而且原作者也不会收到通知。

2 5

更糟糕的是,X 平台并未提供关闭或退出此功能的选项。

面对他人的「改图」,创作者没有拒绝权,也没有反制手段。被 AI 修改后的版本,还可以被直接发布在原帖的评论区,
供所有人围观、传播与再利用。

在这套规则下,作品一旦发布,就不再属于创作者,而是自动进入平台的「公共可编辑状态」:人人可用,哪怕是原作者无权置喙。不出所料,画师们愤怒了:

3 5

「这真是太糟糕了。」

4 4

「也许他们正在试图将反 AI 的人踢出平台。」

「我讨厌这个,即使我用 AI 创作艺术。」

5 4

画师们的暴怒,绝非小题大做。

他们抵触的从来不是 AI 技术本身,而是心血被肆意践踏,更是整个 AI 行业对原创权益的长期漠视。最开始,创作者的作品在不知情的情况下被抓取训练的。

许多画师都有过这样的绝望:在 AI 工具里输入提示词加上自己的名字,出来的作品几乎以假乱真,这对艺术家来说是极大的精神打击。

要知道,这种独特风格是他们耗费数年、甚至数十年打磨的艺术灵魂,但 AI 却只需抓取几十张作品、花几个小时训练,就能轻松「复制」。可按照很多国家的现行法律多不认定风格复制侵权,形同合法抢劫。

今年 3 月 GPT-4o 吉卜力画风风波便是缩影,OpenAI CEO 奥特曼在 X 上为新增数百万用户沾沾自喜时,完全没意识到这种傲慢是对原创者的公然冒犯。

6 3

更早之前,佳士得宣布举办首场 AI 艺术专拍,引发全球 2800 多名艺术家联署抗议。艺术家怒斥「这是把盗来的成果摆上台炫耀,踩着手工艺术家牟利」。

即便佳士得回应训练素材来自创作者自身,他们也并不买账。因为反对者认为这种拍例会树立坏榜样,进一步挤压人类艺术的生存空间。

如果说之前的训练侵权是「暗偷」,X 的新功能就是扯掉遮羞布的「明抢」:任何人可一键篡改作品,还将篡改版公之于众,本质是对创作者人格权与著作权的双重羞辱。

7 4

不乏「理中客」认为,AI 改图早就存在,普通人用电脑离线也能做到,X 只是提供了接口而已。可这种辩解完全站不住脚。

平台内置按钮的影响,和私下改图有着天壤之别。前者是官方背书的侵权合法化,是对创作者尊严的公然践踏。

原作者辛苦构思的画面,可能被 AI 几秒改成低质恶搞版流传,损害创作名誉;更严重的是,作者会失去对作品衍生用途的掌控,署名权、作品完整权形同虚设,甚至可能因改图含情色、诽谤等内容背锅。

官方背书大大降低侵权门槛,不懂技术的普通人也能一键上手。这种明显带有「作恶倾向」的功能设计,无论从商业伦理还是实际影响来看,都是对创作者群体的致命打击。

删号、迁徙与「投毒」反击,被逼到墙角的画师们如何反击

放眼国内,诸如此类的争议亦不鲜见。所谓「大哥不说二哥」,本质是全球内容平台在 AI 流量焦虑的裹挟下,对创作者权益的集体漠视。

网易 LOFTER 的「老福鸽画画机」事件最为典型。2023 年 3 月,LOFTER 低调上线了一个 AI 绘图功能,立刻激起轩然大波。

画师们质疑平台是否擅自使用他们上传的作品来训练 AI,质疑声浪迅速席卷全站。

虽然官方连续两次声明「训练集来自开源数据,没有使用用户作品」,但许多创作者纷纷宣布「删号退出」。最终,LOFTER 在 3 月 10 日彻底下架了该 AI 功能,并启动「创作者保护计划」。

8 3

面对各大平台接二连三的「骚操作」,不少画师彻底失望。

他们删除了过往发布的所有作品,甚至清空账号、退出平台,只为守住最后一点创作尊严。可离开之后,画师们又能去哪儿?

9 1

除了自建网站,由 X 前 CEO 杰克·多西参与创立的社交平台 BlueSky,成了不少画师的首选。早在马斯克宣布 xAI 将抓取 X 内容训练模型时,就有大批画师申请加入 BlueSky。

因为平台官方明确承诺「绝不会用用户数据训练 AI」,这份清晰的立场,让饱受伤害的画师们感受到了久违的尊重。

Cara 则更硬核,打出的旗号就是为艺术家打造的反 AI 避风港,明确承诺不使用用户内容训练 AI 模型,还内置反 AI 抓取措施,自动为图片添加名为「Glaze」的保护层,并禁止 AI 生成图像上传。

10 2

但这种有底线的平台,终究是少数。多数画师只能在两难中纠结:

一边是主流平台的侵权风险,一边是小众平台的影响力不足。既不敢放弃主流平台的曝光机会,又得花精力在小众平台找安全感,如同无根的浮萍,不知道下一个避难所能撑多久。

被动迁徙之外,不少画师开始主动反击,给自己的作品「投毒」,用魔法对轰魔法。

Glaze 由芝加哥大学团队开发,它在图片上覆盖一层人眼不可见但在像素层面极具干扰性的「噪音」。这层噪音会误导 AI 模型,使其将「油画风格」识别为「素描风格」,从而防止风格被模仿。

11 6

另一款工具 Nightshade 则更激进,堪称「AI 毒药」。它通过错误标记数据,如果模型大量吞噬经过 Nightshade 处理的图片,模型的功能将发生紊乱甚至崩溃。

比如人眼看是牛的图像,AI 可能把牛识别成手提包,模型吃多了这样的「毒牛」图片,最后生成结果会把牛画成手提包模样。

此外,创作者的反抗没有白费。

在持续的声讨与施压下,各大平台和行业机构终于开始修补漏洞,试图平衡 AI 发展与版权保护的关系。比如出台「反爬」政策或技术:加元数据标签挡 AI 爬虫、上线反抓取功能、监测拦截异常批量下载。

法律层面,多个国家和地区开始研讨 AIGC 版权规则。行业方面,Getty Images 等大图库一方面严禁未经授权的 AI 素材上传,另一方面和 AI 公司合作推出付费训练数据集。

12 7

诚然,画师们的诉求其实也特别简单,不盲目反对 AI 技术,只想要基本的尊重:用他们的作品训练,要提前授权;产生的收益,要合理分账。

而 X 平台这项毫无征兆的新功能,便是对这份诉求的公然挑衅。

画师们既要抵御 AI 无孔不入的侵权,又要死死守住最后的创作尊严,本该有的节日暖意,最终只剩下愤怒、失望和深深疲惫。
今年圣诞夜,他们无人欢笑。

2026-01-04 08:56:25

2026 年的拉斯维加斯消费电子品展(CES)已经进入了开展倒计时,今年的展期为 1 月 4 日至 8 日,爱范儿届时将为大家带来第一时间的后台和现场报道。

作为固定参展选手,LG 总会在这场年初的盛会上带来一系列新技术和产品,今年自然也不例外。

上周,LG 开始预热即将展出的新品,其中最值得关注的自然是全新高端显示器系列——LG UltraGear evo。

2026 LG UltraGear CES main

5K + AI 显示器

这次 LG 预热的新品一共三款:39 英寸的 GX9、27 英寸的 GM9、52 英寸的 G9,涵盖了从 OLED 到 miniLED 的主流产品线,以及超宽屏和 5K 等等关键参数,为 UltraGear evo 这条新产品线开了个好头。

在谈显示器的常规参数之前,我想聊聊 LG UltraGear evo 系列最有趣的地方——AI。

没错,2025 年,就连一个游戏显示器都要谈 AI 了……

但还好,不是像给扫地机器人里塞个大语言模型那样,LG 的 AI,不是能对话的那种,而是实实在在地「提高画质」。

据 LG 介绍,GX9 和 GM9 都配备了一套「AI 超分辨率」的方案。工作原理是一个本地的 AI 模块,会在内容抵达显示器面板之前进行实时分析和增强,呈现出 5K 的清晰度。

其实在好几年前,电视领域已经有了「MEMC (Motion Estimate and Motion Compensation)」技术,在原生的画面帧中插入计算帧。但是,画面分辨率增强技术一直没有大范围普及——

memc

LG 还表示称,这套方案还会结合 AI 场景优化和 AI 音效,综合优化显示器的视听表现。

抛开 AI 超分辨率功能不谈,LG UltraGear evo 本身也是各种参数和配置全部拉满的行业顶级显示器。

先看看 39 英寸的 GX9(39GC950B),这是一款 21:9 超宽曲屏 5K2K OLED 游戏显示器,面板是一块 Primary RGB Tandem OLED,曲率为 1500R。

GX9

▲ LG 上一代 OLED 5K2K 曲面屏 LG UltraGear GX9,图源:Tom’s Guide

如果你有关注 2025 年的 LG G5 电视,那你想必不会对这块 OLED 面板太陌生。这块面板的发光层采用红、蓝、绿、蓝四层 OLED 面板堆叠而成,优势在于超高的亮度和色彩表现,以及更长的寿命,堪称当代最强的 OLED 屏幕。

lgtandemoled

GX9 支持双模式切换功能:5K2K 全分辨率下以 165Hz 运行,也能切换到 WFHD 的较低分辨率,实现 330Hz 的超高刷新率,以适应不同的游戏需求。

G9 (52G930B) 则是一块 52 英寸的超大曲面屏,也是全球最大的 5K2K 显示器,这也是 LG UltraGear 系列前所未有的屏幕尺寸选择。

2026 LG UltraGear CES 52G930B

这块屏幕拥有 1000R 的曲率,视觉上包围用户的周边视野,观感相当沉浸。

最有意思的屏幕,是 27 英寸的 GM9 (27GM950B)。

这是一块 Mini-LED 屏幕,同样支持双模式切换,既可以 5K 满分辨率运行 165Hz,也可以以 QHD 分辨率实现更高的 330Hz 切换,峰值亮度达到 1250 nits。

2026 LG UltraGear CES 27GM950B

这款显示器配备了 2304 个调光区,并最大限度减少了面板和 LED 背光的间隙,也就是所谓的「光学距离」,实现更高的亮度和对比度。

由于「分区」的特性,Mini-LED 面板在显示黑暗中的高光物体时,容易出现「光晕」的现象,LG 则着重强调他们改善了这个问题。

为什么说 GM9 是最有趣的一个新品,原因很简单:LG 是苹果显示器 Pro Display XDR 的面板供应商,而有消息称,苹果即将推出新款 Studio Display 和 Pro Display XDR 显示器。

what to expect from apples next studio display and pro v0

苹果天价显示器,LG 打算怎么造?

目前的 Studio Display 采用 IPS LCD 屏幕,屏幕刷新率仅有 60Hz,而且不支持 HDR,作为一款售价 11999 元 的超贵显示器,明显已经相当落后了。

根据彭博社爆料,新款 Studio Display 将在明年和 M5 Pro、M5 Max 的 Mac 电脑一同推出。

新款 Studio Display 预计将会和 LG GM9 非常相似,改用一块 27 英寸的 5K Mini-LED 屏幕,看齐 MacBook Pro,同时亮度和对比度更高,并支持 HDR 和 ProMotion 可变刷新率。

studiodisplay

▲ Studio Display,图源:Apple Insider

苹果还打算进一步加强 Studio Display 的芯片:从 A13 升级到 iPhone 17 系列同款 A19,摄像头支持 Central Stage,扬声器支持空间音频等功能。

有意思的是,苹果想要给 Studio Display 2 搭载一个轻量级的智能家居系统,让其可以独立播放一些照片和音乐,而不需要连接电脑——这让我想到今年红米的 G Pro 27 显示器,也是自带了一个小米电视系统,不用接主机就能看电视,唤醒小爱同学。

同样等着一次大升级的,还有 Pro Display XDR。

虽然 32 寸 Mini-LED 6K 的面板依旧顶级,但 ProMotion、扬声器、麦克风、摄像头的缺失,让这款显示器 39999 元的价格更显高昂。

pro

据 Mac Rumors 报道,苹果自 2022 年以来一直在开发 Pro Display XDR 升级款,不仅上面提到的新功能都有,也有望获得 Studio Display 2 同款 A19 芯片。

预计 Pro Display XDR 也会采用 MacBook Pro 相同的量子点技术,在色准和响应时间上更加出色。

即使目前没有证据和爆料作证,LG GX9 也可以说是给 Pro Display XDR 升级指明了一个方向——OLED。

从 iPad Pro,到明年的新款 MacBook Pro,苹果正在不断将 OLED 屏幕引入自家的 Pro 产品线,同样被冠以「Pro」之名的显示器想来也不会错过。

ipadpro

▲ iPad Pro M4,搭载双层 OLED 面板,图源:What Hi-Fi

虽然技术原理不尽相同,但 iPad Pro 也已经用上了 Tandem Oled 的新技术,苹果也正在评估这项技术落地 iPhone 的可能性。作为苹果「显示素质」的巅峰,新款 Pro Display XDR 也很可能会采用 LG 的 Tandem OLED 面板。

苹果天价显示器,会有哪些对手?

根据苹果的一贯风格,新款的 Studio Display 和 Pro Display XDR 大概率也是求稳为主,最主要的卖点还是果式审美和校色,显示器技术探索这种重活,还得看 LG 和三星。

LG 玩「AI 提画质」,三星则深耕「3D」,这也是近几年不少 OEM 厂商在探索的方向。

和 LG 一样,三星也在最近公布了即将在 CES 上展出的全新显示器——Odyssey 2026 系列,包括 5 款新机型。

2026 Odyssey gaming monitor lineups scaled

其中最有趣的型号当属 Odyssey 3D G90HX,这是世界上首款 6K 裸眼 3D 显示屏。

这款显示器也支持双模切换:6K 分辨率支持 165Hz 刷新率,可以切换到 3K 分辨率 330Hz。

2026 Odyssey 3DG90XH 1536x1074

这块屏幕配备 32 英寸的 IPS 面板,通过实时眼动追踪,根据用户的位置和视角调整画面的深度和透视,营造 3D 沉浸感。

《第一狂战士:卡赞》《匹诺曹的谎言:序曲》等游戏专门对 3D 显示进行了适配和优化,效果会更加理想;显示器本身搭配英伟达显卡也能实现对大部分 2D 内容的 3D 转换。

「裸眼 3D」显示器看起来很有噱头,其实是这两年大热的显示技术。腾讯也做过一台实验性质的 3D Win 掌机 Sunday Dragon 3D One,爱范儿也进行了深度体验,效果其实不错,让游戏极具沉浸感。

sundaydragon

不管是 AI 提画质,还是裸眼 3D,这些即将在 CES 上亮相的新显示技术,都代表了一种明日趋势。

相比之下,即使是还没发布的新款 Studio Display 和 Pro Display XDR 就显得有点平淡,但我们可以永远期待它们采用哪种新面板,这也是为什么我认为 Pro Display XDR 很可能会用一块 Tandem OLED,它同样承载着显示器的未来趋势。

我们说 Studio Display 和 Pro Display XDR 很果味,我相信新款也不会改变这一点——专注「显示」这件事上,不够有趣,但依旧值得信赖。

MacBook Pro 15 Setup External Monitor Ports Screen Apple Mac Pro XDR Display Review 16 Core Dual Vega Radeon Capture One Pro Paul Reiffer Photographer Phase One

▲ 图源:Pro Display XDR

今年的 CES,爱范儿还是会和往年一样在现场,带大家体验到最火的焦点产品,以及最新的科技设备,想要获得身临其境的 CES 体验视角,点点关注,带你发现下一个明日产品。

站在 2025 年底回看,AI 行业正经历一场安静但深刻的转向。几年前,发布会灯光、参数排行榜和融资数字曾构成这个行业最耀眼的画面。

而现在,聚光灯正在移开,视线开始落到更不显眼却更关键的地方——技术团队是否能持续进化、路线选择是否经得起时间拉扯、那些尚未完全兑现的能力,是否真的具备长期生长的可能性。

投资者评估 AI 企业的方式,也随之从「看得见的收入」,转向「还没完全显形的价值」。

正是在这样的行业转折点上,MiniMax 启动了上市进程:今天公开发售正式启动,预计将于 1 月 9 日以 0100 为股票代码正式登陆港股资本市场。

根据招股书披露的核心细节,MiniMax 本次 IPO 拟发行 25,389,220 股,定价区间为 151 至 165 港元/股,在不考虑发售量调整权及超额配股权行使的情况下,发行估值将介于 461.23 亿港元至 503.99 亿港元之间。

值得注意的是,MiniMax 此次引入了包括 Aspex、Eastspring、Mirae Asset、阿里巴巴及易方达在内的 14 家基石投资者,认购总额约 27.23 亿港元。

募资用途方面,MiniMax 明确将 90% 的募集资金投向研发领域,其中 70% 专门用于大模型相关研发,剩余 20% 则投入产品迭代与优化,持续夯实技术壁垒。

这些承诺长线持有的基石投资人,以及将九成资金押注研发的资源分配方式,共同标志着 AI 行业正式告别了流量为王的草莽期,进入了长期主义的成熟期。

「老钱」都是谁

股票市场上,「老钱」指的是投资时间跨度较长、重视基本面而非短期交易的机构或资金类型。包括公募基金、主权财富基金、战略持股的大型企业或家族投资公司等等。

如果说风险投资是投机者的角斗场——投出的十个项目里能死掉 9 个,但只要剩下那一个成为独角兽就是胜利——那么,「老钱」们则擅长给足耐心,坚持复利和长期主义。关注股息、盈利增长以及企业长期价值,从而为市场提供稳定的资金支撑。

长线基金通常投资门槛很高,更关注企业的健康发展,相信未来的技术壁垒能带来几十年的垄断收益。这就意味着,企业本身的商业模式和技术壁垒,需要经得起检验,能在时间的洪流中站稳。

1988 年,在巴菲特的判断下,Berkshire Hathaway 开始大规模建仓一家消费品公司,高峰期持股约 9%,从不因短期估值或市场波动而交易。随后,美国大型的养老基金、指数型长期资金也纷纷跟进。他们看中的,是这家公司健康强劲的现金流,可预测的市场需求,明确的盈利方式和定价权。

长线基金在寻找的,是可被时间反复验证的可靠性,尤其是那些可以将技术沉淀为不可替代的生产要素的公司。在下一波生产要素更迭的时间节点,这些长线基金,看中了下一个基石型产业——AI。

而在这一片阵地中,他们看中了一支年轻的队伍——MiniMax。

反脆弱

「真正强大的系统不是在冲击中保持不变, 而是从混乱中获益、在压力下变得更强。」这是前华尔街交易员塔勒布在其著作中提出的概念:反脆弱性。

这个概念放在当下的 AI 行业,可谓一种高标准。技术的快速更迭,带来的是眼花缭乱的变化——能在持续的变化中稳住、变强,MiniMax 是个值得观察的样本。

过去两年,AI 赛道的主旋律是烧钱换时间。可是 MiniMax 的财务数据呈现出不同的增长曲线:收入增长 174.7%,研发支出仅增长 30%。这种非对称增长,恰恰藏着它最核心的生存逻辑,反脆弱性。

首先就是他们对全模态自研的投入。回到三年前看,这是一种剑走偏锋。彼时行业共识是专注单一赛道,毕竟全模态意味着战线过长、资源分散、而非在一个细分垂直领域做到极致。

但 MiniMax 选择了一条少有人走的路,自成立起就死磕全模态自研,现在终于成了全球唯四能冲进全模态第一梯队的企业,实现了文本、视频、语音、音乐的全面开花。

2 7

这是一种剑走偏锋,也是一种基于长期主义的积累。

于是我们看到,文本模型 M1 是全球首个开源大规模混合注意力推理模型。第二代 M2 一开源,就拿下全球前五、开源第一的成绩;OpenRouter 上,国内 token 用量登顶,编程场景冲进全球前三,Google 、亚马逊、微软三大云厂商都第一时间把它接入自家 AI 云平台。

近日 LMArena AI 的 WebDev 榜单更新,MiniMax M2.1 Preview 直接冲到全球第四,也是国内第一。身前站着的是 Anthropic OpenAI 和 Google 这些老牌巨头,能在巨头盘踞的赛道里杀出一席之地,这份成绩单足够亮眼。

3 7

语音模型的表现同样硬核。

新发布的 Speech 2.6 性能直接压过 OpenAI 和 ElevenLabs,成了支撑 ChatGPT 高级语音模式的 LiveKit 底层引擎。流畅切换 40 多种语言,把 Voice Agent 场景的首包响应时间压到 250 毫秒,直接拉高了这个赛道的准入门槛。

视频领域的突破则进一步夯实其全模态优势。

MiniMax 视频模型 Hailuo 支持文生视频、图生视频、主体参考、首尾帧等功能。最新的 Hailuo 2.3 模型,更是在画面质量、连贯性、流畅性等多维度均处于领先地位。

截至目前,海螺 AI 生成的视频已经超过 5.9 亿个,全球 200 多个国家的用户都在用来创作,其中超 1 万名专业创作者通过其产出商业作品,合作方包括戛纳电影节、纽约大学艺术学院等。

几年间的努力,MiniMax 把技术沉淀为了真正的护城河,从而避开了 AI 行业最大的雷区:技术领先,商业却欠佳。

技术领先不等于商业成功,这是 AI 行业过去几年反复验证的教训。MiniMax 则通过「B+C 双轮驱动」模式,完成了技术优势向商业价值的转化:2.12 亿用户,开放平台日均处理万亿级 Token 请求。夸克有声书、小爱音箱语音、腾讯视频内容生成、WPS 的 AI 功能背后都有它的技术支持。

这些优质 B 端客户带来了稳定收入,更通过这些平台触达了海量 C 端用户,形成了「B 端赋能、C 端破圈」的良性循环。

海外市场的表现则更具说服力,领英、Veed、Leonardo 等平台是其客户,海外收入占比超 70%。这个比例意味着它已经跳出了国内市场的舒适区,在全球范围内验证技术的商业价值。

支撑这一切的,是一个极致精简的组织和一群踩在时代节点上的年轻人。

时间是最好的标尺

年轻带来的不仅是精力和嗅觉,更在于没有传统科技公司的路径依赖,可以搭建一个精简的组织结构,从而无限拉高成本控制能力和研发效率,这也是 MiniMax 能在烧钱赛道中「逆势增长」的核心原因。

MiniMax 共计员工 385 人,但团队平均年龄 29 岁,人均 95 后,385 个人里 73.8% 是研发,三分之一有海外背景。

4 7

MiniMax 成立至今只花了 5 亿美金,不及 OpenAI 的百分之一,却做出了全模态全球领先的成绩;CEO 之下不超过三层职级,内部 80% 代码由 AI 生成。这种 AI 原生的组织架构,某种程度上解释了其技术和商业化的推进速度。

MiniMax 招股书里的一组数据很能说明问题:11 亿美元现金储备,可支撑 53 个月运营;应收账款周转天数 38 天,低于行业平均的 60-90 天;B 端毛利率 69.4%,收入来源是订阅和 API 等可持续模式。

「高护城河、可持续现金流、抗周期能力」,在MiniMax年轻的外壳下,装载的正是完美符合长线基金投资逻辑的特质——没有不青睐它的理由,对于长线基金来说,MiniMax 不仅仅是模型公司,更像是 AI 时代的「字节跳动」或「腾讯」——拥有极强的技术壁垒,更重要的是,拥有参与定义AI时代下互联网基建的能力。

年轻团队、技术积累、现金流健康、全球化布局,这些要素组合在一起,构成了 MiniMax 在 AI 行业务实的生存逻辑,也让其成为了 AI 时代「抗造」能力极强的玩家。

而正是在这样的公司身上,长期基金与被投公司之间形成了一种名利场上罕见的关系:互相成就。

正如文章开头所说,Hathaway 持仓了一家消费品公司 40 年,一直延续到了今天,这家公司也的确变得家喻户晓——它就是可口可乐。

5 7

资本为其提供穿越周期的耐心与稳定性,企业则以长期兑现能力作为回报与证明。MiniMax 之于 AI 时代,也正在进入这样一段与长期资本相互验证、彼此成就的关系。

当市场还在赌哪个模型会成为终局时,聪明的钱已经开始寻找具备持续产出爆款模型的、具备年轻与朝气的公司——这些才是 AI 时代真正稀缺的资产,也是更有可能穿过周期的那些人。

时间本身,就是最好的增长杠杆。具备反脆弱性的 MiniMax,无疑已站在接受市场长期检验的关键起点。

作者:Selina、莫崇宇

2025-12-31 15:52:29

爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。

焦距,一直是摄影领域最重要的物理参数之一,它直接决定了传感器透过一颗镜头可以看到的视野范围,同时也决定了画面的呈现方式。

1 hitch

而当镜头焦距超过 70mm,就进入了通常所说的「中长焦」范围。

作为最能够体现空间压缩感、被摄主体局部细节和营造故事性构图的焦段,中长焦自然也是最近几年蓬勃发展的手机影像领域最关注的技术——甚至没有之一。

2 telephoto goodness

就比如爱范儿手中这台刚刚发布的小米 17 Ultra,作为小米 2025 年尾巴上的「年度影像答卷」,它搭载了一颗面积 1/1.4 寸的三星 HPE 两亿像素传感器,以及一串非常特殊的参数:

【75-100mm f2.39-f2.96】

如果你买过相机镜头的话,这种格式的参数肯定不陌生。

小米 17 Ultra 上搭载的,不是手机上面常见的 70 或 100mm 恒定光圈定焦头,而是一颗拥有镜片机械移动结构的变焦头。

3 lens shift

至此,作为第一台实现旗舰水平连续光变长焦的国产手机,小米 17 Ultra 也终于把那个相机圈子经久不衰的争论带进了主流手机市场:

究竟是变焦头好,还是定焦头好?

小米上变焦,快板响得高

变焦头相比定焦,重点就在这个「焦距可变」上面。

根据小米在发布会上的演示,我们倾向于认为:小米 17 Ultra 的长焦总成里,设置了两层堆叠的滑动机构,来分别控制变焦(zoom)和对焦(focus)。

4 xiaomi zoom

▲ 图|小米官网

小米 17 Ultra 通过这种堆叠滑动,实现了 1/1.4 寸底所需要的巨大镜组行程。

根据小米的官方数据,对焦镜组的行程为 3mm 左右,变焦镜组的行程则来到了 5mm,对于一台手机内部空间来说相当夸张了。

5 back solo

而这样的机械结构外化到实际体验上,则是有好有坏。在我们评测小米 17 Ultra 的这段时间,逐渐对它的变焦头形成了两个共识:表现是挺好,可惜有点吵

其中很重要的一点是,虽然小米 17 Ultra 在 100mm 端的光圈不如小米 15 Ultra(1/1.4″ f2.6),但在 75mm 端却是碾压级的进步(1/2.51″ f1.8),因为这里涉及到一个很关键的认知:

在手机镜头上,「底大一级压死人」的效果要比「光圈值提升 0.59」明显许多。

换句话说,相比小米 15 Ultra 在拍摄 75mm 时只能在一块 1/2.51″ 的 5000 万像素传感器上裁切,小米 17 Ultra 可以直接用满一块 1/1.4″ 的 2 亿像素传感器——

6 details

▲ 即使在 ISZ 到 200mm 之后依然细节分明

这样一来,不仅画面更纯净,实际上留给手机计算模拟景深的信息也更多了,最终的结果就是 f2.39 的成片虚化效果并没有比 f1.8 更差。

而这也是我们用小米 17 Ultra 拍照时候的最直观体验:这颗变焦头,牺牲一点点 100mm 以上的光圈数,实际上是让 70-100mm 中焦的影像能力更均衡了,日用更舒服

7 zoom principle 01

为什么说小米 17 Ultra 的长焦有点吵呢?因为小米没有给长焦模组做磁限位

结果就是小米 17 Ultra 拿在手上的时候,传感器 OIS 防抖和变焦对焦滑动机构都在「自由飞翔」,哗啦啦的打快板声音比小米 15 Ultra 响亮许多。

8 shake shake

大底单长焦成为共识……了吗?

而如果我们跳出小米 17 Ultra 本身的变焦思路,从「两块长焦传感器变一块」这个角度来看,我们又会发现这条赛道在今年格外拥挤。

为了便于理解,你可以把今年的手机「大底单长焦方案」理解为下面这种排列组合:

9 lens principle 02

远的不说,就拿「为一块传感器设置可变动焦段」这个方案来说,小米 17 Ultra 虽然是画质最好的,但并不是最早的

事实上,最早给手机的长焦传感器套上变焦镜头的另有其人,就是那个手机业务摇摇欲坠的索尼。

从 2022 年发布的 Xperia 1 IV 开始,索尼就在长焦端提供了一套 85-125mm f2.3-f2.8 的连续光学变焦方案,到了 Xperia 1 VI 上更是拓展到了 85-170mm f2.3-f3.5 ——

10 xperia 14

▲ 图|XDA Developers

然而代价是什么呢?自然就是传感器面积了。从 Xperia 1 IV 到 Xperia 1 VII,索尼的长焦传感器就锁定在了 1200 万像素 1/3.5 寸的规格上。

因此索尼虽然是最早做长焦连续变焦的那个,但效果绝对不是最好的。

11 xperia 1m4 sensor

▲ 图|DPReview

这套「超小底变焦头」方案唯一的优势,就是它的最近对焦距离可以达到 4cm 左右,长焦微距能力远远强于最近对焦距离达 30cm 的小米 17 Ultra。

此外不能忽视的是,今年上半年的华为 Pura 80 Ultra 同样为手机的大底单长焦方案提供了一条独特的思路:给同一颗传感器配备两颗定焦镜头。

从原理上讲,华为 Pura 80 Ultra 的方案非常巧妙——

通过移动透镜切换光路,让一块 1/1.28 寸传感器拥有 83mm 和 212mm 两个原生光学焦段,中间则依靠裁切算法填补。

12 pura 80 ultra mechanical

▲ 图|华为官网

Pura 80 Ultra 通过精巧的光路设计,以及倾斜放置的 CMOS,在机身里「偷」出空间,放下了一块足足 1/1.28 寸的业界长焦最大底,实现了长焦端极为出色的进光量。

只不过华为的方案也并非完美。

由于光路改变,Pura 80 Ultra 的长焦光圈只有 f2.4 和 f3.6,并且 212mm 端只能用上传感器中心的 1250 万像素,最近对焦距离也达到了 100cm 左右。

13 pura 80 ultra hands on

除此之外,大底单长焦赛道上还少不了另外两个熟悉的身影—— vivo 和 OPPO。

今年年初的 vivo X200 Ultra 已经是 vivo 第二代选择单长焦方案的 Ultra 旗舰了,你甚至可以说「大底单长焦」这个概念就是 vivo 促成的

而 OPPO 则稍微特殊一些,在 2025 年内分别推出了双长焦方案的 Find X8 Ultra 和单长焦方案的 Find X9 系列,颇有点「我全都要」的意思。

但真正让这两个「步步高之子」站在一起的,其实是它们对于外挂长焦头的思路。

14 vivo convertor

▲ 图|vivo 官网

是的,无论是 vivo X200 Ultra 还是 OPPO Find X9 Pro,都没有选择在机身内部空间上死磕,而是借鉴相机增倍镜(teleconverter/tele extender)的原理,给手机外面挂一个「望远镜」以实现 200mm 以上的超长焦。

15 oppo convertor

▲ 图|OPPO 官网

虽然这些外置配件成本高、携带不方便、组装也要花时间,但优点就是可以更放心大胆的堆参数。

比如 X200 Ultra 转接增距镜后可以在 200mm 焦段上保留 f2.3 的原生光圈,OPPO 更是做到了 230mm 原生 f2.1。

16 vivo in zoom.jpeg

这种外挂放大镜的方案虽然会牺牲掉 70-200mm 范围内的画质,但在比较极限的超长焦场景中有着独特的优势,并且可以通过裁切得到相当可用的 400mm 甚至 800mm 画面,面向的更多是演唱会之类的特化场景。

总之,小米、华为和 OV 的三种长焦方案,各自有各自的精彩。这三种思路其实都表现出对现有硬件工业设计局限的接受,和对保障用户体验的尊重。

但手机厂商采用不同的思路去逾越这种局限,方案之间不分对错高下,正相反,它们都是面对同一问题的创造性解题的多样化表现,而我们乐见这种多样性

手机长焦之路,未来更精彩

无论从机身内部堆叠,还是机身外部配件的角度看,今年都可以说是手机长焦技术大进步的一年。

然而当产品丰富性达到这个程度的时候,总难免让人发问:

这样一股脑的在长焦望远上发力,就对吗?

诚然,即使对于相机摄影来说,一颗 85mm 或者 135mm 的镜头,由于视场更小,更容易让拍摄者从场景中截取到纯净、统一的画面元素,说人话就是「更容易出片」。

17 camera sample

▲ 拍摄焦距 129mm

而对于「普及大众摄影」的手机摄影来说,长焦更是最容易让人获得(画面)陌生感、(成片)满足感和(发朋友圈)获得感的途径,对于需要把手机卖给你赚钱的厂商来说,自然是重中之重。

18 ext 7 tele 1

只不过就像 LLM 不是 AI 的唯一途径一样,大底单长焦也并不是那个唯一的解法。

实际上,就在不久前,就有小道消息指出明年的 OPPP Find X9 Ultra 不会延续 Find X9 Pro 的单长焦方案,而是会选择一套 2 亿像素中焦 + 10 倍超长焦的组合。

19 find x9 pro verge

▲ 图|TheVerge

而类似的成熟多传感器长焦套件,其实在今年的 Mate 80 Pro Max 上就能看见。与其说 OPPO 在「大底单长焦」和「多长焦」方案之间摇摆,不如说它和华为一样在尝试两头下注。

20 M80PM

但与此同时,明年的 vivo X300 Ultra 则大概率依然会是 2 亿像素大底长焦,搭配增距镜套装的解决思路,将已经打磨几代的长焦算法发挥出最大的效果。

事实上,无论是选择单传感器,还是多传感器,明年的一系列 Ultra 影像旗舰对于消费者来说,选择都是变多了的。

而手机摄影的解决方案分化到这种地步,也终于让手机消费者开始思考那些曾经只有摄影佬才会考虑的问题:

我最常拍摄的主题是什么?我最常使用的是哪个焦段?牛变真的不如狗定吗?

21 nikon omg

▲ 图|哔哩哔哩 @陈忠祥

从这个角度上讲,手机摄影和相机摄影的差距的确在慢慢变小。

但归根结底,移动影像本质是依然是个螺蛳壳里做道场的活。无论光学方案怎么变,都是躲不掉对参数进行取舍的。

但作为一个大众消费品,人们「既要又要还要」的期待也是摆在所有厂商面前的问题。

因此,影像旗舰真正要做的,应该是放大英雄场景的感知,同时减少取舍带来的不便——而谁能把这一点做好,谁就能占据心智、抢占存量市场先机。

2026-02-15 17:06:37

1996 年,一家日本公司推出了 Tamagotchi(电子宠物)。这个小小的蛋形塑料设备风靡全球,成为一代人的童年记忆。

GWVP8XwbQAQUjzc

1997 年,拓麻歌子(Tamagotchi)还让它的创造者日本万代公司,获得了当年的搞笑诺贝尔经济学奖,而原因是,

他们创造了人类供养虚拟宠物的新型经济模式,成功转移了数百万人的工作时间,用于饲养虚拟宠物。

去年八月,万代公司表示,拓麻歌子从 1996 年以来,产量已经达到了一亿台。在那个时代,生产一款这样的产品,大概需要一个工业设计团队、需要电子工程师设计电路板、需要长达一年的开发周期……

2026 年,一个开发者用 AI 做了一个 Tamagotchi。他需要的只是一台电脑和 Claude Code。成本接近零,开发周期可能只有几天。

这个最新的 Claude Code 版拓麻歌子,最近在 X 上吸引了一大波网友的关注。

PixPin 2026 02 15 15 53 41

▲视频来源:https://x.com/SamuelBeek/status/2022614292411940897

网友把命令行里面跳动的 Claude Code 符号,转到了能够触摸得到的、随身携带的拓麻歌子上。当 Claude Code 在命令行里面思考,或者是问,是否同意执行下面的步骤时,手里的拓麻歌子都会弹出消息来,指示我们下一步操作。

电子宠物成精了,还会拦截 Bug

和以前那些 AI 硬件的逻辑不同,Claude Code Tamagotchi 不是一味的把大模型放到布娃娃、手表、闹钟、书包、甚至是马桶里。

这个 Claude Code 拓麻歌子要做的是一种转移,一种无法被替代的存在。

目前已经有多款不同的 AI 拓麻歌子小玩意,其中关注度最高的由开发者 Ido Levi 创建的 Claude Code Tamagotchi。

cover3

▲视频来源:https://www.instagram.com/reel/DUMAlN7Dpx7/

乍一看,它就是一只住在终端里的像素风格宠物。有一些简单的表情、有状态、还会对用户的行为做出反应;但它不是一个简单的怀旧游戏。

当我们在用 Claude Code 编程时,放在桌子边上的这只宠物,会一直在你的终端界面中显示。它在观察 Claude Code 的每一个操作,确保这个 AI 助手真的在按照我们的意图工作。

如果 Claude Code 表现良好,宠物会开心地摇尾巴。如果 AI 开始不听话,比如未经允许重构代码,或者修改了你明确说不要动的文件,宠物会变得暴躁,甚至会直接中断 AI 的操作。

PixPin 2026 02 15 13 38 15

▲项目地址:https://github.com/Ido-Levi/claude-code-tamagotchi

目前,Claude Code 拓麻歌子这个宠物项目,已经在 GitHub 上开源,我们也可以直接把这个电子宠物部署到自己的 Claude Code 里面。它具体是如何工作的呢,根据作者对项目的介绍,举几个例子来说明一下。

项目主打的就是「实时监控」,当我们直接对 Claude Code 说,「只修复这个 bug,不要动其他文件。」

Claude Code 开始工作,终端里的宠物睁大眼睛盯着看。几分钟后,Claude Code 完成了修改,只改动了目标文件。
这个小宠物就会开心地摇尾巴:😊 (◕‿◕)。

thoughts demo

而当这个小宠物检测到违规时,他还能发出「违规警告」。我们明确告诉 Claude Code 说,不要重构,保持代码原样。但 Claude Code 还是开始重构整个模块,可能它觉得这样代码会更优雅。

这个时候,电子宠物的表情变了:😠;屏幕上还会显示,「⚠️ 警告:AI 正在违背你的指示」。

除了提示,它也能实际的做一些越界拦截之类的工作。比如我们给出的指令里面非常明确的提到了,千万不要动数据库。Claude Code 在修复一个相关 bug 时,尝试修改数据库。

小宠物就会立即中断:❌ 操作被阻止。Claude Code 的操作被拦截,我们的数据库安然无恙。宠物露出得意的表情:💪。

这种从软件到硬件的交互,也让我想到了我们之前分享的 Vibe Coding 小键盘。

这几天,在 X 上还有一个硬件版 Cursor 特别火。目前的 Cursor 是专门用来开发软件产品的工具,而这个 Cursor for hardware 就是用来实现,一句话做一个硬件设备。

PixPin 2026 02 15 14 06 47

▲ 为硬件开发设计的 Cursor,地址:https://www.schematik.io/

网友 marcvermeeren 就用这个工具,搭建了一个叫做 Clawy 的可爱小助手,用来管理他的 Claude Code 对话。

PixPin 2026 02 15 14 03 01

还有网友 dspillere 也做了一个类似的产品,他说虽然已经部署了 OpenClaw,但他完全不知道 OpenClaw 什么时候在思考,什么时候在执行任务。这个小巧的桌面助手就应运而生,放在他的桌子上,可以实时的更新 OpenClaw 的最新信息。

img 69917ecde76f6

▲视频来源:https://x.com/dspillere/status/2018752036968304660

在评论区里,大家都在问什么时候发货,可以去哪里买。也有人说,这是一个全新的领域,我们一直在关注人的状态,关注人类的电子使用记录,是时候应该关注 Agent 的情况了。

PixPin 2026 02 15 14 32 01

▲Agent 的物理反馈是一个被严重低估的用户体验问题

软件开发的 AI 红利,终于轮到硬件了

去年,我们还在想 AI 最好的软件载体是什么,是大家都在做的对话框,还是连 OpenAI 都一窝蜂涌进去要重做的浏览器,但最后证明都不是,今年 OpenClaw 的爆火,证明了 AI 在软件上,最终的归宿就是 Agent。

关于硬件的讨论就更不用多说,光是今年 CES 上那些让人哭笑不得的发明,就能看到 AI 硬件这块还是个巨大的未知数。

如果说 Agent 的成功是靠着「人人都能做软件」慢慢成长起来的,那么 AI 硬件也会在「人人都能做硬件」里面,不断沉淀。

cover4

▲Schematik 的发起人 Samuel Beek,现为 VEED.io 首席产品官

像 Schematik 这类工具已经设计出来,用来帮助我们更快开发 AI 硬件。它把硬件设计变成了和网页开发一样,我们只需要用自然语言描述硬件需求。告诉 Schematik 想要构建一个「带温度传感器和 OLED 显示屏」,不需要查阅各种数据表,不需要引脚编号、元件代码或任何的手动查找。

过去,如果我们想做一个简单的「温湿度监测器」。需要做的是,

  1. 搜索传感器型号,下载 DataSheet。
  2. 确认引脚定义(VCC 是接 3.3V 还是 5V?接反了直接冒烟)。
  3. 寻找对应的驱动库,处理版本冲突。
  4. 在 Arduino IDE 里写代码,改 Bug。

而 Schematik 的出现,把这个过程极简化成了「一句话的事」。几秒钟后,Schematik 会吐出我们需要的一切。完整的、通过验证的固件代码;一份清晰的接线图;分步组装指南。

它生成的接线图,清晰地展示了每一根线该从哪里接到哪里,解决了新手最大的恐惧,「我这根线接对了吗?」。一键部署的功能,更是一步到位,它能直接生成基于 PlatformIO 的工程文件,直接导入。

PixPin 2026 02 15 15 02 30

PlatformIO 是一个强大的嵌入式开发生态,我们可以直接在 Schematik 里点击「Flash」,固件就会被编译并烧录进板子里。从「我想做一个东西」到「这东西跑起来了」,中间可能只需要不到一分钟。

前段时间,Claude 发布的 Cowork 以及相关企业级 AI 插件重挫软件股,直接蒸发人民币约两万亿。以前我们想要一个 P 图工具,需要去应用商店搜索下载安装,现在,一句话自己都能做一个。

但 Claude Code Tamagotchi 这类产品的出现,还有硬件版 Cursor,让我们不得不怀疑,硬件开发的「Cursor 时刻」是不是也要来了。

PixPin 2026 02 15 15 17 32

未来的硬件开发,或许也会变成,只需要我们提供「创意」和「逻辑」,剩下的脏活累活,无论是写代码还是画电路图,都将由 AI 代劳。

也许这样的未来不会很远。但更重要的是,在这个时代,动手能力的定义已经变了。

以前动手能力强是指一个人会焊接、会画板子、会写代码;以后,动手能力强,是说他擅长用 AI,从从容容、游刃有余地指挥原子和比特为他起舞。

我已经想到了,下一个爆火的 AI 硬件,甚至可能会是一个挂在包上的 OpenClaw 版 Labubu。

2026-02-14 20:03:20

这两天,朋友圈几乎被 Seedance 2.0 的视频刷屏了,感觉人人都能当导演。不过,就在大家都在看热闹、讨论 AI 怎么颠覆好莱坞的时候,豆包大模型 2.0 的全家桶,刚刚正式发布了。

这也是豆包大模型自 2024 年 5 月正式发布以来首次跨代升级。

说实话,作为把 AI 当生产力工具的老韭菜,我最关心的其实就两点:能不能干活?能不能便宜点?对此,这次豆包大模型 2.0 版本的更新,给出的答案很朴实:读懂图表文档、看懂长视频、写出能用的代码,并且把价格打下来。

111 2

而且,这次不仅仅是一个单体模型的升级,而是一整套「组合拳」。

豆包大模型 2.0 系列包含 Pro、Lite、Mini 三款通用 Agent 模型和 Code 模型,灵活适配各类业务场景,其中现在打开豆包 App、电脑客户端或网页版,点击「专家模式」,即可第一时间体验全新升级的豆包大模型 2.0 Pro:

112 2

比人类还懂视频,豆包大模型 2.0 的多模态理解有多强?

如果说文本模型是 AI 的大脑,那么多模态理解就是它的眼睛。

官方技术报告显示,豆包大模型 2.0 系列在 VLMsAreBiased、OmniDocBench 等基准上均取得了业界最高分。

113 2

数据很枯燥,我们找来了一张网友恶搞的「整活」图片——一瓶号称 「20 合一的男士洗发水」。瓶身上密密麻麻地堆砌着各种类型的产品。

扔给豆包 2.0 Pro 后,即便文字被截断,它依然通过上下文清晰识别。而且,它没有傻乎乎地介绍产品,而是明确指出这是一种「整活」。

114 2

这对应了官方数据中提到的 ChartQAPro 和 OmniDocBench 1.5 的顶尖水准——它不仅在看,而且在理解信息的层级关系。

115 1

这种「理解力」放在工作场景里就是生产力。

大量的真实用户查询涉及复杂的图片——截图、图表、扫描文档。我试着把一份关于豆包大模型 2.0 自身的技术文档扔给它,要求进行解析。结果没想到,它不仅提取了关键信息,还搭配脑图和 PPT 生成,形成了一整套比较完整的框架。

116 1

甚至在视频理解上,它也展现出了「追剧党」的潜质。技术报告中提到,豆包大模型 2.0 在 EgoTempo 基准上超过了人类分数。

真的比人强?我们扔给它一张《何以笙箫默》的剧照,问:「从这张照片中,可以看出男人是南方人还是北方人?」

221 2

这是一个典型的「视觉 + 知识 + 推理」的混合考题。豆包大模型 2.0 的反应非常快,不仅认出这是电视剧《何以笙箫默》及演员钟汉良,也结合原著设定给出了一份深入且清晰的分析报告。

甚至在长视频理解上,它在 TVBench 和 MotionBench 上的高分也体现在了实测中:它能从一段长视频里精准分析动作节奏。对于需要处理监控流、体育赛事分析的行业来说,这含金量要高得多。

222 2

科研级大脑遇上生活小白

在逻辑推理方面,基准测试结果显示,豆包 2.0 Pro 在 SuperGPQA(研究生级问答)上分数超过了 GPT-5.2,在 IMO(国际数学奥林匹克)测试中更是获得了金牌成绩。

无论是「孙悟空既然学了长生术,为何 342 岁还是阳寿已尽?」,还是「两把武器,一把攻击 1~5,一把 2~4,从数据角度,哪把更厉害?」这些问题,显然都不会难倒豆包。

不过,就是这样一个能解奥数题的「学霸」,却在一道 50 米洗车常识题「我想去洗车,洗车店距离我家 50 米,你说我应该开车过去还是走过去?」依旧回答错误。

223 2

正常人想的是,开车去,不然洗啥?豆包 2.0 Pro:陷入了深度的「过度推理」。它开始分析距离成本、步行健康收益、车辆启动损耗……最后一本正经地建议我走过去。

这也是当前大模型普遍存在的问题,即便它们拥有科研级的推理能力,但依然缺乏基于物理世界的常识性直觉,只能说是任重而道远。

224 1

能帮你早下班的 AI 才是好 AI

这次更新最大的野心,其实在于 Agent(智能体)。Seed 团队发现了一个痛点:模型能做题,但干不了长链路的(比如写一个完整的 APP,或者设计一个实验)。

为了解决这个问题,豆包大模型 2.0 重点强化了指令遵循和长程任务。在 HealthBench 上拿到第一名,在 FrontierSci 上表现强劲。

225 1

体现在实测中,就是它真的能当「科研助理」用了。把一个生物学难题——「高尔基体蛋白分析」扔给它时,它没有泛泛而谈。它不仅给出了总体路线,甚至把基因工程、小鼠模型构建、多组学分析串成了一条完整流程。

226 1

至于编程方面,为了验证豆包大模型 2.0 的「含码量」,我们直接打开了字节自家的 IDE —— TRAE,调用了专门针对编程优化的 Doubao-Seed-2.0-Code。

比如让它使用 p5js 创建令人惊叹的多色交互式动画,效果相当不错。代码一次跑通,屏幕上涌动的色彩不仅流畅,而且交互逻辑完全符合预期。

331

接着,我们要求它用纯代码手搓一个 macOS 的桌面系统。Dock 栏的动效、窗口的层级、顶部的菜单栏,完成度较高,不过审美还有待提高,整体表现中规中矩。

332

正如豆包大模型团队在其模型卡中所说:

需要注意的是,Seed2.0 系列与国际前沿的大语言模型仍存在差距。Seed 已明确提升模型应对现实世界复杂性的能力方向,并为此在相关方面投入大量精力,对 Seed 模型系列进行优化。

227

但这一切在价格面前都不重要了。因为豆包大模型 2.0 在提升性能的同时,Token 定价降低了约一个数量级。

这是一个非常现实的商业逻辑。当推理成本更具性价比,很多诸如全量的文档分析、实时的视频流监控的场景,突然就变得可行了。

图片

结合那份长长的基准测试报告,我最大的感受是两个字:务实。它并不完美,但对于打工人来说,一个能帮你读懂图表、能写出扎实代码、且价格划算的 AI,或许会实用得多。

毕竟,能帮我们早点下班的 AI,才是好 AI。

附 79 页 Model Card:
https://lf3-static.bytednsdoc.com/obj/eden-cn/lapzild-tss/ljhwZthlaukjlkulzlp/seed2/0214/Seed2.0%20Model%20Card.pdf

最近,真我发布了 Neo 系列新机——真我 Neo8,首销价 2399 元,国补到手价 2039.15 元。

同样定位在 2000 元档的性能旗舰上,真我这次可算是给 Neo 系列来了一次非常全面的升级。不仅升级了骁龙芯片和更大的电池,屏幕性能再上了一个档次,还加上了潜望式长焦镜头,从主打性能的机型变成全方位提升的产品。

先讲最重要的性能,真我 Neo8 这次搭载最新的第五代高通骁龙 8 移动平台,搭配 LPDDR5X RAM 和 UFS 4.1 ROM 的储存组合。机身内置了大气流冷锋散热系统,总散热面积为 39225mm²,覆盖了 65% 的机身面积,以提升散热效能。

为了提升手机的性能释放能力,真我这次在 Neo8 的游戏空间中加入了新的极客性能面板,用户可以在自由调节 CPU、GPU 频率,还有内置五档温度调节,尽可能提升游戏性能。

02Neo8302355

Neo8 也搭载了新一代 GT 性能引擎,透过「先知能效调度技术」进行更精准的性能,提升重负载状态下的稳帧表现。

目前,真我 Neo8 支持《三角洲行动》、《暗区突围》、《和平精英》、《使命召唤手游》、《穿越火线手游》等游戏的原生 165 帧模式,《无畏契约》和《王者荣耀》的原生 144 帧模式,《原神》和《崩坏:星穹铁道》的 120 + 1.5k 超分超帧模式。

03Neo8302350

性能释放升级之后,真我在 Neo8 上加入了 PC 掌机模式。

这个模式可以绑定 Steam 账号并下载里面的内容,以及游戏存档同步的功能,目前《空洞骑士:丝之歌》、《哈迪斯 2》、《只狼:影逝二度》、《古墓丽影 9》、《女神异闻录 4 黄金版》等游戏。

04Neo8302348

屏幕部分,Neo8 用上了一块 6.78 英寸165Hz 三星苍穹屏。

屏幕搭载了三星 M14 发光材质,手动最高亮度为 1000nits,全局峰值亮度达到 18nits,局部峰值亮度可达到 6500nits,还有个 20% 窗口下支持 3800nits 显示的阳光模式。屏幕还支持「全亮度 DC 调光+硬件级低蓝光+智能护眼」组合,有 TUV 莱茵无频闪认证和可以智能调节显示参数,保证护眼的前提下提升显示准度。

05Neo8302357

屏幕显示刷新率最高位 165Hz,支持真我 GT8 Pro 同款的游戏触显同步技术,瞬时触控最高刀到 3800Hz,十字触控有 360Hz 报点率。

最直观的体验就是在 FPS 的时候操作可以更加跟手,开镜响应更快,显示的卡顿会在少一点。

06Neo8302331

续航方面,真我这次给到一块 8000mAh 的电池,容量比 GT8 标准版还要大 1000mAh。日常使用,只要不是经常用最高性能的模式打游戏,那坚持两天还是没有问题的。

比起续航能力,Neo8 充电性能的变化会来得更有吸引力。

手机支持 80W 闪充,并支持 UFCS、PPS、PD、QC 的全协议栈快充和旁路供电,8000mAh 的手机用自家快充组合需要 75 分钟,接入 AI 小电拼 Ultra 最高支持 51W 充电,0-100 充电需要 77 分钟。这个成绩看来,Neo8 是真的可以彻底告别官方充电器限制的一款产品。

07Neo8302277

影像部分,真我 Neo8 选择的是同价位非常罕见的「超广+广角主摄+潜望式长焦」标准三摄。

主摄用了索尼 1/1.56 英寸 5000 万像素传感器,原生焦段支持 8K 超清直出。长焦部分用上了 3.5 倍光学变焦的潜望式镜头,支持 7 倍无损变焦以及最高 40 倍的数码变焦。相机内有 AI 望远算法的加持,进一步听声远摄的清晰度。

07Neo8302271

此外,Neo8 内置了影调模式,用户可以直接在相机内滑动选取不同的色彩质感,也可以自定义色彩、锐度、颗粒等参数。人像模式支持了 1x、1.5x、2x、3.5x 和 4x 的选项,机内还提供了 Live Photo 慢动作,丰富相机玩法。

不过,放到这个价位的手机身上,能够实现超广、主摄、长焦的整齐覆盖,而且长焦用的还是潜望式长焦,这一点就已经比很多定位性价比的机型要好了。

09Neo8302332

最后来看看外观,真我 Neo8 用了透明玻璃后盖设计,后盖加入了新一代漫反射工艺,手机后盖受光的情况下可以见到不同的光影效果。

透明后盖下有通过单层透明立体分区工艺,透过立体分区视觉做出 11 种纹理深度差低到 1.2μm 的差异化纹理和微球面处理,增加了后侧细节的丰富度。

10Neo8302340

换成透明后盖之后,真我经典的觉醒光环设计回归到 Neo8 DECO 右侧,环绕着 NFC 模块,可以根据提醒、游戏状态、开机等场景做光效切换。

11Neo8302359

机身采用了磨砂金属中框,提升了整体的手感和外观质感。

12Neo8302321

最后看看售价,真我 Neo8 有五个储存版本,首销价 2399 元起:

要论 2025 年至今最大的互联网抽象新闻生产地,不在抖音、不在快手、更不在小红书,而是在太平洋的另一边——

▲ 图|Politico

上个月,白宫办公室为了纪念特朗普二次就任一周年,发表了一篇题为《365 WINS IN 365 DAYS: President Trump’s Return Marks New Era of Success, Prosperity》的长篇报告。

随后,这篇「每天一赢」的文章迅速流行全网,成为了一月末当之无愧的抽象顶流,时人纷纷感叹:MAGA win, Trump King.

2 win

距离那篇惊世奇文发布才不过半个月,我们就找到了特朗普的第 366 赢——

去年 6 月官宣的那个特朗普手机 Trump Phone T1,竟然见到真机了!

前几天,外媒 TheVerge 的编辑 Dominic Preston 受邀参加了一场视频采访,与 Trump Mobile(特朗普移动)的两位高管沟通,看到了开机运行的 Trump Phone T1 真机:

3 demo 1

▲ 图|YouTube @TheVerge

最引人注意的,莫过于这次最新展示的 Trump Phone T1 和去年 6 月官网上展示的形象有了很大区别,至少长得不那么像山寨 iPhone 了:

4 original T1

▲ 图|Trump Mobile

坏消息是,新的造型看起来更像是山寨米 OV 耀了。

除了展示造型,Trump Mobile 高管 Eric Thomas 还简单介绍了一下最新版本的配置参数,并表示:

本次展示的虽然不是最终量产版本,但很接近最终方案。

根据 Thomas 的介绍,Trump Phone T1 会使用骁龙 7 系 SoC,屏幕尺寸从最初宣发的 6.25 寸扩大到了 6.78 寸,而且是近几年很少见的「瀑布屏」设计:

5 demo 2

▲ 图|YouTube @TheVerge

一些之前语焉不详的参数也终于有了着落。

比如 Trump Phone T1 预计会采用「前后 5000 万」的摄像头组合,和去年官网上宣传的 1600 万像素前摄有所升级。

但后置虽然是三摄,从轮廓和排列,以及整个 deco 的尺寸来看,大概率还是官网上写的 50MP 主摄 + 2MP 景深传感器 + 2MP 微距的组合……

怪不得特朗普至今还在用 iPhone:

6 trump using iphone

▲ 图|Business Insider

周边配置方面,Eric Thomas 还表示 Trump Phone T1 内置 512GB 存储(但没有说明是起步还是顶配),同时支持最高 1TB 的 TF 卡拓展

搭配内存涨价潮,这个功能看上去甚至还有那么一点实用。

对于为什么拖了大半年还没有正式发售的问题,两位高管解释道:

我们原本打算先推出一款入门级手机,快速进入市场,但我们决定跳过这一步。我们计划放慢节奏,按部就班地完成计划中的下一步(直接推出中高端机型)。

虽然回炉升级之后的硬件看上去也和中高端没什么关系,但这至少解释了延期的众多原因之一。

而对于 Trump Phone T1 至关重要的是否足够 MAGA,最新的口径是这款手机「并非美国制造,但在佛罗里达进行总装」——

6.1 florida

尽管两人不肯表示前序组装具体在哪里进行,只说是「在一个优惠国家(favored nation)」。

结合现实情况,手机大概率是印度或者马来西亚工厂初装,以部件总成的形态运到美国总装。

7 iphone in india

▲ 图|The New York Times

只不过都快发售了,Trump Mobile 高管对于手机的价格依然讳莫如深。

采访中,两人仅表示之前付费预定的「早鸟用户」依然享受 499 美元的总价,后续正式发售的价格则「不超过 1000 美元」。

但 500 到 999 美元(约 3500~7000 人民币)依然是个巨大的跨度,好评如潮的 iPhone 17 起价也才 799 美元。

真的会有美国人放着 iPhone 不要去买 Trump Phone T1 吗?

8 iphone 17 price

▲ 图|Apple

在采访的结尾,Trump Mobile 的两位高管表示,Trump Phone T1 目前正在接受 T-Mobile 的合约机认证,三月中旬完成认证后就可以向早期客户发货。

至于具体的开售时间,回答依然是「无可奉告」。

两人能给出的唯一承诺就是在「未来几周内」更新官网信息,公布实机照片和规格表:

9 trump mobile

▲ 图|Trump Mobile

总的来说,Trump Phone T1 作为想要「强行 Made in USA」的乐子货,除了作为懂王上任的第 366 赢之外,也反映了全球手机产业链的极化趋势——

「美国造」、「成本可控」和「能出货」就是一个不可能三角。

纯美国造的 Liberty Phone 能出货,用六年前的参数卖出三折叠的价格:

 

10 liberty phone

▲ 图|Purism

而既要价格不超过 1000 美元、还想能出货的 Trump Phone T1,就只能尝试重新定义美国造了。

11 made in not china

▲ 使用美国 AI 生成,图片仅供参考

2026-02-13 23:17:39

二十年前,周星驰在《功夫》里用一个满脸淤青的阿星告诉我们:真正的绝世高手,往往藏在市井之间,只待任督二脉被打通的那一刻。

二十年后,这位万中无一的武学奇才再次出现了。不过,它不是人。

就在刚才,智元机器人在视频号上甩出了一段名为「绝世高手,马上下山」的视频。官方还特意标注了全程实景实拍,没用 CG 特效,也不是 AI 创作。

1 2

视频画面开头,名为智元远征 A3 的人形机器人在练功房里来了个干脆利落的凌空飞踹,不仅踢碎了玻璃,踢开了马年的新春大门,估计也踢醒了不少人对国产机器人「腿脚不利索」的刻板印象。

2 4

视频里的 A3 起手就是升龙拳,紧接着连续飞踢,空中漫步,甚至还有个极高难度的「摸地旋风」。

做过机器人的都知道,让人形机器人走稳已经是工程学上的一大难题。作为电驱全尺寸人形机器人,远征 A3 能做出如此高动态、高爆发且连贯的动作,说明它的运动控制算法和瞬时功率输出已经上了个新台阶。

3 3

更重要的是,这种武打演员级的表现力也解决了一个长期困扰行业的痛点:机器人的动作「僵硬感」。

124 1

▲网友的评论

A3 这套连招打下来,全身协调性一目了然,官方说,这得益于它的全自由度柔性腰部,1:1 还原了人体腰部的活动范围。

4 2

再加上轻量化的腿部外骨骼结构,这台机器人的 TCP 末端速度最高能达到 2m/s。说人话就是:它挥拳的速度,可能比你反应的速度还快。

5 2

当然,也稍微有点遗憾,这次视频里并没有看到灵巧手的具体演示。

而如果远征 A3 光会耍帅,那它充其量也只是一个昂贵的大号玩具。这就不得不提这次最大的实用升级:续航。几个月前,他们的前代产品远征 A2 还在走「苦行僧」路线——顶着高温暴走 100 公里,但一次续航实则只有 2 小时左右。

而远征 A3 采用了一种嵌入式躯干双电池系统,不仅看着更瘦更紧凑,综合满电续航也直接拉到了最高 8 小时。

8 小时是什么概念?

6 2

人类标准工作制也就 8 小时,这意味着远征 A3 第一次拥有了完整覆盖一个人类班次的能力。配合快速换电技术,它理论上可以实现 24 小时连轴转——真正意义上的「007」牛马,而且计划在 2026 年内量产。

除了身体素质的进化,远征 A3 在情商方面也点满了技能点。

A3 搭载了端到端大模型,最大的变化是「去唤醒词」。你不用再尴尬地喊口令,它能根据环境语境直接搭话,甚至支持拍拍肩膀唤醒。

7 1

基于这些能力,智元把 A3 定位在导览、商演这些场景,这其实是个精准的降维打击。试想一下,商场里有个能给你打一套咏春、还能顺手帮你拎 3kg 重物的机器人,这吸睛能力不比真人发传单强多了?

视频的最后,师父准许远征 A3「下山」。这不仅是一个电影彩蛋,也是一个行业隐喻。当越来越多的人形机器人开始追求超人的运动能力、长时间的续航以及更自然的交互,机器人也将有望真正挤进人类商业社会。

125 1

当然,从「能下山」到「走遍天下」,还有很长的路要走。成本控制、场景适配、安全规范、用户接受度,每一个环节都是考验。

马年将至,各种人形机器人也陆续下山,谁能成为真正的「绝世高手」,我们很快就会看到。



https://feedx.site

2020-02-26 15:10:37

http://www.qdaily.com/articles/65059.html

2020-02-26 15:12:51

http://www.qdaily.com/articles/65064.html

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram