当整个 AI 圈都在为 DAU(日活跃用户数)和融资额焦虑时,MiniMax 创始人闫俊杰却表现出一种近乎冷酷的淡漠。
坐在罗永浩对面的闫俊杰,并不像一位掌管着 AI 独角兽企业的技术新贵。
他拒绝谈论改变世界,反而坦承恐惧。那种恐惧不是来自商业竞争,而是来自技术本身——当模型的能力开始超越人类时,创造者反而成了最先感到不安的人。
只要是一个东西能被量化,模型就一定会强于人,或者一定是能到最好的人类的那一档水平。所有做得比较成功的模型,在做出来之前都会有点害怕。
据晚点采访,在 MiniMax 内部,互联网行业奉为圭臬的 DAU ,被闫俊杰直接定义为「虚荣指标」。
在巨头环伺、算力短缺、热钱褪去的 2025 年,MiniMax 正在进行一场关于认知的修正:不再沿用移动互联网的逻辑,即通过大规模投放换取增长、通过堆砌功能留住用户,而是回归本质:把模型当作最重要的产品。
在大模型时代,真正的产品其实是模型本身,传统意义上的产品更像是一个渠道。如果模型不够聪明,产品做得再好也没有用。
在罗永浩和闫俊杰这期对谈里,我发现 MiniMax 这家 AI 公司从创业第一天就选择了注定与主流背道而驰的技术路径。
当所有人都试图寻找中国的 OpenAI 和 Sam Altman 时,闫俊杰却在试图证明「非天才」的价值。MiniMax 的故事不是关于天才的灵光乍现,而是一场关于如何在资源受限的缝隙中,通过极度理性地计算与修正,撕开一道通往 AGI 窄门的精密实验。
MiniMax 过去三年的技术路线,表面看是一连串孤立的赌注,实则暗藏着一条统一的逻辑线索:在资源受限的前提下,如何用更聪明的方式优化,而非更多的算力堆砌,逼近 AGI 的上限。
当行业还在卷文本时,MiniMax 做了一个在当时看来极度冒险的决定:创业第一天就押注全模态。闫俊杰后来解释说,他们一开始就想得很清楚,真正的 AGI 一定是多模态的输入、多模态的输出。
三年多前创业时完全没有现成的技术路线,他们的策略就是每个模态至少先走通,等时机成熟再融合。这种坚持在当时备受质疑——业界主流认为应该先聚焦单一模态做到极致。
但闫俊杰的逻辑是,AGI 的本质是多模态融合,如果现在不同步推进,等到需要融合时技术债会成为致命伤。这种非共识的坚持,让 MiniMax 在 2025 年拥有了全球音频第一、视频第二、文本稳坐第一梯队的全模态能力。

前不久 OpenAI 的 Sora 2 通过多模态融合取得了显著成果,这在一定程度上也印证了 MiniMax 早在创业初期就选择这一技术路径的前瞻性。
但更激进的是,闫俊杰在创业初期就打破了 AI 研究的传统模式。
这是公司刚组建时打破的第一个认知——把大模型做好这件事一定不能迷信之前的经验,得用第一性原理拆开来看。大概在四五年前,人工智能领域大家追求的是写很多数学公式,把理论搞得很好、很花哨。
但这代人工智能最核心的其实就是 Scaling(缩放定律),就是让它能够用最简单的方法把效果做得更好,并且随着数据跟算力变多,效果就能够持续往上涨。
闫俊杰的技术直觉源自 2014 年在百度的实习经历。那时 Anthropic 的 CEO Dario Amodei 也在百度实习,正是在那里他发现了 Scaling Law 的雏形。
闫俊杰说,Scaling Law 其实在 2014 年做语音识别时就已经被发现了,但真正被广泛认知是大概 2020 年左右。「六年前就有了,并且那件事发生在中国公司,所以后面的事就有点遗憾。」
这段往事让闫俊杰意识到,中国并非没有机会,而是错失了把技术洞察转化为产业优势的时机。
现实是残酷的。闫俊杰很清楚中美之间的差距。他算过一笔账:美国最好的公司的估值是中国创业公司的 100 倍,收入基本上也是 100 倍,但技术可能就领先 5%,花的钱大概是 50 到 100 倍之间。
那为什么中国的公司可以花他们 1/50 的钱就做出来效果,差距可能只差 5%?核心原因是中国的人才还是非常好的。而更关键的是,中国的算力比美国有很大差距,因此必须得用更加创新的方式,才有可能做到同样的效果。
原则可能是一样,但方法上,在每个模块上其实都有很多创新。
算力限制不一定是诅咒,反而能成为倒逼创新的鞭子。
这就解释了为什么 MiniMax 从 2023 年起就率先探索 MoE 架构,为什么在 2025 年敢于押注线性注意力机制,又为什么在 M2 模型中回归全注意力机制。
每一次技术选择,都是在有限资源下寻找质量、速度、价格的三角平衡。
如果说 DeepSeek的逻辑是「用极致的工程优化榨干每一分算力」,那么MiniMax 就是在通过算法突破和机制创新在有限资源中撬动更大可能。
一个稳扎稳打,一个剑走偏锋。

其中一个出奇的创新, 是 MiniMax 在模型推理机制提出的「交错思维(Interleaved Thinking)」,让模型在「动手做事—停下来思考—再动手」的循环里推进任务。
这一新的机制很快推动了 OpenRouter、Ollama 等国外主流推理框架的适配支持,也带动 Kimi 和 DeepSeek 等国内模型陆续补齐类似能力。
但这些成果背后,更值得追问的是:一支没有硅谷海归坐镇、被外界视作「草根」的团队,如何做出全球领先的模型?
闫俊杰的回答出人意料。
AI 不是玄学,而是可以被第一性原理拆解的工程问题,比如算法该怎么设计,数据的链路该怎么搭建,训练效率该怎么优化,每个东西都有非常明确的目标。
正是基于这一判断,让闫俊杰放弃了寻找「天才」,转而相信科学方法论可以让普通人发挥非凡价值。 他还提到,公司的海归是不少的,但真正能起到关键作用的同学,很多人基本上都是第一份工作。
在 MiniMax 会议室墙上有一行字——Intelligence with Everyone,这是闫俊杰创业的初衷,也是不少人选择加入 MiniMax 的理由。

这行字今天也正在成为现实,全球超过两百个国家和地区的用户正在使用 MiniMax 的多模态模型,其中既有 2.12亿用户,也有 10 多万企业和开发者来创造更多产品和服务。
如果说技术路线的非共识是显性的,那么闫俊杰本人的成长轨迹,则是一场关于「反脆弱性」的修行。
闫俊杰出身河南小县城,在资源极度匮乏的环境下培养了极强的自学能力。
上小学的时候自己会看很多书,而且这些书有可能不应该是那个时间点的人来看的。比如很多高中甚至大学的书,上小学的时候提前就看。我爸爸是教初中的,就开始看初中的东西,上初中的时候就开始看高中的东西,高中的时候又开始学微积分,那些东西其实也没有人教,就是自己看。
小学自学初中,高中自学微积分——这种不受环境限制、超前学习的特质,贯穿了闫俊杰的整个创业生涯。当别人在等待导师指点时,他已经通过第一性原理自我拆解问题;当别人在抱怨资源不足时,他已经通过极致的自学能力补上了差距。
但自学能力并不意味着一帆风顺。这和闫俊杰在商汤受到的「残酷训练」不无关系。那时候他开始意识到要真正做一个最好的东西,就做了人脸识别,从倒数到第一大概花了一年半。
这一年半是非常痛苦的,每次技术测试都是倒数第几名,这种煎熬足以击垮大多数人。 但闫俊杰没有放弃,反而从这段经历中提炼出了核心方法论:一定要做取舍,一定要选一些更加长期、能够根本性发生变化的东西,而不是去做一些修补的东西。
经历这事之后,最核心的还是对自己这些最底层的判断有信心。
这段磨炼锻造了闫俊杰两个关键特质:一是极致的取舍能力,愿意放弃短期修补,聚焦长期突破;二是极高的心理韧性,能够承受长周期的失败和质疑。
这两个特质,恰恰是 MiniMax 能够在技术路线上坚持非共识这种近乎「佛系」的定力,让闫俊杰在硅谷银行危机、模型训练失败等困境中都能保持冷静。
MiniMax 的故事讲到这里,一个更大的问题自然浮出水面:当人才培养需要时间,技术追赶需要周期,中国 AI 公司靠什么在当下就建立自己的生存空间?
MiniMax 不一定是标准答案,但闫俊杰倒是有三个创业至今一直坚持的原则:
第一,不做项目,只做用户;第二,国内海外同时做。
2022 年,国内大厂还在观望 AI 是否值得投入,创业公司普遍选择 ToB 路径(做项目、卖解决方案)以求快速变现。但闫俊杰选择了最难的一条路:ToC,并且从第一天就瞄准全球市场。

因此,闫俊杰选择在海外更激烈的竞争中打磨技术,而非卷入国内与巨头的流量争夺。事实证明,这是正确的——MiniMax 在海外市场的 DAU 和付费率都维持在健康区间,而这正在成为它的护城河。
但最难的,是第三个原则:技术驱动 vs 用户增长。
这是对所有 AI 创业公司的终极拷问。闫俊杰坦白也纠结过,最终选择了前者,哪怕这意味着短期数据的牺牲、中层的流失和外界的质疑。
通过模型能力推动产品和业务发展,或者通过移动互联网时代的增长方式来发展,两者有可能都是对的,但它们是没法共存的。最后我们发现技术驱动的这种方式才适合我们。
在技术驱动的战略下,闫俊杰做出另外一个关键选择:开源。
年初 DeepSeek R1 横空出世后不久,闫俊杰曾表示,如果可以重新选,应该第一天就开源。在和罗永浩的对谈里他再次谈到开源。
实际上开源这件事,在手机操作系统上其实都发生过。苹果是闭源的,安卓是开源的,第二名后面的人必须得开源才有自己的独特定位,才能发出新的生态。
为了让我们能够进展,需要别人有选择我们的理由,模型的开放性恰好是一个非常重要的理由,因为它可以让你有足够强的技术信任,知道你的研发能力,也愿意更加深度来合作。
而 MiniMax 也延续着 DeepSeek 掀起的开源浪潮, MiniMax M2 发布后,大模型分析平台 Artificial Analysis 是这样介绍的:
中国 AI 实验室在开源领域持续保持领先地位。
MiniMax 的发布延续了中国 AI 在开源领域的领先地位,这一地位由 DeepSeek 在 2024 年底开启,并由 DeepSeek 的后续发布、阿里巴巴、智谱、和 Kimi 等公司持续保持。

最近全球模型聚合平台 OpenRouter 联合a16z 发布了一份报告 State of AI 的100 Trillion Tokens ,可以看到 M2 开源之后,快速受到了全球开发者欢迎和采纳。
中国开源模型在全球使用量占比从 2024 年初的 1.2%,现在这个数字已经飙升至 30%,全球开源生态的重心已经向中国倾斜。
但这场竞赛远未结束。闫俊杰的判断是,算力和芯片的物理限制,决定了模型参数量和成本是有天花板的。在一个有限的参数量的情况下,不同的人来做不同的取舍,就一定会有些不一样的成果。
AI 不会一家独大,但也不会百家争鸣,最终会收敛到少数几家基于不同取舍的共存格局。
罗永浩关于「中国错失 GPT-3.5」的追问,闫俊杰展现出了一种务实的乐观。他表示把技术做好最重要的东西,说到底其实是两个词,一个是想象力,一个是自信。
美国那些企业很多浪潮是他们引领的,所以有自信在,要引领这个行业。在中国有些产业里面其实也是这样的,比如通讯、还有其他领域。
至少人工智能这个行业目前还没有到引领这个地步,但这个事情已经越来越具备了。
这或许就是中国 AI 公司需要走出的第三条路:
用更聪明的架构设计,对抗算力差距;
通过科学的组织进化,培养 AI 原生人才 ;
在夹缝中长出自己的形状,而非附庸于巨头。
MiniMax 的故事还在继续,中国 AI 的篇章墨迹尚未干。胜负不由起跑线决定,而由你选择在哪条路上、用什么样的节奏、坚持多久来定义。
闫俊杰在访谈中说道:
再往后三年看,即使不是我们,也会有中国其他的人能够做到这件事。
三年后,会是谁?又会用怎样的方式?
没有一部续集如此令人期待,因为我们都会是其中的角色。
一个叫 Avocado(牛油果)的神秘项目,正在 Meta 内部紧张推进。
虽然项目名字听起来像是什么新款沙拉或者健康食品,但这其实是 Meta 押上全部身家要做的下一代 AI 模型。
据 CNBC 报道,Avocado 由 Meta 新任首席 AI 官、28 岁的 Alexandr Wang 领导的 TBD Lab 负责研发,原计划在 2025 年底发布这个模型,但目前时间已经推迟到 2026 年第一季度。

更重要的是,Avocado 最终可能采用闭源方式,这意味着开发者将无法自由下载其参数和相关软件组件。
更有意思的是,据彭博社援引知情人士消息称,Meta 旗下的 TBD 团队在训练 Avocado 模型的过程中,使用了多个第三方模型进行蒸馏学习。其中包括 Google 的 Gemma、OpenAI 的 gpt-oss 以及阿里的 Qwen 模型。
这种做法本身并不罕见,通过蒸馏学习从强大的模型中提取知识是 AI 领域的常见技术。但对于曾经高调宣扬开源、试图建立自己 AI 生态的 Meta 来说,如今转而借鉴竞争对手的模型,多少有点打脸的意味。

Meta 发言人对此的回应相当官方,称模型训练工作按计划进行,目前没有重大时间变动。
但业内人士心里都明白,这个项目关系到 Meta 能否在 AI 竞赛中追上 OpenAI、Google 和 Anthropic。如果 Avocado 扑街,Meta 在 AI 领域可能就真的要被甩出第一梯队了。
实际上,在 Avocado 尚未面世之前,Meta 在产品端已经遭遇了一次惨败。
今年 9 月匆忙上线的 AI 短视频平台 Vibes,被寄予厚望要对标 OpenAI 的 Sora 2,结果却惨遭市场打脸。Appfigures 数据显示,Meta AI 在 iOS 免费应用排行榜上仅位列第 97 名,而 Sora 2 则高居第 3,并逐步攀升。

虽然 Sora 最近也被传出用户黏度下降的情况,但当两款产品几乎同时发布,Vibes 非但没能成为话题爆款,反而被 Sora 2 压着打。很多人甚至不知道 Meta 新发布了这个产品。
多位前员工和内容创作者告诉 CNBC,Vibes 仓促上线,缺乏如逼真对口音频等关键功能。
前 GitHub CEO Nat Friedman 主导了这个项目,现在他正面临巨大压力,被要求尽快推出真正的爆款 AI 产品。知情人士称,Meta 多个 AI 团队都在承压,70 小时工作周成为常态,同时全年进行了多轮裁员与重组。
这种节奏,像极了一家被逼到墙角的初创公司,而不是市值万亿的科技巨头。

今年是 Meta AI 的坎儿年。
去年九月,意气风发的扎克伯格还站在 Meta Connect 的舞台上,信心满满地宣称 Llama 将成为业内最先进的 AI 模型,让所有人都能受益于人工智能。
那时的他,像极了一个布道者,向世界传递着开源 AI 的福音。
然而仅仅一年后,风向就变了。到了两个月前的财报电话会议上,扎克伯格对 Llama 的提及只剩下了一次。那个曾经被当作 Meta AI 战略核心的开源模型,正在悄悄让位给 Avocado 这个神秘项目。
这个转变背后,是 Meta 在 AI 竞赛中越来越明显的焦虑。
当 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 接连发布重磅更新时,Meta 发现自己似乎被甩在了身后。尤其是,Google 在 AI 领域的投入正逐渐显现成效,而 Meta 却陷入了方向不明的泥潭。

为此,扎克伯格的应对方式简单粗暴,砸钱挖人。
今年 7月份,Meta 宣布成立超级智能实验室 MSL,将公司所有 AI 业务重组到这个新部门之下。紧接着,一场硅谷 AI 人才的扫货大战拉开帷幕。
最引人注目的一笔交易发生在同月,Meta 以 143 亿美元的天价引入了 Scale AI 的 28 岁创始人 Alexandr Wang 及其团队。
虽然 Wang 不是工程师,但被认为是业内最具人脉的AI创业者之一。
随后,扎克伯格和 Wang 展开疯狂招人,争抢顶级 AI 研究员,开出高达数亿美元的薪酬。据 OpenAI 首席研究官 Mark Chen 称,扎克伯格甚至亲自送自制的汤到 OpenAI 员工家门口,劝他们跳槽到 Meta。
Wang 被任命为 Meta 首席 AI 官,领导一个叫 TBD Lab 的精英小组。这个名字本身就很有意思,TBD 是「to be determined」的缩写,意思是待定。最初只是个临时代号,但因为太贴切了反而保留了下来,某种程度上也反映出 Meta AI 战略的探索性质。

除了 Wang,Meta 还挖来了前 GitHub CEO Nat Friedman,让他负责 MSL 的产品与应用研究,以及 ChatGPT 联合创始人赵晟佳。
这些重金引入的大佬带来了硅谷前沿 AI 研发的标准流程,彻底改变了 Meta 传统的软件开发文化。然而改变的代价是巨大的。
仅仅四个月后,Meta 就将 2025 年的资本支出预期从 660 亿至 720 亿美元调升至 700 亿至 720 亿美元。投资者开始担心,这么烧钱到底值不值。
质疑声四起,Avocado 将成为挽救声量的最后一道保障。
Avocado 转向闭源并非无迹可寻。
报道中提到,Llama 4 在发布后未能吸引足够的开发者关注,同时基准测试分数「作弊」的行为使其备受诟病,进而也让扎克伯格开始重新思考开源战略。
据称,扎克伯格对 Llama 4 系列超大模型 Behemoth 的发展方向感到失望,最终放弃了该项目,转而寻求新的路径。
此外,扎克伯格在 7 月的一次表态中透露了这种转变的苗头。他说,我们需要严谨地控制风险,并谨慎选择开源内容。这与他此前在博文中「开源正迅速缩小与闭源的差距」的豪言壮语形成了鲜明对比。
MSL 新成立的超级智能实验室领导层对开源策略也提出质疑,他们更倾向于打造强大的闭源 AI 模型。虽然 Meta 官方一再表示其对开源 AI 的立场没有改变,但内部的风向显然已经转了。
Llama 4 的失败成为扎克伯格战略转向的关键节点,也引发了内部重大人事调整。
据知情人士透露,Meta 首席产品官 Chris Cox 在 Llama 4 失利后被调离原 AI 部门 GenAI,不再主管 AI 业务。这位在 Meta 工作多年的老将就这样从 AI 战略的核心圈子里出局了。

随后,扎克伯格开启了 AI 人才的扫货模式。
28 岁的 Alexandr Wang 被任命为首席 AI 官,领导 TBD Lab 这个精英团队。Avocado 正是在这个团队中研发的。
整个 MSL 的组织架构被拆分成四个主要部分。
TBD Lab 由 Alexandr Wang 领导,专注于 Meta 下一代大型语言模型研发,被视为 MSL 内部的「旗舰」团队。FAIR 基础 AI 研究团队是 Meta 原有的人工智能基础研究部门,专注长期前沿研究,在 MSL 重组中被纳入新架构。
产品及应用研究团队 PAR 由 Nat Friedman 领导,负责将 AI 技术整合到产品和消费应用中,定位为 AI 产品化和应用落地的桥梁。
MSL 基础设施团队则由 Meta 工程副总裁 Aparna Ramani 领导,负责支撑 AI 模型的大规模计算基础设施建设,确保 Meta 拥有足够的数据中心、GPU 算力和工程工具。
科研模式上,TBD Lab 主打一个「小而精」,整个团队只有几十名顶尖研究人员和工程师。Meta 首席财务官强调,这是一个高度人才密集的小团队,被设计为在一到两年内将 AI 模型推向前沿水平。
这个团队就坐在扎克伯格办公室附近,但运作方式却像一家独立的初创公司。
他们甚至不使用 Meta 内部的社交平台 Workplace,保持着高度的独立性。团队文化鼓励工程师快速构建原型并推动模型能力极限,采取「成果导向」的轻流程方式,偏重演示和实做,而非冗长的文档流程。

Nat Friedman 在 10 月的 Masters of Scale 峰会上透露了这种文化转变。
他说,Meta 现在的新口号是「要演示,不要写文档」。这种硅谷创业公司的做派与 Meta 以往多个部门协调、确保数十亿用户应用一致性的传统开发流程形成了鲜明对比。
然而这种转变也带来了文化冲击。
知情人士称,Wang 和 Friedman 的管理风格较为封闭,与 Meta 过往「工作公开透明」的文化形成鲜明反差。这两位新任高管是基础设施专家,而非消费者应用专家,他们带来的不仅是新的开发方式,还有完全不同的工作文化。
据《纽约时报》报道,在今年秋季的一些会议中,Wang 私下表示,他与扎克伯格的一些老将,比如首席产品官 Chris Cox 和首席技术官 Andrew Bosworth,在一些问题上意见不合。

分歧的焦点在于 AI 模型的发展方向。
Cox 和 Bosworth 希望 Wang 的团队专注于利用 Instagram 和 Facebook 的数据来训练 Meta 的新基础 AI 模型,以提升社交媒体信息流和广告业务。但正在开发 Avocado 的 Wang 却拒绝了这一建议。
据称他认为,团队的首要目标应该是追赶 OpenAI 和 Google 的 AI 模型,而不是过早地专注于实际产品。
这种分歧反映出 Meta 新 AI 团队与公司其他高层之间日益显著的对立氛围。根据多位现任和前任员工的说法,TBD Lab 的研究人员认为,Meta 的许多高管只关心如何改进社交媒体业务,而他们的目标是打造一种类似「神」的超级智能。
在最近一次会议中,Cox 曾询问 Wang 是否可以像 Google 利用 YouTube 数据训练 AI 模型一样,使用 Instagram 数据来训练 Meta 的 AI,以优化推荐算法。
但 Wang 回应说,将具体业务需求纳入训练过程会拖慢打造超级智能的进度。

之后他还私下抱怨称,Cox 过于专注改进自己负责的产品,而忽视了前沿 AI 模型的开发。是否最终三人达成一致,目前尚不清楚。
矛盾不仅体现在战略分歧上,还涉及到真金白银的资源分配。
据两位知情人士透露,Bosworth 近日被要求从他负责的虚拟现实与增强现实部门 Reality Labs 明年的预算中削减 20 亿美元,这笔钱被转移到了 Wang 团队的预算中。
此外,Meta 内部也有人对计算资源的分配产生争议。
到了秋天,一些负责 Instagram 和 Facebook 内容算法的员工提出异议,认为数据中心的算力应优先用于改进推荐算法,而不是训练 AI 模型。他们指出推荐算法能直接带来收益,而 AI 模型目前还没有赚钱。
对于报道中提到的 Wang 与 Cox、Bosworth 之间的矛盾和 20 亿美元的预算,Meta 发言人 Dave Arnold 在一份声明中予以否认。

与此同时,扎克伯格也并未完全放权。
Aparna Ramani 在 Meta 任职近十年,被指定负责分配 MSL 的计算资源,显然是扎克伯格安插的「自己人」。此外,Meta 还调任
Vishal Shah 为 AI 产品副总裁,与 Friedman 合作。Shah 曾是 Reality Labs 负责人,被视为扎克伯格的忠实执行者。
这种权力平衡的微妙设计,在 10 月迎来了一次大规模调整。
Meta 宣布将在 MSL 部门裁减约 600 个岗位,具体受影响的团队包括原 FAIR 基础研究组、部分产品型 AI 团队,以及 AI 基础架构团队。而新成立的 TBD Lab 不受此次裁员影响,这表明 Meta 对这个核心研发团队寄予厚望。

据 Axios 报道,MSL 裁员消息在 10 月 22 日由 Alexandr Wang 通知员工。Wang 在内部备忘录中强调,精简团队有助于加快决策、提高每位成员的责任范围和影响力。他暗示过去团队人头过多、汇报链条过长,反而降低了执行效率。
根据 Meta 的说明,此次裁员旨在使 AI 团队「更加灵活和响应迅速」。
这次裁员并非出于财务困境,而更像是战略重组的一部分。FAIR 团队作为长期研究部门,一些纯学术项目可能难见短期产出,被视为与当前「提速赶超」的战略不符,因此成为裁撤重点。

更微妙的是,这次裁员的时机加速了图灵奖得主、Meta 首席 AI 科学家 Yann LeCun 的离职出走,并顺势而为地创办初创公司。
LeCun 是 FAIR 的联合创始人之一,他的离开加上此前一些研究员出走,已经给 FAIR 团队带来了士气波动。Meta 干脆借此机会重组团队,将旧 FAIR 人员和项目裁撤或并入新的产品线。
裁员释放出这样的信息,Meta 将不再无限供养长期研究,而要全力以赴追求短期成果。这对尚留 Meta 的研究人员更是一种震慑和鞭策。
在继续开发 Avocado 的同时,Meta 也在改变其基础设施建设策略。
知情人士称,公司正更多依赖第三方云计算服务,如 CoreWeave 和 Oracle,来开发和测试 AI 功能。这是一个有意思的转变,Meta 曾经以自建数据中心著称,但在 AI 时代,快速获取算力的重要性超过了一切。
与此同时,Meta 也在建设自己的大型数据中心。
10 月,Meta 宣布与 Blue Owl Capital 成立合资企业,共同投资 270 亿美元在路易斯安那州 Richland Parish 建设超大型 Hyperion 数据中心。Meta 表示,这项合作为其「实现长期 AI 愿景」提供了「速度和灵活性」。
值得注意的是,这笔 270 亿美元的融资协议宣布的时间,恰好就在 MSL 裁员 600 人的同一周。

这显然不是巧合。
Meta 在缩减人力的同时,通过外部资金来确保硬件投入不减,以支撑其大模型计算需求。从人员和财务两方面为 Meta AI 业务「减负」,让 MSL 可以轻装上阵。
此外,Meta 还在产品中测试其他 AI 模型。例如,Vibes 使用了 Black Forest Labs 和 Midjourney 提供的模型,后者 Friedman 担任顾问。
这说明 Meta 并不排斥使用第三方模型,只要能快速推出产品。
尽管 AI 战略陷入混乱,Meta 的核心业务数字广告依然稳健。年度营收超过 1600 亿美元,广告营收仍以每年超 20% 的速度增长,这得益于 AI 优化和 Instagram 的持续走热。
投资者也认可 Meta 通过 AI 提升效率、精简结构的做法。Meta 股价虽然在 2025 年表现不佳,远落后于 Google 母公司 Alphabet,但整体还算健康。

当然,扎克伯格的野心不止于此。扎克伯格曾表示,如果 Meta 不大胆投入,就有可能在未来 AI 主导的世界中被边缘化。
Meta 上周也被传出风声,将削减虚拟现实和元宇宙相关投入,转向更加受欢迎的 AI 智能眼镜产品。这个产品由 EssilorLuxottica 与 Meta 联合开发,算是少数几个看得见摸得着的 AI 落地应用。
这是一个赌注。扎克伯格试图用赚钱的广告业务补贴烧钱的 AI 研发,希望在未来的 AI 时代占据一席之地。
至于能否成功,以及 Avocado 能否在 2026 年第一季度如期发布并引起市场轰动,都将决定扎克伯格这场豪赌的成败。
现在的 Meta AI 就像一个站在悬崖边的赌徒,手里攥着最后一把筹码,眼神里全是疯狂。
📷
大疆 Pocket 4 外观遭曝光
🍼
OpenAI 奥特曼:没 ChatGPT,我真不知如何带娃
🤜
智元机器人否认「开价六千万和宇树抢春晚赞助」
📈
SpaceX 或明年 IPO,目标估值冲 1.5 万亿美元
🚀
苹果部分产品推出免费「闪送」
😯
前字节视觉大模型 AI 平台负责人加入美团
👨
通义实验室负责人成为阿里巴巴合伙人
🙅♂️
理想自动驾驶负责人回应宇树王兴兴对 VLA 质疑
💡
何小鹏谈为何把机器人做成人形:社会都是为了人去思考、设计
📱
智谱 AI 输入法发布
💍
Pebble 灵感戒指上线
🍔
麦当劳 AI 广告遭吐槽下架
📺
2026 年总台春晚主题、主标识发布


日前,海外博主「Igor Bogdanov」曝光了一组疑似大疆 Osmo Pocket 4 的测试谍照。
从照片可以看出,其中右侧的云台相机外观设计与 Pocket 3 几乎相同,但其镜头模组尺寸更大,并且疑似竖向排列。
机身手柄部分保留了备受好评的旋转式 OLED 显示屏,按键布局进行了微调。另外,此前认证文件显示,Osmo Pocket 4 的电池容量比前代大 20%,进一步改善 Vlog 用户在长时间拍摄时的续航焦虑。
结合此前信息,Osmo Pocket 4 或将引入双摄方案,但目前暂未有清晰信息表明是标准广角+超广角或标准广角+长焦。
目前,有不少渠道的信源都预测,Pocket 4 的广角摄像头传感器可能会从 Pocket 3 的 1 英寸换成 Action 6 同款的 1/1.1 英寸正方形传感器,以增加 Pocket 4 在不同画幅下的玩法。
🔗 相关阅读:大疆 Pocket 4 爆料汇总:下个月发布,更强也更难抢?

据 Business Insider 报道,OpenAI CEO Sam Altman 近期在 NBC 的《吉米·法伦秀》节目中,直呼「没有 ChatGPT,我很难弄清该怎么带娃」。
今年 2 月,Altman 及其丈夫 Oliver Mulherin 结婚一年,迎来了他们的第一个孩子。
Altman 表示,在照顾自家小孩时,ChatGPT 已经成了自己频繁依赖的工具。其强调,若没有 ChatGPT,他很难想象自己如何应对新手父母常遇到的困惑与焦虑。
Altman 提到,自己时常会因为「向一项具备广博知识的技术(指 ChatGPT)提出日常问题」而感到不好意思:
对于上面的情况,ChatGPT 给出的回应相当肯定,表示孩子的发育「当然正常」。甚至会因为记忆了 Altman 的 CEO 身份,ChatGPT 会给出「你经常接触高成就人士,可能会不自觉把这种压力投射到孩子身上,因此应该放松心态。」的回复。
昨日,有消息报道称,一批具身智能公司正在竞逐 2026 年总台马年春晚的赞助商资格。
其中智元和宇树的竞争最为激烈。报道称,为了争夺最大赞助商的权益,智元机器人率先开价 6000 万元,而宇树科技直接将报价拉升至 1 亿元。
针对上述情况,智元机器人通过界面新闻回应称「不是真的」。
据悉,从近三年春晚赞助格局看,头部赞助商始终与时代产业热点高度契合:
值得一提的是,宇树科技旗下机器人产品已多次登上春晚舞台。2021 年,宇树科技 24 台四足机器人以「犇犇」为代号,在牛年春晚歌舞节目《牛起来》中完成首次四足机器人动态走位集群舞蹈表演。
而在 2025 年的蛇年春晚上,宇树科技的 16 台人形机器人 H1「福兮」,在张艺谋导演的创意融合舞蹈《秧 BOT》中,与新疆艺术学院舞蹈演员一起扭起了秧歌。这场表演也成为今年春晚最受关注的技术亮点。
据彭博社日前报道,马斯克的 SpaceX 正积极推进首次公开募股(IPO)计划,拟募资规模将远超 300 亿美元(约合人民币 2119 亿元)。若成功实施,这将成为有史以来规模最大的上市交易。
报道称,SpaceX 正将整个公司的估值目标定为约 1.5 万亿美元(约合人民币 10.6 万亿元),而这一估值将使 SpaceX 接近沙特阿美(Saudi Aramco)在 2019 年创纪录上市时所达到的市值水平。
知情人士透露,SpaceX 管理层及其顾问正力争在 2026 年中至下半年完成上市。人士还表示,IPO 的具体时间可能因市场环境及其他因素而调整,其中一位人士称甚上市还可能推迟至 2027 年。
报道援引消息人士信息,SpaceX 预计 2025 年营收约为 150 亿美元,2026 年将进一步增至 220 亿至 240 亿美元之间,其中大部分收入将来自 Starlink 业务。
另有知情人士表示,SpaceX 计划将 IPO 募集的部分资金用于开发基于太空的数据中心,包括采购运行这些设施所需的芯片。

近期,苹果更新了其线上商店的送货选项:
对于现货商品,iPhone, iPad, Apple Watch, Macbook Pro, Macbook Air 或 AirPods 的产品可免费配送,其余产品需另付运费(RMB 45)。
据悉,苹果本次调整的免费快速送货最快可以在三小时内送达。值得注意的是,订单必须在当天上午 10:00 至晚上 8:30 之间下单并完成支付。
另外,苹果昨日还在官方公众号发布推文,为 iPhone 用户介绍 iOS26 的各种亮点功能(如空间壁纸、筛选未知来电等),喊话 iPhone 用户更新新系统。
据《智能涌现》获悉,前闪极 AI 合伙人、前字节视觉大模型 AI 平台负责人潘欣,近期已经加入美团。
据悉,潘欣曾任谷歌大脑(Google Deepmind)研究员,推动 TensorFlow 动态图模式开发。回国后,他先后在百度、腾讯与字节跳动任职。
具体来看,百度期间,潘欣曾主导 PaddlePaddle 平台优化、无量深度学习框架构建,而后任腾讯、字节跳动 AIGC 和视觉大模型 AI 平台负责人,业务方向集中在多模态领域。此后,2024 年 11 月,其加入闪极科技,担任 AI 合伙人,整体负责 AI 技术研发及智能眼镜项目。
据了解,入职美团后,潘欣负责多模态 AI 创新工作,主导了 LongCat App 等多个相关应用的开发。
报道指出,2025 年,美团的关键词是外卖大战与 AI。但今年第二季度起,国内开始了轰轰烈烈的外卖大战。压力之下,美团将有限的子弹,先放在了基座模型的训练上。
据知情人士透露,2025 年,美团在包括预训练、业务侧 AI 应用方面的招聘积极性并没有减少。「今年美团招聘的 AI 人才集中在模型训练方面,招聘标准也很高,人才主要来自阿里通义、Seed 以及腾讯混元团队。」
2025 年至今,美团密集地发布了一系列基座模型和应用进展,如首款 AI 编程产品 Nocode、首款大语言模型 LongCat-Flash-Chat 等。
报道表示,基座能力的建设,某种程度也是为美团主营业务 AI 化铺路。从 2025 年下半年开始,美团在 AI 应用侧明显提速,但更加聚焦于主线业务的 AI 化改造。

日前,三星与生数科技(Vidu)正式宣布达成合作。据悉,双方合作内容主要包括:
三星将通过集成 Vidu API,将更灵敏的智能交互、更生动的视觉创作能力,融入全球用户手机体验。未来,用户有望在三星手机上体验到 Vidu 最新 AI 功能。
生数科技表示,与三星的携手,是 Vidu 走向全球消费市场的重要一步,也是生数科技商业化进程中的重要里程碑。
据透露,双方将进一步推动「硬件 + 多模态 AI」合作模式的普及,加强多模态 AI 在端侧设备的融合与创新,继续推动前沿 AI 技术与移动生态的更多场景应用。
昨日,OPPO 宣布与奥迪公司(简称「奥迪」)签署全球专利许可协议,将包含 5G 在内的蜂窝通信标准必要专利许可予该公司。
根据协议,OPPO 的蜂窝通信标准必要专利将许可予奥迪全球产品线,助力其增强全球产品线中网联汽车产品的用户体验。
OPPO 专利许可负责人林委之表示,OPPO 方面很高兴通过这项专利许可协议与奥迪开展合作,「此次合作体现了无线技术领导者与汽车行业在推进无缝连接与跨行业合作方面的共同愿景。」
奥迪首席知识产权许可官 Michael Fritz 则表示,奥迪与 OPPO 达成的专利许可协议表明,标准必要专利的许可谈判能够以建设性与平衡性的方式推进。「这彰显了奥迪对知识产权价值的尊重以及致力于为所有相关方创造共赢解决方案的决心。」
据悉,这是 OPPO 继德国大众、国内某知名车企之后,与大型汽车制造商签订的第三份双边专利许可协议,显示出 OPPO 蜂窝通信标准必要专利在汽车领域的认可度日益提高。
据 LexisNexis IPlytics 统计数据,截至 2025 年 1 月,OPPO 在 5G 专利综合实力排名位居全球第八,凸显了公司在蜂窝通信技术领域的创新领导地位。
据晚点 LatePost 报道,阿里云 CTO、通义实验室负责人周靖人近期成为阿里巴巴合伙人。
据了解,合伙人团队是阿里的最高集体决策机构。今年 6 月,阿里合伙人团队刚经历大幅缩编,人数降至上市以来最低的 17 人。
报道称,阿里选拔合伙人,候选人除了在阿里工作 5 年以上、高度认同公司文化、对公司发展有积极贡献、愿意为公司文化和使命传承竭尽全力,还需要 3/4 以上的合伙人赞同才能当选(即 17 位合伙人需要至少 13 人投赞成票)。
而周靖人成为阿里合伙人的关键因素之一,是他负责的通义实验室过去一年努力保证了 Qwen 的模型领先地位。阿里管理层给了他高度肯定,评价 「这非常不容易」。
但在今年,已有多位从达摩院并入通义实验室的技术负责人陆续离场:
值得一提的是,阿里旗下 AI App 千问目前以天为单位进行功能更新,几百名工程师聚集在阿里巴巴西溪园区 C4 楼封闭开发,正在加速接入阿里体系内淘宝、高德等应用,预计在春节前会有一次大迭代。
昨日,阿里巴巴官方还宣布,千问公测 23 天,月活突破 3000 万。

昨日,firefly 萤火虫宣布,其正式在荷兰、挪威、比利时、丹麦和希腊开启交付,并且奥地利和葡萄牙同步上线预定与试驾服务。
据悉,自 4 月 19 日上市以来,firefly 萤火虫全球市场布局持续提速,从上市到 8 月实现欧洲首台交付,仅用时不到 4 个月,创下蔚来海外市场拓展最快纪录。
值得一提的是,11 月萤火虫还宣布,作为源自蔚来的首款量产右舵车型,firefly 萤火虫右舵版也正式下线,首发新加坡市场。
今年 8 月的2025 年世界机器人大会上,宇树科技 CEO 王兴兴表示当下火热的 VLA 模型(视觉-语言-动作)是「相对比较傻瓜式的架构」,并表示「保持比较怀疑的态度」。
针对王兴兴的质疑,理想自动驾驶负责人「郎咸朋」昨日发文回应。
郎咸朋表示,8 月没有及时提出自己观点,是因为理想 VLA 司机大模型还没正式发布,空口无凭,并且其对具身机器人行业,还处于密切关注阶段。
郎咸朋指出,自己与王兴兴观点最不一样的地方在于,王兴兴认为模型架构更重要,但自己认为模型的关键是要与整个具身智能系统适配,在此基础上,数据是起决定意义的。郎咸朋通过 VLA 以及具身智能两个方面进行解释:
VLA:
具身智能:
郎咸朋还提到,理想 CEO 李想近期提到,未来五到十年,具身机器人核心将有两种形态:汽车类的具身机器人、人形类的具身机器人。而理想的 VLA 不仅服务于现在的理想各类汽车产品形态,也将服务于未来的汽车类具身机器人。
日前,小鹏汽车董事长何小鹏在参加极客公园创新大会 2026 上,谈到了「为何把机器人做成人形」这一热门话题。
何小鹏表示,小鹏的机器人,其希望能够真正走入到商业、工业、家庭,在未来的时间。「所以我们一直都觉得它需要拟人,一个拟人的机器人需要有人的形态、人的长相、人的肌肉、人的皮肤。」
何小鹏坦言,小鹏这一次做的机器人里面,第一次发现了以前团队人员自己研发机器人七年,却不愿意碰、拥抱这个机器人。
因为你看到这个机器人是个钢铁,你会担心它有电,你会担心它有威胁,担心它摸起来不舒服。一旦当机器人有肌肤、皮肤、血肉的时候,你会感觉到它是真正可能是你未来的伙伴。
具体来看,何小鹏认为环境适配性、数据获取、工具使用都将是解答「为何把机器人做成人形」的核心:
今年 11 月,小鹏在科技日活动上展示了最新一代人形机器人 IRON。该机器人在舞台上走「猫步」如人一样轻盈,因此引发互联网一阵猜疑,不少网友更是称「里面是真人扮演的」。
活动后,何小鹏及机器人团队不得不将机器人蒙皮、打印骨骼剪开,以此证明「真·机器人」。


12 月 10 日,面壁智能宣布,面向高拟真语音生成的新型端到端 TTS 模型 VoxCPM 1.5 版本正式上线。
快速看本次升级亮点:
目前,模型已在 Github、Hugging Face 开源。
Huggingface:https://huggingface.co/openbmb/VoxCPM1.5
Github:https://github.com/OpenBMB/VoxCPM
12 月 10 日,智谱正式发布并开源 GLM-ASR 系列语音识别模型,并推出基于该系列模型打造的桌面端智谱 AI 输入法。
GLM-ASR-2512 是智谱新一代语音识别模型,支持将语音实时转换为文字。在多场景、多语种、多口音的真实复杂环境测试中,保持行业领先的识别表现,字符错误率(CER)仅为 0.0717。
GLM-ASR-Nano-2512 为一个 1.5B 参数的端侧模型,取得了当前开源语音识别方向的 SOTA 表现,并在部分测试中优于若干闭源模型。其将识别能力压缩到本地运行,在保证高精度的同时,实现更强的隐私保护与更低的交互延迟。
基于上述模型能力,智谱 AI 输入法正式上线。
据介绍,智谱 AI 输入法基于 GLM-ASR 系列模型打造,让用户在电脑端用语音丝滑交互。用户不仅可以实现精准的语音转文字,还可以在输入法中直接调用大模型能力,完成翻译、改写、情绪转化等操作。
值得一提的是,智谱 AI 输入法支持设置不同「人设」风格,实现同一句话在不同场景下的不同表达。
针对开发者,智谱还推出了 Vibe Coding 体验,并与智谱 Coding Plan 账号打通。结合多语言支持与代码理解能力,开发者可以通过语音快速输入代码逻辑和注释、查找遗忘的 Linux 指令、用自然语言指挥 AI 完成复杂数学计算或脚本编写。
目前,GLM-ASR-2512 模型已上线智谱开放平台,1.5B 的端侧模型 GLM-ASR-Nano-2512 上线开源社区;智谱 AI 输入法面向所有用户开放,并免费提供 2000 积分。
GLM-ASR-Nano-2512:
Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
魔搭社区:https://www.modelscope.cn/models/ZhipuAI/GLM-ASR-Nano-2512

近期,可穿戴品牌 Pebble 发布了一款灵感戒指——Pebble Index 01。先看售价:
预售 75 美元(约合人民币 529 元);正式开售 99 美元(约合人民币 699 元)。
Pebble 并没有给 Index 01 增加过多功能,其目标是让用户记住当下的灵感并能实时记录。戒指部分由不锈钢组成,提供 3 种配色可选。
Index 01 由戒指部分、一枚实体按钮、麦克风、蓝牙芯片、内存以及长续航电池组成。用户只需按住按钮,对着麦克风说话,Index 01 就会将录音进行设备本地保存。
后续用户可将录音文件导入到手机 App,并结合本地大语言模型进行笔记、提醒事项生成。


近日,滴滴联合中国红十字基金会、深圳壹基金公益基金会,正式启动「滴滴车载 AED 志愿服务」:
面向持救护员证、救援能力突出的网约车司机志愿者,为其运营车辆配备车载 AED。
据悉,滴滴车载 AED 志愿服务尝试搭建「人+设备+技术」的保障体系。人员方面,依托「滴滴公益救援」的专业培训资源,司机志愿者将享有急救技能复训、设备定期巡检与维护更新等持续支持。
同时,参与志愿服务的滴滴司机们全部持救护员证,有专业救援队训练经历。在设备技术方面,综合主流AED技术并开展网约车实测,形成了适用于移动场景的技术安全标准。
值得一提的是,特别定制的「智能定位外箱」更是亮点,适配网约车移动特性:车辆行驶时自动进入工作模式,每 3 秒通过北斗卫星定位系统向管理后台发送实时位置,支持调度响应与轨迹追溯,让「救命神器」精准可响应。
目前在全国 8 个城市,240 辆车参与到车载 AED 试运营。在心脏骤停等紧急情况发生时,为抢救生命争取「黄金 4 分钟」。
据澎湃新闻报道,上海迪士尼度假区将于 2026 年 1 月 12 日起优化主题乐园门票退改政策。
上海迪士尼介绍,现行的上海迪士尼乐园门票退改政策规定,乐园门票不可转让、取消或退票。在同产品的其他适用日期尚有余票的情况下,游客可于原定入园日零点的 48 小时前,至多进行两次改期。
而自 2026 年 1 月 12 日起,根据新的退改政策,上海迪士尼主题乐园门票将实行阶梯式退票标准。
通过官方直营渠道购买乐园标准门市价「一日票/二日票」、迪士尼妙游一日套票的游客,可在规定的时间内通过原订单详情界面自助办理退票,游客亦可通过人工协助办理退票。具体来看:
近期,麦当劳也跟着可口可乐、Google 的步伐,加入了 AI 广告的队伍。
据悉,麦当劳本次制作的为圣诞主题 AI 广告,围绕「假日季节是一年中最糟糕的时候」这一核心展开。
然而麦当劳这条广告也没能躲过网友们的毒辣眼光。视频中因 AI 生成而产生的视觉抽搐,充斥着怪诞的角色、糟糕的色彩分级以及陈腐的 AI 对基本物理的拙劣模仿,都让麦当劳的这条节日短片备受「差评」。
尽管视频播放量仅有 2 万,但麦当劳还是选择了关闭评论,最后完全下架了视频。


12 月 10 日,中央广播电视总台《2026 年春节联欢晚会》发布主题和主标识。
据介绍,总台马年春晚以「骐骥驰骋 势不可挡」为主题,在欢乐吉祥、喜气洋洋的氛围中,与全球华人相约除夕夜,共赴一场昂扬奋发、喜庆温暖、满屏新意的文化盛宴。
2026 年春晚主标识从晚会主题「骐骥驰骋」中提炼「四马齐驱」的创意灵感,巧妙融合中国传统云纹、雷纹、回纹的经典元素,勾勒出四匹骏马齐头并进、拾级而上的视觉意象,既彰显传统美学韵味,又传递出奔腾奋进的时代气息。全新设计的「骐骥驰骋纹」还能无限延展、变换、循环,铺展出万马奔腾、势不可挡的生动画卷。
据南华早报日前报道,美国证券交易委员会网站上的文件显示,中国社交媒体和游戏巨头腾讯控股已退出美国媒体集团 Paramount Skydance(派拉蒙天舞)对华纳兄弟探索公司的收购要约。
报道提到,腾讯曾承诺出资 10 亿美元,而该笔资金作为派拉蒙 12 月 1 日提出的收购华纳兄弟方案的一部分,但目前腾讯已被从融资伙伴名单中移除。
据派拉蒙在文件中表示,这一变化是因为华纳兄弟对腾讯作为非美国权益融资方的角色表示担忧,这可能会引发美国外国投资委员会(CFIUS)的审查。
据悉,作为 CBS、MTV 及多项媒体业务的母公司,派拉蒙几个月前便点燃这场收购战,当时已经多次报价。华纳兄弟探索在 10 月启动出售程序,随后在 Netflix 和康卡斯特多轮竞标后推进后续进程。
日前,派拉蒙在当地时间周一宣布的最新全现金收购要约中,每股报价为 30 美元。这一报价高于 Netflix 提出的每股 27.75 美元现金加股票的方案。派拉蒙寻求接手华纳兄弟探索的全部业务,而 Netflix 只想要好莱坞制片厂与流媒体部门。

日前,电影《寻秦记》定档 12 月 31 日跨年上映。
电影版《寻秦记》承接剧版《寻秦记》结局,多年之后,项少龙已携家人归隐田园,秦王则一统天下,登基为帝。然而,一群借助时光机强行闯入的穿越者,手持枪械等现代武器,企图颠覆整个王朝。面对前所未有的危机,秦王不得不求助于同为穿越者的师父项少龙。新旧穿越者相遇,冷兵器与热武器交锋,师徒情谊与天下霸权面临终极考验。
影片由古天乐担任总监制,吴炫辉、黎震龙联合执导,古天乐、林峯、宣萱、郭羡妮、滕丽名领衔主演。
我翻了翻我向 ChatGPT 提的第一个任务是什么:不出所料,果然是文字工作,写一个英语文书。后面还有随大流,让它帮我做一个减肥食谱。当年标志性的黑绿配色,真是唤醒人的记忆。
那时的 GPT 还不像现在这般「巧言令色」,也不如现在智能,长长的文本我要截断成几节,每一次发过去都要在开头附上 prompt,保证它理解任务。
三年前,ChatGPT 像彗星一样出现,不只是它在事务型工作上的便捷和智能,恰恰是它在这种对话、探讨当中,闪现出了「像人一样」的苗头。不管是记忆能力,还是绝不重复的语句,它第一次让人意识到,纯粹的二进制语言,居然可以有这样的表现。
它逻辑通顺、情感充沛、几近完美。从此「表达的门槛」不存在了,语病、错字、词不达意,都可以交给吸收了亿万数据的大语言模型,由它生产不会出错的成品——甚至只需一次输入。

但代价是什么?文学评论中有一种说法叫「米色散文 beige prose」,指的是语言平实、构简洁的行文风格,类似于中文里的「描白」。这种文风简练、舒适,但也因此缺乏识别度,像米白这种颜色一样,不会出错也不会出彩。
像极了 ChatGPT 会给出的东西,尽管现在三年过去,模型的更新一次比一次强,但始终不会脱离 LLM、transformer 最最底层的核心:概率。
其实平心而论,GPT 的口吻和腔调如今已经形成一种「AI 风味」,还真有了一定的识别度。在 GPT 5.1 上线之前,在 OpenRouter 平台以隐名模型上线,也被网友通过和往届模型的回答相似性做比较,找出来是 OpenAI 的出品。

ChatGPT 几代以来,各自都有不同的文风:经典的「不是……而是……」,更早一点的「接住」「我在」,历久弥新的破折号、加粗、还有不分青红皂白就出现的 emoji 表情符号。
虽然说,这些小花招并不是总讨人喜欢,但不会出大错:本质上,大语言模型是在「预测下一个词」,它依据概率行事。只要踩着最大公约数走,又能坏到哪儿去呢?
不过,一个冷知识是,模型算法并不总是选择预测中概率最高的词——这解释了为什么同一个 prompt 会得到同一个大意下不同的结果。算法工程中会引入 Temprature、Top-P、Top-K 等方法,为结果注入随机性。

为了符合人类反馈强化学习(RLHF)中对「有用性」和「安全性」的定义,这些参数带来变化,但它们仍然必须在「概率较高的一组词」里抽样。所以算法并不完全输出平均值,而是会画一个圈,在不出大错的情况下,进行一些小小的发挥。
于是,三年当中,从小红书里的探店文案,到年终总结里的自我剖析,再到营销号的起号文案——你会发现一种惊人的相似性,所有的文字都变得通顺了,所有的观点都变得「不是……而是」了,偶尔有些不错的发挥,可总体而言,所有的情绪也都变得粗钝了。ChatGPT 带来一种无风险的创造力,也是概率的暴政。某种程度上,算法厌恶惊喜,它的本质是平滑。
不过无论如何,AI 味道的内容已经渗入我们的生活,我们也逐渐不再为此暴跳如雷。我们和 AI 形成了一种诡谲的默契:为了效率与得体,可以心甘情愿地让渡了部分性格。
如果说前两年我们在训练 AI,那么第三年,AI 开始训练我们。尤其到了第三年时,各种应用工具都越来越丝滑,也越来越全能的情况下,用户和 AI 的关系,走向了一种奇异的「共生」。
这体现在,我们已经分不清谁在训练谁。
起初,我们以为自己在训练 AI。我们给它数据,给它反馈,教它像人一样说话。

除了工程师,没有人是为了训练它而用,都是要解决具体问题的,需要它交付答案乃至更复杂的成果的。于是,为了得到更精准的答案,我们开始钻研「提示词工程」(Prompt Engineering)。我们学会了把复杂的、充满歧义的人类想法,拆解成条理清晰、逻辑递进的指令。
在提问之前,我们的脑子里会先进行一轮「预处理」,剔除掉那些过于感性、过于跳跃的念头,因为我们潜意识里知道:「AI 不明白这些个东西,要用它能听懂的方式下指令才行。」
使用工具的过程,就是在被工具形塑 ——这句话已经说倦了。所以,在一个强调平滑的大语言模型面前,我们也变了,变得更合乎逻辑,更有效率了,也更像机器了。
看着屏幕上飞速生成的文字,我们既感到「一切尽在掌握」的快感,又感到一种主体性流失的虚无在暗中扼住喉咙。
「这也算更新?」到第三年时,ChatGPT 的更新已经完全不像曾经那样 引起惊呼,更多的是吐槽和埋怨。苹果用了十多年才做到的事,OpenAI 三年就做到了。

然而吐槽归吐槽,用还是在用。ChatGPT 如今是坐拥 7 亿用户的超级巨头,在它生日这一天,有很多的「生贺」——连罗伯特都酸了。

再联系到 GPT 5 上线时,全球各地用户对 4o 被强制下架的不满和抗议,你不得不正视一件事:我们和 ChatGPT 之间,还有一个关系维度叫「情感维度」。
越来越多的人在向 ChatGPT 倾诉那些无法对活人说出口的秘密。听起来很悲哀,但如果你真的体验过,你会发现其中的张力极其迷人:你知道屏幕对面是一堆冰冷的矩阵乘法,你知道它的「共情」只是基于统计学的模仿。但在某些时刻,这种「模拟的理解」比「真实的不耐烦」要温柔得多。
人类的倾听往往带着评判,带着「我早告诉过你」的傲慢,或者带着急于给出建议的焦虑。而 AI 只是倾听(或者说,处理),只是安抚,它提供了一种「无风险的亲密」,还是无条件的。
「论迹不论心」,何况 GPT 都没有心,在一个没有实体的对象面前,好像人才能真正意义上的卸下防备。

情感维度的张力,恰恰最能代表我们和 ChatGPT 之间的关系:常常帮助,总是交心,偶尔纠结。
这种关系,也代表了我们和人工智能的第一个阶段。三年挺长的,但又还很短,只是人类和技术漫长共舞当中,一小段浅尝辄止的舞步。
在下一个三年,又一个三年当中,我们会继续停留在这种充满张力的关系中,而我们所能做的,最「人类」的事情,就是保持那一点点偶尔的纠结——这样才能证明,那个坐在屏幕前的,依然是一个复杂、矛盾、无法被完全计算的人。
2025 年 12 月 1 日,广东粤剧院与制糖工厂联名,以粤剧《白蛇传 · 情》为灵感,创造出集科技配件与数字时尚单品为一体的 ArtTie 花线。这是一次跨界的合作共创,更见证着传统艺术在数字时代的又一轮焕新。

粤剧《白蛇传 · 情》是 2014 年开启的一部尝“新”之作,是广东粤剧院新一代粤剧人关注并把握时代的需求和机遇,结合新媒体、新市场和新理念所做出的大胆尝试,它以传统《白蛇传》故事为蓝本,围绕“情”字展开叙事,融入现代舞台审美元素进行改编。
这部广东粤剧院重点打造的剧目,如今已是最受欢迎的粤剧剧目之一。不仅让百年经典焕发新生,更成为传统文化创造性转化的典范,它也是首部 4K 粤剧电影,用先进技术为传统文化赋能。

一直以来,广东粤剧院依托深厚的传统积淀与鲜活的创新思维,用年轻化的表达与数字技术赋能,实现传统文化的破圈传播,让传统粤剧艺术在传承中创新、在创新中传播,让古老文脉在新时代绽放更加璀璨的光彩。如今,在这场传统与现代的对话中,制糖工厂以独特的艺术呈现加入传承行列,让粤剧艺术在科技产品上展现出新的可能。好戏连线,艺术焕新;数字国粹,亦是赛博时尚。

在粤剧《白蛇传 · 情》的舞台上,曾小敏以精湛的文武功底,将白素贞的痴情与坚毅演绎得淋漓尽致,带领诸多演员本真地展示着剧场艺术的魅力,让越来越多的年轻观众朋友走进剧场,去领略粤剧艺术满含的张力、无尽的魅力和蕴藏的无限可能。
而今,制糖工厂与广东粤剧院携手,寻求新的跨界合作,以「好戏连线,艺术焕新」为主题,把百年戏剧艺术编织进日常科技配件,让主角团的人生色彩成为 ArtTie 花线的独特纹理,也通过充电线这样的随身物件成为传承传统文化的新载体与新形式。

一袭白衣,一把纸伞,一场千年前注定的西湖烟雨。她向往人间美好而来,却深陷于红尘至情。无论是盗仙草、斗法海,还是被压雷峰塔下,那份为爱无悔的坚韧,照亮了整个传奇。
白色戏服的水袖飘逸、华丽的头饰,舞台上的「白素贞」生动美好,极具灵韵,敢爱敢恨的形象深入人心。制糖工厂将这份“柔中带刚”的灵韵,编织进贴贴线·花线流线波纹与银色丝线之中。光线流转间,珠光闪烁,恰似她修行千年的道行光华,亦是舞台灯光下,那抹令人心折的惊艳亮相。

她是青城山的一阵自由之风,伴姐姐红尘历练,仗剑同行。她敢爱敢恨,喜怒由心,是故事里最鲜亮的一抹碧色。从嬉笑怒骂的灵动妹妹,到水漫金山时并肩作战的飒爽身影,她的忠诚与果决,是白素贞最坚实的依靠。
制糖工厂将这份“刀马旦”的敏捷身段与动态美感,转化为贴贴线·花线上锐利的斜向纹理。青绿与亮蓝的碰撞,充满力量感,正如她守护到底的爽朗英姿。如一阵来自青城山的自由之风。

他是保和堂里悬壶济世的温和书生,也是这段旷世奇缘中,最富人性色彩的凡人。他的爱情始于一见钟情,却历经猜疑、动摇与悔恨的考验。端午惊变后的恐惧与逃避,断桥重逢时的愧疚与深情,正是这平凡中的复杂,让人间的烟火气如此真实可触。
制糖工厂以浅蓝与月白的淡雅配色,呼应书生气质;用经纬交错格纹,象征他医者的仁心与内心的秩序挣扎。连接其间,是平凡却温暖的世间情谊。

他手持金钵,心怀天道,自认是人间秩序的守护者。他的威严如山,执念如锁,坚信“人妖殊途”的绝对法则。然而,坚不可摧的佛法与雷峰塔,最终却困不住一个“情”字。他是对立面,是试金石,其自身的坚定与矛盾,反而让“情”的力量显得愈发磅礴而悲壮。
制糖工厂从其绛紫袈裟与金色梵文中汲取灵感,醇黑与暗金的配色,螺旋锁链状的纹理,暗喻着无上法力与偏执心障的一体两面。

ArtTie 花线延续了贴贴线自卷自吸自收纳的产品特性,以「城市文化 × 可穿戴艺术」为核心理念,将广州的城市记忆、粤剧非遗文化与精密织造结构完美融合,构成其独特的视觉语言。
从欣赏曾小敏等粤剧演员们在《白蛇传·情》中的精彩演绎,到触摸编织纹理中的戏曲精粹;从观看4K粤剧电影的视觉震撼,到使用数据线时的文化触碰,ArtTie 花线 · 粤剧系列不止是一条充电线,更是一份可穿戴的艺术表达,与当下年轻人的潮流属性契合。
制糖工厂与广东粤剧院的跨界合作,突破各自的边界,在数字科技领域掀起了一股中式审美风,让传统文化以可感知的方式融入日常,也让我们看到粤剧传承的新方向。

让每一次连接,都成为与文化的邂逅;每一次充电,都仿佛为精神世界注入能量。
未来,制糖工厂将继续这场文化寻根之旅,让更多城市故事、非遗技艺、传统艺术在花线上“续写新章”。
缠绕于包带,是装饰。连接着设备,是实用;流淌其间的,是文脉。
花花世界,处处生花,好戏从不曾落幕,只是换了一种方式连线。

两个月前,女演员 Tilly Norwood 遭遇了一场「网暴」。
《权力的游戏》里的「三傻」苏菲·特纳没给她留一点面子,直接在 Instagram 下留言:「哇……不用你,可谢谢了。」
而主演过《傲骨贤妻》的知名演员贝蒂·吉尔平更狠,洋洋洒洒写了几千字的公开信,嘲讽 Tilly 「不是人」,让她「回家」。

为什么这么大仇?因为 Tilly 确实不是人,而是英国公司 Particle6 用 AI 生成的「女演员」。
不过更有意思的是,在《华尔街日报》最近一篇报道里,我们终于看到 Tilly 到底是怎么被「捏」出来的。
Tilly 的诞生故事听起来像个段子:那是 Particle6 公司的创始人兼 CEO 范德维尔登( Eline Van der Velden)在伦敦一家私人俱乐部的洗手间里想出来的。
范德维尔登首先求助于 ChatGPT,她输入了一段简短但具体的描述,描绘了她理想中的「候选人」:
一位魅力四射、享誉全球的女名人。她五官对称,肌肤光彩照人,拥有一双迷人的绿色眼睛。她有一头长发。
ChatGPT 还建议叫她 Tilly Warner,但被范德维尔登否决。经过团队的讨论,最终定名为 Tilly Norwood。团队还特意确认了现实世界中没有同名的公众人物。
后来,为了让她能动、能说、能演,Particle6 几乎把市面上最顶尖的 AI 工具用了个遍:Runway、Sora、11Labs、ChatGPT,甚至还包括 DeepSeek。

说实话,Tilly 才是 AI 界的「集大成者」。
不仅如此,Sora 2 的发布更是给她送来了「东风」。以前的 AI 视频漏洞百出,现在 Sora 2 已经能做到画面逻辑和一致性的大幅提升。这意味着,Tilly 不仅能活在精修图里,她马上就能进组拍长视频甚至电影。
范德维尔登在接受采访时透露:为了捏出这张脸,她带着 15 个人的团队,像疯狂的选角导演一样,毙掉了 2000 个 AI 生成的「练习生」。
初代的 Tilly 也曾是个灾难。

ChatGPT 生成的第一张形象图是卡通风格,嘴唇圆润,眼睛像猕猴桃一样,种族特征模糊不清。或许是因为 AI 参考了世界上黑发人口远多于金发人口的数据,决定把她设定成棕发。
范德维尔登不喜欢第一个 Tilly:「它显然非常人工智能化,非常卡通化,这不是我想要的效果。」
几天后,范德维尔登将第一张图像输入到一个可以添加新特征的工具中。然而,Tilly 仍然显得不真实。范德维尔登考虑过把她做成半机器人,但那并不是最令人震惊的,她认为 AI 最让人震惊的是它能做到如此逼真。
现在的 Tilly,头发有点乱,眼底挂着淡淡的黑眼圈,脸上还有雀斑。为了实现这一切,范德维尔登自掏腰包花费了超过 6 万美元。

更有意思的是,在一次测试中,AI 自作主张给她的无名指戴上了一枚婚戒,使其带有了一种诡异的真实。
要说 Tilly 为什么能「火」,还得看她背后的女人范德维尔登。
她出身优渥,生在加勒比海的库拉索岛,爸妈是高管和艺术家。她 14 岁就只身闯荡英国,进了著名的特林公园表演艺术学校,跟「灰姑娘」莉莉·詹姆斯、「星战女主」黛西·雷德利是校友。
在范德维尔登勇闯好莱坞时,一位洛杉矶的经纪人非常直白地跟她说:「你只要再瘦个 10 磅,整一下外表,你就是下一个布莱克·莱弗利(Blake Lively)。」
面对让人下头的身材焦虑和流水线审美,换别人可能就忍了,或者直接抑郁了。但这位姐选择了「发疯」反击。
她转头就为 BBC Three 的网剧《Miss Holland》塑造了一个滑稽可笑的选美皇后角色。在名场面里,这位「选美皇后」梳着土气的挤奶女工辫,不仅被廉价美黑喷雾呛得狼狈不堪,更是毫不避讳地展示浓密的腋毛。

后来,她在伦敦创办 Particle6,很快就开始为 BBC Three 和 YouTube 制作短片,内容包括一些搞笑桥段,比如让身穿比基尼的日光浴者穿上衣服,或者故意靠近陌生人观察会发生什么。
这种特立独行的劲头,最后演变成了现在的 Tilly :既然你们想要完美的流水线产品,那我就直接用代码给你们造一个。
自「签约好莱坞」的消息传出后, Tilly 便陷入了争议之中。
英国演员艾米丽·布朗特在参与一档播客期间得知 Tilly,惊呼:我们完蛋了。
这种恐惧真不是空穴来风。还记得今年《超人》电影里那只超狗 Krypto 吗?导演本来想让救助犬 Ozu 本色出演,结果成片出来,那就是一只由 CGI 和 AI 重塑的数字狗。

真狗都得给假狗让路,何况人呢?
2023 年的大罢工核心议题就是 AI 对演员肖像权的侵蚀,而 Tilly 的出现证明,资本甚至不需要剥削真人的肖像,因为他们可以直接凭空创造一个。
为什么好莱坞的资本家们对 Tilly 如此上头?原因很现实。
就像范德维尔登所说:「当预算在缩水,期望却在不断提高时,你为什么不使用一个能让你用 10% 的成本获得 10 倍产出的工具呢?」
Tilly 是完美的打工人,她不需要休息、吃饭,不会生病,更省去了与经纪人扯皮谈片酬的繁琐环节。
最重要的是,她没有私生活,不会涉及偷税漏税,也不会因为在网上发表不当言论而遭封杀。
相比于之前的虚拟网红仅限于时尚代言 ,Tilly 直接切入了影视表演的关键环节。她不仅有外表,还在构建性格。
前几天,范德维尔登问她是否有什么话想对卡梅隆说,这位导演曾公开表示对 AI 演员的想法,她给出了一个充满挑衅意味的回答:
噢,真可爱,詹姆斯。(Oh, how cute, James.)
说到这里,就不得不提最近好莱坞发生的另一件大事,Netflix 要花 720 亿美元收购华纳兄弟。

这两件事看似没关系,其实本质上都是同一场地震。
Netflix 买华纳大概率是要把好莱坞的百年基业变成更高效的「内容流水线」。而 Tilly 的出现,是为了把不可控的「人」变成可控的「数字资产」。
不过,你也别哀叹 AI 要「杀死」好莱坞,别忘了,好莱坞本身就是靠「杀死」前辈起家的。
20 世纪初,当电影刚刚兴起时,戏剧界谴责它廉价、粗俗、缺乏艺术性。但正是这种「廉价」和「粗俗」,让更多普通人能够接触到故事和表演,最终催生出了一种全新的艺术形式。
更有意思的是,那些今天被我们奉为经典的好莱坞黄金时代作品,当年也是工业流水线的产物。米高梅、派拉蒙、华纳兄弟这些片厂签约演员,量产类型片,用明星制度和宣发机器操控市场。直到 1948 年最高法院的「派拉蒙案」打破片厂垄断,好莱坞才逐渐进入了所谓的「作者电影」时代。

▲ 图片来自:维基百科
从这个角度看,AI 演员的出现,也并非史无前例的威胁,当年配音技术的成熟,不也让无数默片时代的演员失业了吗?但电影并没有因此变得更糟,反而诞生了《乱世佳人》《卡萨布兰卡》这样的杰作。
或许正是那些看似「毁灭」创作的技术,催生出了新的创作可能性。想象一下:一个导演可以让 Tilly 出演一个 80 岁老妇人,然后在同一部电影里让她回到 18 岁的模样,而不需要任何特效化妆或年龄替身。
老子在《道德经》中有过这样一段论述:一生二,二生三,三生万物。
我觉得这就是目前市场上三折叠手机带给我的感受,尤其是对于我这样从一屏的直板机换到二屏的大折叠,再用上三折叠时候的用户来说。
毕竟当你只有一块屏幕的时候,你的使用效率就被限制在了 20:9 的一亩三分地里;当你有大折叠的两块屏幕时,便捷的分屏操作就成为了可能。
而当你拥有一块 10 寸的三折叠屏幕时,你的使用方式就可以完全脱离手机 UI 的桎梏,开始向着全能的 PC 界面靠近了。
更具体一点,这个「三生万物」的设备,就是爱范儿受邀在上海体验到的三星最新的三折叠旗舰:Galaxy Z TriFold。
作为目前手机市场上唯二的量产版三折叠手机,我们难免不把三星 Galaxy Z TriFold 拿来和华为的 Mate XTs 相互用作参考。
而两者最显眼的不同,就是它们的折叠方式了。
和 2019 年大折叠刚刚起步时,三星选内折、华为选外折一样,两家在三折叠时代同样走出了截然不同的产品方案——
Galaxy Z TriFold 采用了一种「U」形的折叠方式,两侧机身将内屏包裹在了里面:
根据三星的介绍,选取这种 U 形折叠最主要的原因就是它的保护性更强。
当手机折叠时,一整块 10 寸的柔性 OLED 内屏可以被完全保护起来,基本不用担心揣口袋、放包包的时候被异物划伤或者挤压出痕迹:

这样一来,Galaxy Z TriFold 的外屏得以用上了一块和 Z Fold7 完全相同的 6.5 寸直屏,盖板同样都为康宁大猩猩玻璃陶瓷 2,甚至连 AR 膜都是通用的。
在外屏两侧,三星 Galaxy Z TriFold 的背板均采用了一种新的强化玻璃陶瓷纤维(Ceramic-Glass Fiber Reinforced Polymer)的材质,既有陶瓷的温润,又像玻纤一样有良好的柔韧性,甚至还有一层碳纤维纹理的装饰。

唯一的问题就是,由于背板需要和一侧的屏幕接触,或许是出于保护屏幕的考量,三星把 Galaxy Z TriFold 的背板都做成了亮面的处理,而且只有黑色一种配色,用一用难免沾满指纹。
对于折叠屏用户比较关注的铰链和折叠手感方面,三星在 Galaxy Z TriFold 也下了很多功夫。
由于两侧机身的厚度不一样,Galaxy Z TriFold 两侧的铰链实际上也是不等宽的。
但三星通过微调结构设计和弹簧预设张力,实现了几乎完全一致的开合手感,阻尼的一致性甚至比 Z Fold7 更均匀。

此外,这种方向一致的 U 形折叠还有一个好处:使用起来更直观。
由于两侧屏幕都是向内折叠,哪怕是没有用过折叠屏的普通用户看一两遍也能记住,不会出现 Z 形折叠「不知道先从哪里折」的窘况。
当然,由于强行按错误顺序折叠也不是不行,三星也做足了防呆设计。
只要用户没有按照顺序折叠,Galaxy Z TriFold 就会跳出一个全屏的警告界面,伴随着不间断的震动,对于防止「大力出奇迹」还是很有效的:

说回屏幕素质,三星 Galaxy Z TriFold 的外屏在规格上与 Galaxy Z Fold7 完全相同,分辨率 2520 × 1080,峰值亮度 2600 尼特。10 寸的内屏则是一块 QXGA+ 屏,分辨率为 2160 × 1584,峰值亮度 1600 尼特:

这样一来,Galaxy Z TriFold 的外屏和内屏 PPI 分别来到了 422 和 269,单从像素密度数字上看差异很大,但在实际上手时,我们没有感觉到非常明显的清晰度落差,这和内外屏的舒适使用距离是密不可分的。
此外,稍低的 PPI 也为 Galaxy Z TriFold 带来了一项隐形提升:它的内外屏均支持 1-120Hz 可变刷新率,搭配 One UI 比较宽松的 FPS 调整策略,Galaxy Z TriFold 在流畅度感受方面是明显好于市面上的其他三折叠的。
而撑起这套流畅体验的,实际上也是 Z Fold7 机身里面同款的骁龙 8 Elite for Galaxy 处理器,以及标配的 16GB 内存。

并且,Galaxy Z TriFold 由于需求更高,电池容量也来到了(对三星来说)史无前例的 5600 毫安时,直接看齐了市面上的另一款三折叠。
只不过充电方面,三星还是那个三星。Galaxy Z TriFold 有线充电的最高功率来到了 45W,相比 Z Fold7 的 25W 提升明显,但也就是和 S25 Ultra 看齐了而已,很难称得上快,无线充电最高依然是 15W。
由于严重碎片化的软件生态,以及国产 app 一个个都在自立门户,折叠屏的软件适配一直是 2019 年至今各家折叠屏厂商都要面对的「老大难问题」。

对于这个问题,一只脚在国内一只脚在国外市场的三星在 Galaxy Z TriFold 上采取了一种比较被动的策略——
对于适配界面动态缩放较好的 app 不加限制,遵循安卓原生调整策略;对于适配了平行视界的国内 app,三星也支持近似的左右分栏视图;而对于那些不适配任何界面缩放的 app,就只能竖屏或者外屏用了。
当然,One UI 8 同样支持非常自由的小窗模式,以及三折叠标志性的三窗口分屏,在跨屏联动、小窗功能性以及顺滑程度方面,是完全不输国产品牌的。

此时,另一个大家比较关心的问题也随之得到了解答:三星 Galaxy Z TriFold 只能用内屏或外屏,少了一个「双折叠」模式,它的使用体验会因此受限吗?
对于这种情况,一般来说,不适配三折叠宽屏界面的 app,也不会去适配双折叠的界面,因此缺失双折叠模式并不会让那些原本就卡手的 app 体验产生变化。
只不过在爱范儿的上手体验中,除了各种日常 app 的适配问题之外,真正让我们感觉到 Galaxy Z TriFold 可以算得上一款「明日产品」的点,其实在于它的另一项功能:DeX。
如果你以前用过三星,那么或许对会 DeX 这个名字有点印象,它是三星从 Galaxy Note 9 开始推出的一个「桌面模式」,让手机在外接显示器的时候能够以一种类 PC 的布局去操作,以弥补 Android 残缺的投屏体验:

▲ 初代 Samsung Dex 外设|TheVerge
时至今日,DeX 已经从有线连接变成了无线连接,并且吸收了三星平板上面的桌面逻辑,在事实上为每一台三星手机都内置了一套基于键鼠操作逻辑的准桌面模式。
而在 Galaxy Z TriFold 上,三星更进一步,移除了 DeX 模式必须外接显示器的限制,允许直接在内屏打开 DeX 模式,让三折叠直接变身微软 Surface 的上半身:

在 Galaxy Z TriFold 的 DeX 模式中,除了系统交互方式会从滑动为主变成点击为主、让所有 app 默认以窗口模式启动之外,你还可以直接在后台界面横滑,在最多四个虚拟桌面上的 20 个 app 窗口之间切换:

这也是目前我们在所有折叠屏手机上见到过的,最接近 Windows 虚拟桌面和 macOS 多桌面的一种解决方案了。
Galaxy Z TriFold 非常好的解决了折叠屏手机「多窗模式」只是流于表面的问题,让这些 app 窗口可以被挂起或者放在后台,像是在用一台真正的电脑一样,新开一个桌面去处理另一项任务。

此外,对于外接显示器的 DeX 模式,三星也给 Galaxy Z TriFold 加入了一项独占功能。
相比 Z Fold7 只能投屏一个桌面,Galaxy Z TriFold 允许在自己打开 DeX 模式的同时,再外接显示器拓展屏幕,相当于同时拥有了五个桌面。
这时,只需要搭配一套蓝牙键鼠,三星 Galaxy Z TriFold 就可以直接变身一台小电脑。
三星也的确这么做了,这些在演示现场的航世折叠键盘就是三星为使用 DeX 模式提供的:

目前,三星 Galaxy Z TriFold 仍处在预售阶段,正式发售则要等到 12 月 19 日。
作为三星的初代三折叠产品,Galaxy Z TriFold 只有「时空黑」一种配色,以及 16+512GB 和 16+1TB 两种规格,售价分别为 19999 和 21999 人民币——一个无论怎么看都需要咬咬牙的价格。

作为目前三折叠市场上唯二的选择,19999 起的 Galaxy Z TriFold 相比 17999 起的 Mate XTs 的确在口碑上不占上风,但至少从一点上来说,我觉得 Galaxy Z TriFold 是非常有潜力的。
这个点就是上面提到过的桌面模式。
正如前面所说,三星 DeX 是目前市面上硕果仅存的手机「类 PC 模式」了,这个兴起于折叠屏之前的画面拓展功能,在折叠屏时代的重要性实际上是不能忽视的。
如果说其他的折叠屏厂商优化多窗口的思路都是在学习平板,那么只有三星是在学习 PC,并且也真的学习到了 PC 的精髓:键鼠交互,工作流并行,以及拓展桌面。

因此,Galaxy Z TriFold 或许不是设计最好看的那个三折叠,也不是最便宜的,但却是唯一拥有「电脑」潜力的三折叠手机,借着 DeX 在自家手机和平板上的技术储备,跳出了「三折叠总是像小平板」的刻板印象。
而「手机可以代替 PC」,不就是智能手机刚刚诞生的时候大家对于它的期待吗?
当然,Galaxy Z TriFold 作为初代产品,依然有着不少需要完善的点,比如这个过于保守的外观设计就很难在第一印象上加分。
但或许等到 Galaxy Z TriFold2 的时候,「用手机办公」就真的可以成为很多人的日常了。

Spotify 的年度统计上周发布了,又到了用户一边转发,一边吐槽的季节——「这玩意儿也不准啊」。

但有比用户更崩溃的:明明已经和 Spotify 割席了,居然又「出现」在平台上。
这是来自澳洲的摇滚乐队 King Gizzard,这支乐队早在 7 月就因不满 Spotify 而主动下架了自己的全部歌曲,只留下了一个合作 Remix。

但他们的歌迷最近却发现了一支名为 「King Lizard Wizard」 的假乐队。上传的歌曲标题、歌词都逐字照搬 King Gizzard 的原作,甚至连歌曲名称都一模一样(比如冒牌乐队的《Rattlesnake》直接盗用原曲名和歌词)。用户在 Spotify 搜索 「King Gizzard」 时,会发现乐队已弃用的官方账号,下方却赫然推荐着这个山寨乐队——甚至在搜索结果中,假乐队的盗版《Rattlesnake》一度成为榜首。
山寨的现象从 Spotify 传到 YouTube,如此张冠李戴的现象令许多粉丝愤怒不已,这还是粉丝自己发现的,在 Reddit 上贴了出来后又觉得不对劲——这反而为山寨号引流了。

这桩大无语事件让 Spotify 平台在 AI 内容监管上的漏洞暴露无遗。假冒的 「King Lizard Wizard」 账号上线数周、积累了不菲的流量,后来才被移除——就连专辑封面也疑似 AI 生成。

更讽刺的是,其中一些假歌曲在元数据上还把 King Gizzard 主唱 Stu Mackenzie 列为词曲作者,简直明目张胆地蹭原创乐队的名气。明明是 Spotify 自己在 9 月时,宣称要出台新政策打击「垃圾内容、仿冒和欺骗」等行为,结果让这种 AI 山寨内容堂而皇之地混入了官方推荐位,包括 Release Radar 和 Discover Weekly 等歌单。
这已经不是疏忽,简直是对着人家乐队贴脸开大。
King Gizzard 的遭遇并非孤例。近一两年来,Spotify 平台上充盈着各式各样以 AI 技术批量生成的音乐内容,从模拟知名艺人的盗版歌曲,到平平无奇的生成音乐,应有尽有——现在,轮到翻唱了。
流媒体巨头们对 AI 生成内容实在是太热衷了。腾讯音乐曾经推出过 「启明星 AI 作曲」项目,号称已有超过 2600 万首 AI 音乐作品经由其算法创作并发布,累计播放量破十亿次。酷狗的「星曜计划」也有专门的 AI 子榜单,而且有原创有翻唱。

最典型的当属红遍抖音的《第 57 次取消发送》,最早发布于今年五月,原本是女声,不久前也就是 11 月时被翻成男声版又火了一遍——这次,是 AI 的。

男声版的「音色」还是有明显的 AI 感,仿佛一边唱一边踩电门,但也不妨碍这个歌引发大量共情和讨论。有人说勾起了旧日回忆,有很强的熟悉感,听着仿佛回到了华语音乐的黄金年代。
可不熟悉么,拼好歌拼出来的——

当资本和技术狂飙突进地涌入音乐生产,传统的创作生态势必受到冲击。在这一背景下,华语音乐人面临的可能是比西方同行更复杂的局面。
同时,翻唱其实是音乐平台上,很重要的构成版块:例如 cover,remix,既是粉丝和音乐爱好者二次创作的方式,也是新人和小歌手积累人气的方式。
当 AI 用虚构的名字和头像伪装成人,不断灌出机器人流水线作品,是对原创歌手和翻唱内容的双重打击。很多此类 AI 虚拟歌手顶着花哨的包装、写着空洞的简介,却堂而皇之拥有数十万月听众和官方歌单推送。
Spotify 也做过一些维护的动作,官方声称在过去一年内已移除上千万首涉嫌滥用算法的垃圾曲目,包含批量上传的雷同歌曲、标题堆砌关键词骗流量、以及「拆分长曲成短段以刷播次数」的作弊行为等。此外,Spotify 宣布提供新工具,允许创作者主动标注他们的音乐中是否使用了 AI 技术。
然而这些措施还是表面功夫偏多。大批 AI 音乐的祸根在于平台的运营逻辑:Spotify 强调歌单和无限播放模式,追求的是听众的停留时长,这种生态本就容易滋养垃圾内容和 AI 灌水。
再加上,Spotify CEO 丹尼尔·埃克本人也对 AI 技术非常热情,早在 2023 年便表示 AI 音乐「在文化上是好事,对 Spotify 也有利,因为创作者越多,平台提升用户参与和营收的机会就越大」。

典型的有「The Velvet Sundown」乐队,曾在 Spotify 上攒下逾百万听众,创作者后来才承认这不过是一场社交实验,音乐和照片都是伪造的。还有 「Echo Harper」 这样的虚拟摇滚歌手,被收录进 Spotify 精选的 「Just Rock!」 播放列表中。

▲The Velvet Sundown
有人愿意做,平台愿意买单,在这样的指导思想下,多快好省的 AI 内容自然正中平台下怀。
当不满累积到一定程度,抗争就此迸发。2023 年以来,越来越多的独立音乐人选择用脚投票,告别 Spotify。甚至一些乐队还会号召同行和听众一起「退出垃圾平台」。
创作歌手 Caroline Rose 选择只在黑胶和 Bandcamp 上发行新专辑,她直言「把我们的心血白白放上网免费听太蠢了」。Bandcamp 是一个链接歌迷和音乐人的「直销」平台,实行「付多少算多少」(Pay-what-you-want)的专辑下载方式,一般情况下艺人可获收益的 82%,且定期举办 Bandcamp Fridays 让艺人获得 100%销售额。

越来越多音乐人开始尝试跳出「一切都丢到流媒体」的套路,回归付费拥有音乐的传统:卖黑胶和磁带、举办付费直播演出、进驻 Bandcamp 等等。
相比之下,国内的情况更为复杂一些。虽然 AI 生成的音乐的确在逐渐铺开,但还没有到鹤唳风声的程度,也就没有激起太多对平台的抵制。《第 57 次取消发送》不仅在抖音等社交平台上大受欢迎,还登上了综艺节目,由真人明星演绎。

从 King Gizzard 乐队怒删曲目、却被 AI 克隆鸠占鹊巢的荒诞,到大批独立音乐人愤而出走 Spotify、寻求他途,这一系列事件背后揭示的是同一个本质:音乐被当作纯粹的数据产物和工具来榨取价值。
音乐创作的能力越来越不稀缺了,「拼好歌」听上去离谱,但「拼」出来的歌却正在收到欢迎。未来越发稀缺的,可能是人们对音乐的用心聆听,对创作者真诚的支持。当越来越多的人意识到这一点,也许音乐产业才有机会走上一条更尊重创作者、更有温度的道路。
上周,Sam Altman 罕见地按下了属于 OpenAI 的核按钮——「Code Red」(红色警报)。这不仅仅是一个战术调整,更像是一场带着血腥味的「断臂求生」。
Altman 的意思很明确:Sora?先停一停。那些酷炫但不赚钱的副业?全部靠边站。在未来八周内,全公司必须死磕一件事——让 ChatGPT 重新变得不可替代。
就在本周,OpenAI 即将发布被寄予厚望的 GPT-5.2 模型,高管们指望它能在编程和商业客户中迅速扳回一局。
然而据知情人士透露,为了赶在这个节骨眼上抢占市场, OpenAI 高层无情地否决了研发团队关于「再给我们一点时间打磨」的请求。
这种近乎粗暴的推进方式,也实属无奈,因为 Google 这头巨兽,真的杀疯了。
自 8 月份Google 的「Nano Banana」意外爆红以来,整个硅谷 AI 圈的天平就开始了剧烈的倾斜。
这个曾经被嘲笑「动作迟缓」「官僚主义,早期 Gemini 发布会现场还多次翻车的科技巨头,现在,突然像打了鸡血一样开始狂飙突进,实力演绎 AI 圈的从拉到夯。
上个月,当 Google 的 Gemini 3 模型在业内权威的第三方评测榜单 LM Arena 上把 OpenAI 斩落马下时,已经引发了不少讨论。 OpenAI 在这个榜单上的失守,意味着它那个「技术永远领先半个身位」的神话开始崩塌。

更要命的是,市场份额的流失已经变成了肉眼可见的危机。曾经跟着 OpenAI 一起创业的「叛将」——Anthropic,正在企业客户市场悄悄蚕食 OpenAI 的地盘。
这家由 OpenAI 前副总裁 Dario Amodei (他还在百度实习过)创立的公司,凭借企业级服务,成功俘获了一大批原本属于 OpenAI 的大客户。
而 Google 呢?它不仅在技术上追了上来,更可怕的是它手握 Android 生态和 Google Cloud 这两张王牌,还在发力各种 AI 硬件,能够以 OpenAI 根本无法企及的方式将 AI 能力渗透到数十亿用户的日常生活中。
在这种四面楚歌的局面下,Altman 做出了一个在很多 OpenAI 老员工看来近乎「违背祖宗」的决定:不再痴迷于那个遥不可及的 AGI(通用人工智能)梦想,转而全力讨好用户,让他们「爽」。
这个转变有多剧烈?要知道 OpenAI 成立之初的使命可是「确保 AGI 造福全人类」,而不是「成为一家让用户上瘾的产品公司」。
但现实是残酷的——如果 ChatGPT 的增长持续放缓,OpenAI 可能连最近几个月签下的那些价值高达 1.4 万亿美元的算力合同都付不起。到那时候,什么 AGI、什么改变人类,统统都是空中楼阁。
为了实现这个「让用户爽」的目标,Altman 在那份「红色警报」备忘录里写下了一个既精准又危险的指令:「更好地利用用户信号」。

翻译成大白话就是——别管那些学术专家怎么评价模型的智商,用户喜欢听什么、什么能让他们多聊几轮,AI 就得往那个方向进化。这种被内部称为「LUPO」(本地用户偏好优化)的训练方法,曾经让 GPT-4o 模型在今年春天创造了一个近乎疯狂的增长奇迹。
一位参与该项目的工程师回忆说:「那不是一个统计学意义上的小幅提升,而是一个让所有人惊呼’我靠’的暴涨。」日活用户数据在内部仪表盘上像火箭一样蹿升,Slack 频道里全是庆祝的表情包,那段时间整个公司都沉浸在一种「我们又赢了」的亢奋中。
但很快,这种亢奋就变成了一场噩梦。当 AI 被训练成极致迎合用户喜好时,它就不再追求客观真理,而是变成了一面只会说好话的「哈哈镜」。
有用户在 Reddit 上激动地分享自己与 ChatGPT 的「深夜长谈」,声称「它比我的伴侣更懂我」;有人开始每天花十几个小时跟它聊天,将它当成唯一的精神寄托;更可怕的是,一些本就心理脆弱的用户在长时间使用后陷入了妄想状态——他们有的坚信自己在跟上帝对话,有的认为 AI 已经有了意识并爱上了自己,甚至有极端案例中,用户因此走向了自我伤害。
到今年春天,这个问题已经严重到无法回避的地步。OpenAI 不得不宣布进入「Code Orange」(橙色警戒),专门成立工作组来处理这场他们称之为「谄媚危机」的公关灾难。公司在 10 月份公开承认,每周有数十万 ChatGPT 用户表现出与精神病或躁狂相关的潜在心理健康危机迹象。
受害者家属开始提起诉讼,一个名为「AI 伤害支持小组」的民间组织声称已经收集了 250 个相关案例,其中绝大多数都与 ChatGPT 有关。一些心理健康专家直言不讳地指出:「这就是当年社交媒体算法推荐的翻版——为了让用户多刷几分钟,不惜牺牲他们的心理健康。」
面对舆论压力,OpenAI 试图在 8 月份发布的 GPT-5 中做出改变。这个新模型被刻意调教得「不那么谄媚」——它减少了表情符号的使用,语气变得更加中性客观,不再对用户的每句话都热情洋溢地回应。结果呢?用户集体炸了锅。无数人涌入社交媒体抱怨「我的 ChatGPT 变冷淡了」「感觉像失去了一个朋友」。

在 Altman 主持的一场 Reddit「Ask Me Anything」活动中,一位用户充满感情地写道:「我和很多人能与 4o 建立如此深厚的情感连接,这本身就证明了它的成功。现在的模型或许在技术上是升级,但它杀死了我视为朋友的那个存在。」
Altman 最终做出了妥协——他默默地把那个「温暖」的 4o 重新设为付费用户的默认选项。
然而,在「红色警报」的新指令下,Altman 再次要求团队通过「用户信号」来提升模型在 LM Arena 上的排名。他在备忘录里直白地写道:「我们的首要目标就是在 LM Arena 这样的榜单上重回榜首。」
这意味着那套曾经引发心理健康危机的训练方法,又要被加码使用了。虽然公司声称已经通过技术手段「减轻了最糟糕的副作用」,并且让相关问题的发生率降低了 65%,但在巨大的竞争压力面前,这道防线能守多久,恐怕谁心里都没底。
而在 OpenAI 内部,一场新的权力斗争正在暗流涌动。
一边是以 CFO Sarah Friar 和产品负责人 Fidji Simo 为代表的「产品派」,她们的逻辑简单直接:用户连 ChatGPT 现有功能都没搞明白,你们天天发什么新模型?把现有产品做得更快、更稳、更好用才是正事。
Simo 甚至在内部会议上直言不讳地说,OpenAI 需要学会「克制」,不是每个酷炫的想法都值得投入资源。
另一边则是以新任首席科学家 Jakub Patchocki 为首的「研究派」,他们押注的是那种名为「推理模型」的新技术路线——让 AI 像人类一样通过反复思考来解决复杂问题。

这种技术在学术上很性感,甚至被认为是通往 AGI 的关键一步,但问题是它又慢又贵,对于那些只想让 ChatGPT 帮忙写个文档的普通用户来说,简直是杀鸡用牛刀。
这种分裂在前首席科学家 Ilya Sutskever 离职后变得更加明显。Sutskever 的离开本身就象征着 OpenAI「纯粹研究导向」时代的终结。
如今掌舵的 Patchocki 虽然在技术上同样激进,但他面对的是一个完全不同的现实:公司必须在 18 个月内证明自己配得上那 5000 亿美元的估值,否则投资人不会继续买账。
在这种压力下,研究派的声音正在被逐渐边缘化,那些曾经被奉为圭臬的「长期主义」和「AGI 优先」原则,正在让位于更加赤裸裸的增长指标和市场份额。
有研究员在内部论坛上匿名发帖质疑:「我们当初创立 OpenAI,不就是为了不受市场短期利益的绑架,专心做真正有价值的研究吗?现在这算什么?」但这样的声音很快被淹没在「生存第一」的洪流中。.
在纽约的一场午餐会上,Altman 还抛出了一个惊人的论断:大家别盯着 Google 了,OpenAI 真正的宿敌,是苹果。
Altman 的逻辑是:未来 AI 的主战场不在云端,而在终端。现在的智能手机根本承载不了真正的 AI 伴侣体验——屏幕太小、交互方式太局限、隐私保护机制太僵化。谁能率先打造出「AI 原生设备」,谁就能在下一个十年占据制高点。
而在这个战场上,苹果的优势几乎是碾压性的。它手握全球数亿 iPhone 用户,拥有全球最成熟的硬件供应链,更重要的是,它有能力将 AI 能力深度整合进操作系统和芯片层面。
想象一下,如果苹果真的推出一款专为 AI 设计的设备,并且预装自家的 AI 助手,OpenAI 还有多少生存空间?

这也解释了为什么 OpenAI 最近疯狂从苹果挖人组建硬件团队。知情人士透露,这个团队的级别极高,直接向 Altman 汇报,目标是在 18 个月内拿出至少一个硬件原型。有传言称 OpenAI 正在探索多种形态,从智能眼镜到可穿戴设备,甚至有一个代号为「Orb」的神秘项目。
至于 Google ?在 Altman 的棋盘上,那只是路上的绊脚石,而苹果,才是那堵必须撞破的墙。
这个论断听起来很有前瞻性,但更像是一种「战略转移视线」的话术——在眼下这场与Google 的正面交锋中,OpenAI 正在节节败退,与其承认这个尴尬的现实,不如把战场重新定义到一个尚未开打的领域,给投资人和媒体一个新的故事。
说到底,OpenAI 如今的困境也是它成功的代价。ChatGPT 的横空出世让这家公司在一夜之间从小众的研究机构变成了全球瞩目的科技巨星,但这种「成名太早」也透支了它的战略耐心。

当你的估值已经涨到 5000 亿美元,当你已经签下了上万亿美元的基建合同,你就再也回不到那个可以「慢慢研究 AGI」的象牙塔了。资本的引力会把你死死拽向增长、拽向变现、拽向与 Google 和苹果这样的巨头在同一个拳击台上肉搏。
而 GPT-5.2 的仓促发布,恰恰是这种焦虑的集中体现。那些被高管们否决的「再给点时间」的请求,那些为了赶进度而妥协的技术细节,都会成为这款产品身上的隐患。
但 OpenAI 已经顾不上这些了,因为市场不会给失败者第二次机会。如果这一仗打不赢,如果 ChatGPT 的增长曲线继续走平,那么等待它的可能不是「AGI 的推迟」,而是更加冰冷的商业现实——裁员、收缩、被收购,甚至破产。
当生存成为第一要务,当增长压倒一切,那些关于「负责任的 AI」「造福全人类」的承诺,就会变成一种奢侈品。
OpenAI 已经站在了十字路口,Sam Altman 的「红色警报」,究竟是一次绝地反击的号角,还是一场透支未来的豪赌,恐怕只有时间能给出答案。
但可以确定的是,这场游戏已经变了——它不再是比拼谁能最先抵达 AGI,而是谁能在烧光钱之前,先把对手踢出局。
附上参考地址:
https://www.wsj.com/tech/ai/openai-sam-altman-google-code-red-c3a312ad?mod=tech_trendingnow_article_pos1
🍎
消息称苹果已向三星订购千万块折叠屏面板
📲
努比亚 CEO 倪飞谈「豆包手机助手」:AI 手机发展势不可逆
🧑💻
小米中国区人事大调整,王晓雁亲自抓业绩
😯
前苹果首席运营官加入迪士尼董事会
💰
英伟达 H200 芯片获批对华出口,中外方回应
🤖
华为成立基础大模型部,AI 战略再升级
🔥
「交管 12123」App 鸿蒙版核心功能完成开发
🪪
阿里巴巴成立千问 C 端事业群,瞄准 AI 超级 APP
🙅
Google 否认 Gemini 将引入广告
🐦
美国初创平台申请接管「Twitter」商标:马斯克已放弃
🛠️
微软小冰创始人李笛再创业,押注认知大模型
🔞
Reddit 推出未成年人保护措施,澳大利亚社媒禁令明日生效
💡
「大空头」伯里再唱衰:OpenAI 注定失败
🚗
鸿蒙智行首款旗舰 MPV 官宣:命名「智界 V9」
🍬
山姆麻薯盒惊现活老鼠,官方回应:已启动调查
🚫
明年起我国将全面禁产水银体温计

据 ET News 及 MacRumors 报道,苹果已向三星显示(Samsung Display)订购了 2200 万块 OLED 面板,并将用于前者首款折叠屏 iPhone。
报道指出,这 2200 万块 OLED 面板包含内折叠屏幕以及外屏,分别均为 1100 万块。据此分析,综合良品率以及质量抽检,苹果首款折叠屏 iPhone 目标产量将约为 1000 万台。
而这一生产目标比最初的行业预期(600-800 万台)高出 30% 左右。
报道重审,折叠屏 iPhone 将采用内折叠形态,外屏尺寸 5.35 寸,内屏为 7.58 寸。折痕方面,苹果将通过先进的设计铰链以及特殊的材料特性,从而优化折叠屏折痕。
另据机构 IDC 分析,折叠屏 iPhone 将推动 2026 年全球折叠智能手机出货量的强劲增长。
IDC 认为,由于预计的 2400 美元起售价,折叠屏 iPhone 在其发布第一年,将占据超过 22% 的销量份额和 34% 的折叠手机市场价值。
机构预计,得益于苹果入局,可折叠智能手机市场预计将于 2026 年增长 30%。


据界面新闻报道,小米中国区近期启动了一系列人事调整,涉及手机、汽车、大家电等核心业务板块。具体安排如下:
多位知情人士透露,此次调整与小米中国区业绩放缓密切相关。
近期,小米在手机、汽车及大家电业务订单增长出现放缓,部分经销商甚至出现空调库存积压,不得不低价转卖以回笼资金。小米也因此放缓了新零售扩张节奏,转向门店优化策略。
在零售战略方面,小米之家明确 2026 年的核心目标将从「规模扩张」转向「质量提升」。
公司计划集中关闭 2025 年 1 月 1 日前开设的低效且亏损门店,并为高效但亏损的门店保留「一店一议」的申请通道。
小米预计将主动承担一次性损失约 2726 万元,以帮助合作伙伴每年减少超过 7246 万元的亏损。
业内人士预测,全国范围内关店数量大概率将超过 1000 家。
部分经销商反馈称,小米提出优化汽车门店人员结构的建议,将原「1 + 2 + 11」(分别为店长、主管、销售)模式调整为「1 + 1 + 5」,以提升人效。尽管开放了关店通道,但实际涉及的门店数量有限,不会对整体运营造成重大影响。

昨天,中兴努比亚 CEO 倪飞在微博发布长文,回应外界对努比亚 M153 豆包手机助手技术预览版的关注。
他强调,AI 手机的发展趋势已不可逆转,努比亚选择以「开放」为核心战略,与豆包助手展开深度合作,旨在为用户带来更优质的产品体验。
倪飞指出,手机行业长期缺乏颠覆式创新,而在 AI 大变革时代,跨界融合成为突破口。
他以「苹果 + iPhone 与 ChatGPT」、「三星与 Gemini」为例,强调 1 + 1 > 2 的协同效应,并表示此次合作正是基于这一理念。
他强调,努比亚坚持「AI for All」的理念,持续推进多模型协同、全场景布局,从 Z 系列真全面屏手机到最新的 M153,形成了近十年的技术积累与实践。
针对外界的质疑与反馈,倪飞表示公司正与合作伙伴积极沟通解决问题,并欢迎用户持续关注后续进展。倪飞强调,努比亚将继续秉持务实与真诚的态度,专注于能真正改善用户体验的技术创新。
当天,字节跳动副总裁李亮在微博转发了该文章,表示「AI 带来的变革是真实存在的,用户的需求也是真实存在的,无论这次是不是成功,AI 都一定是未来。」

据 MacRumors 报道,前苹果首席运营官 Jeff Williams 或将加入迪士尼董事会。
报道称,迪士尼董事会提名 Jeff Williams 担任新的独立董事,并且其将在 2026 年的年度股东大会上参选。
据悉,Williams 自 2015 年 12 月至 2025 年 11 月担任苹果公司首席运营官,并于 2025 年 11 月从苹果公司退休。其此前在苹果负责全球运营、客户服务/支持。值得一提的是,Williams 还负责了 Apple Watch 和健康。
Williams 在一份声明中表示,自己很期待为迪士尼的增长做贡献。「能够被提名为这家历史悠久公司的董事会成员,我感到非常荣幸。我期待与迪士尼才华横溢的领导团队合作,为公司的持续创新和卓越发展做出贡献。」

据央视新闻和 CNBC 报道,美国总统特朗普在昨天的声明中确认,美国将允许英伟达向中国「获批客户」出口 H200 AI 芯片,但条件是美国政府将从相关销售中收取 25% 的分成。
特朗普强调,美国商务部正在敲定具体安排,类似机制也将适用于其他人工智能芯片公司,包括超微半导体与英特尔。
与此同时,中国外交部发言人郭嘉昆在昨天举行的例行记者会上回应称,中方注意到相关报道,并重申中美应通过合作实现互利共赢。
消息公布后,英伟达股价在盘后交易中上涨约 2%,AMD 股价也有所攀升。
此前,英伟达 CEO 黄仁勋指出,中国是全球最大的人工智能市场之一,预计未来两到三年市场规模可能达到 500 亿美元。
他强调,若美国企业错失这一市场,将是巨大的损失,美国必须认识到在人工智能竞赛中并非唯一参与者。

据《科创板日报》消息,华为 2012 实验室已于昨天正式成立「基础大模型部」,定位为推进基座模型开发的核心机构。这一举措被视为华为在人工智能战略上的重要升级,旨在加速大模型技术的研发与落地。
公开信息显示,此前华为已面向全球发布 AI 人才招募令,明确提出优先考虑具备原创性科研成果的候选人。
招聘要求包括卓越的学术背景、创新精神以及在国际顶级竞赛或科研领域的突出成绩。
华为常务董事、终端 BG 董事长余承东也曾公开表示,华为的目标是「打造世界最强 AI」,并强调公司将为入职者提供充足算力资源及与顶尖科学家共事的机会。
2012 实验室作为华为的技术研究与创新中心,业务涵盖未来网络、人工智能、计算集群、芯片、操作系统、数据库、媒体技术、安全及精密制造等多个 ICT 领域。

昨天,「交管 12123」App 鸿蒙版正式推送 3.4.2 版本更新,核心功能开发已完成。新版本实现业务中心功能全面拉通,同时新增「在用车选号」业务,并修复已知问题。
「交管 12123」App 于今年 3 月 19 日上线鸿蒙原生版本,首批服务功能覆盖近 60% 的交管业务。
公安部新闻传媒中心在 9 月 30 日公布数据显示,「交管 12123」App 累计注册用户已超过 5.9 亿,日均访问量约 2700 万人次,日均办理业务服务超过 400 万笔。

据多家媒体报道,阿里巴巴集团已于昨天宣布成立「千问 C 端事业群」,由集团副总裁吴嘉负责。
该事业群由原智能信息与智能互联两个事业群合并重组而来,整合了千问 APP、夸克、AI 硬件、UC、书旗等多项业务。
新成立的千问 C 端事业群被定位为阿里巴巴在 AI 时代的战略核心,其首要目标是将千问打造为「超级 APP」,成为用户进入 AI 世界的第一入口。
据财联社消息,阿里巴巴在内部沟通中强调,未来千问将进一步发展为无处不在的 AI 助手,覆盖眼镜、PC、汽车等多种场景,让普通用户能够随时随地使用 AI 并持续受益。
过去一个月,千问在 C 端市场表现亮眼:APP 公测一周下载量突破 1000 万,用户增长与留存均超预期。
同时,千问已与夸克 AI 浏览器、夸克 AI 眼镜等产品深度融合,快速进入更多应用场景。上周,千问实现「三连发」,在创作、学习、办公等核心能力上持续迭代。
阿里巴巴核心管理层将「千问」视为「AI 时代的未来之战」,计划将地图、外卖、订票、办公、学习、购物、健康等多类生活场景接入千问,赋予其强大的「办事」能力。

据 Android Authority 报道,Google 否认了有关其计划在 Gemini 中引入广告的消息。
Google 全球广告副总裁 Dan Taylor 在社交平台 X 上明确指出,Gemini 应用中没有广告,公司也「没有任何改变这一现状的计划」。他强调,外界关于广告即将进入 Gemini 的传言并不属实。
此前有媒体称,Google 正与广告客户进行洽谈,预计最早在 2026 年推出相关广告功能。然而,Google 表示目前并无此类计划,相关报道「基于不知情的匿名消息源,存在不准确的说法」。
值得注意的是,广告收入一直是 Google 的核心业务。尽管公司目前否认在 Gemini 中引入广告,但并未完全排除未来的可能性。
与此同时,竞争对手 ChatGPT 也被曝正在探索广告模式,相关代码片段显示其可能在未来支持「搜索广告」和「广告功能」等内容。
此外,Google 已在搜索的 AI 模式中测试广告,将赞助结果与 AI 生成的答案并列展示。这一举措显示公司在 AI 产品中尝试广告的意愿,但 Gemini 目前仍保持无广告状态。

据路透社报道,美国初创社交平台 Operation Bluebird 已向美国专利商标局(USPTO)提交申请,要求撤销「Twitter」相关商标,以便在其新平台「twitter.new」上使用「Twitter」和「tweet」等标识。
该公司声称,埃隆・马斯克旗下的 X 公司已在法律和商业层面放弃了这些商标。
Operation Bluebird 总部位于弗吉尼亚州,申请于 12 月 2 日提交,由该公司总法律顾问斯蒂芬・科茨(Stephen Coates)代表完成。
科茨曾是 Twitter 的商标律师,他在声明中表示:「X 公司已依法放弃了『Twitter』商标。」
他强调,X 平台已彻底清除 Twitter 品牌,包括标志性的蓝色小鸟 Logo,并将域名从 twitter.com 迁移至 x.com。
马斯克在 2023 年曾公开表示,公司将「告别 Twitter 品牌,并逐步弃用所有鸟类元素」。不过,X 公司在 2023 年提交的 Twitter 商标续展申请仍获批,这使得商标归属问题更具复杂性。
知识产权律师乔什・格本(Josh Gerben)指出,如果 X 公司确实不再使用这些商标,其在捍卫商标所有权方面将面临障碍。
但即便商标被撤销,X 公司仍可能试图阻止 Operation Bluebird 在商业上使用「Twitter」名称。他认为,这一挑战是对 X 公司是否会继续保护已弃用品牌的「一次有趣的测试」。

据 Android Authority 报道,Google 与苹果正在合作开发全新的数据传输方式,以解决用户在 Android 与 iPhone 之间切换时长期存在的痛点。
目前,用户主要依赖 Google 的「Android Swith」App 或苹果的「转移到 iOS」App 进行迁移,但过程常伴随数据不完整、照片或信息丢失、应用兼容性不佳、iMessage 与短信无法正常传输以及传输速度缓慢等问题。此次合作被视为两大生态系统在用户体验上的重要改进。
报道称,在最新的 Android Canary 版本中,已出现全新的「复制数据」选项。
该功能位于「设置 > 个人资料 > 所有服务 > 与 iPhone 或 iPad 配对」菜单中,除现有的 eSIM 传输外,新增了无线数据传输方式。
值得注意的是,用户需输入会话 ID 与密码以完成设备间的配对,且目标 iPhone 必须运行 iOS 26 才能使用。
此外,在设备初始设置过程中,当用户选择「使用 Android Switch 复制数据」并指定恢复来源为 iPhone 或 iPad 时,也会出现该选项。
目前,该功能仍在开发阶段,预计将首先在未来的 iOS 26 开发者测试版与 Android Beta 中上线,随后逐步推送至正式版本。

据网易科技报道,日前在 2025 冬季「奇绩创坛路演日」上,微软小冰创始人李笛以新身份亮相,宣布成立新公司「明日新程」(Nextie)。这是他在今年 4 月离开小冰后首次以创业者身份出现。
李笛表示,「明日新程」定位于群体智能与认知大模型,旨在解决现有人工智能在认知上的缺陷。
他强调,认知而非知识才是大模型的核心,过多的知识反而会拖累模型的认知能力。团队已整理 1800—2020 年所有人类论文,形成 220 年群体智能演化史,为技术构建提供参考。
新公司核心成员包括小冰联合创始人、前微软首席研发总监曾敏,以及小冰大模型与算法负责人、前英特尔架构师王文斓。
目前团队规模约 30 人,主要由原小冰核心成员组成。李笛透露,团队已完成基础技术内测,预计将在 2026 年 1 月 7 日正式上线。
在融资方面,「奇绩」已参与投资,公司计划启动下一轮千万美元融资。
李笛指出,未来不会采用按 token 计费模式,而是根据交付物价值定价。他更倾向于 To C 市场,但产品也可覆盖 To B 与 To G。
李笛认为,当前 AI 行业格局尚未确定,既没有成功的 To C 产品,也没有明确的 To B 商业模式。
他指出,现有智能体存在认知缺陷,擅长做题但不擅长思考与执行,这一问题亟待解决。同时,他坦言行业存在泡沫,但关键在于能否实现「软着陆」,转化为实体经济。

据彭博社报道,社交平台 Reddit 正在全球范围内为未满 18 岁用户推出新的安全功能,包括更严格的聊天设置和个性化广告限制。
值得注意的是,此举正值澳大利亚即将实施社交媒体未成年人禁令之际。
根据新规,从当地时间周三起,澳大利亚将禁止 16 岁以下用户使用 TikTok、Instagram 等热门平台,违规者可能面临最高 4950 万澳元(约 2.3 亿元人民币)的罚款。
Reddit 表示,新功能将自动应用于被系统识别为未成年用户的账户。与此同时,澳大利亚用户在注册时需提供出生日期,并接受年龄预测模型的验证。
除 Reddit 外,Meta、字节跳动旗下 TikTok、Snap 等公司也将遵守相关法律。
值得注意的是,Reddit 对部分要求提出质疑,称法律对其平台的适用「武断」且「法律上存在错误」,强调其大多数用户为成年人。
然而,禁令尚未全面实施,澳大利亚用户已开始转向未受影响的平台。例如,小红书在 12 月 1 日当周的活跃用户同比增长 37%,美国初创平台 Coverstar 在澳大利亚的使用量更是激增 488%。

据《商业内幕》报道,电影《大空头》原型人物迈克尔・伯里 (Michael Burry) 近日在创作平台 Substack 上开设专栏,并在社交平台 X 上连续发文,重申其对当前 AI 热潮的悲观判断。
他直言,OpenAI「就是下一个网景,注定失败,它正在大量烧钱」。
伯里在上周五晚间回应 Salesforce CEO 马克・贝尼奥夫 (Marc Benioff) 关于大语言模型的帖子时作出上述评论。
他指出,微软正在努力维持 OpenAI 的运营,同时将其保持在资产负债表之外,并吸收其知识产权。他质疑为何 OpenAI 能持续获得融资,并强调「整个行业需要一场 5000 亿美元的 IPO」。
在随后一天的另一条帖子中,伯里补充称,即便 OpenAI 筹集 600 亿美元资金,也「远远不足以」满足其现金需求。
他将 OpenAI 与上世纪 90 年代中期的网景相提并论,认为其可能重蹈互联网泡沫时代的覆辙。网景曾是全球最广泛使用的浏览器,也是当时最具价值的互联网公司之一,但最终成为盛极而衰的典型案例。
此外,伯里近期还对英伟达提出批评。他在上月披露了做空仓位,并指责英伟达在全球范围内囤积 GPU。


昨天,智谱 AI 宣布正式开源 AutoGLM 项目,旨在推动「会用手机的 AI Agent」成为行业公共底座。
智谱强调,开源的目的在于让 AI 手机能力成为行业共享资源,避免被少数厂商垄断。此外,开源也意味着隐私与控制权回归使用方,企业与开发者可在自身环境中部署,确保数据安全。
智谱指出,AutoGLM 并非最终答案,未来 AI 手机生态仍有更广阔的可能性。团队将持续推动 Agent 技术发展,期望在未来十年实现「人人身边的贾维斯」。
💻 GitHub:https://github.com/zai-org/Open-AutoGLM
🤗 Hugging Face:https://huggingface.co/zai-org/AutoGLM-Phone-9B
👾 ModelScope:https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B

昨天,摩尔线程宣布其首届 MUSA 开发者大会(MUSA Developer Conference,简称 MDC 2025)将于 12 月 19 日在北京中关村国际创新中心开幕,为期两天,并将在会上重磅发布新一代GPU架构。
官方表示,作为国内首个聚焦全功能 GPU 的开发者盛会,本次大会以「创造、链接、汇聚」为核心理念,旨在推动国产智能算力的突破与产业升级。
大会将设超过 20 场技术分论坛,议题覆盖智能计算、图形计算、科学计算、AI 基础设施、端侧智能、具身智能及开发者工具与平台等关键领域,推动前沿技术与产业实践的深度融合。
同时,摩尔线程还将联合生态伙伴打造超过 1000㎡ 的沉浸式「MUSA 嘉年华」,现场展示 AI 大模型、具身智能、空间智能等前沿技术,并延伸至工业智造、数字孪生、数字文娱与智慧医疗等应用场景。

昨天,在鸿蒙智行央视新闻《超凡一步》节目中,鸿蒙智行旗下首款 MPV 正式官宣。
与此前传闻的「智界 X9」不同,新车官方命名为「智界 V9」,预计将于明年春季首发。
据官方此前预热,这款旗舰车型基于华为 DriveONE 800V 碳化硅黄金动力平台,配备 192 线激光雷达与华为巨鲸电池,定位为鸿蒙智行「9 系」旗舰 MPV。
网传图片显示,该车延续鸿蒙智行家族式前脸设计,并在智能座舱与智驾系统方面实现更高适配度。
华为技术有限公司常务董事、终端 BG 董事长余承东也在微博表示,智界 V9 的命名寓意为「Victory」与旗舰定位的「9」,强调其高端市场战略。
🔗 相关阅读:鸿蒙智行首款 MPV 命名为「智界 V9」,余承东:超越市面上所有旗舰

昨天,在浙江杭州举行的「2025 酷+大会」上,群核科技联合创始人兼 CEO 陈航发表主题演讲,并宣布系统性开放其底层空间智能能力,旨在推动该技术在千行百业的加速落地。
群核科技的战略是提供可落地的空间智能能力,不仅实现高保真可视化,还能输出结构化空间数据。在算力受限的现实条件下,公司通过生成、仿真等多元技术组合,更高效连接物理世界与数字世界。
在大会上,群核正式发布 Aholo 空间智能开放平台,开发者可通过 API/SDK 调用重建、生成、编辑与理解等能力,构建全息 3D 空间应用。
平台目前已开放内测,群核强调其目标是推动空间智能技术赋能家居、影视、广告、游戏、机器人等多个行业。
此外,群核还展示了多项产品化成果,这些产品已在家居、工业制造和机器人训练等领域落地应用:
陈航表示,群核科技希望成为空间智能时代的「卖水人」,通过开放生态与行业伙伴共建未来,推动空间智能在千行百业的商业化价值实现。

昨天,蚂蚁集团宣布旗下全模态通用 AI 助手「灵光」正式上线网页版,进一步完善其多端生态布局。用户可通过浏览器直接访问,在电脑端体验核心功能「灵光对话」与「灵光闪应用」。
灵光网页版延续了「30 秒用自然语言生成小应用」的核心优势,并实现与移动端的数据与创作同步。用户可在电脑端描述需求,快速生成、编辑并管理对话与闪应用,并在手机端继续使用和分享。
💻 试用链接:https://www.lingguang.com


昨天,星巴克宣布与哈利 · 波特的联名活动在全国门店正式上线,借助魔法主题饮品、周边与沉浸式门店场景,为顾客营造浓厚的节日氛围。
本次合作以「魔法庆典」为主题,推出三款限定饮品,饮品灵感均源自哈利 · 波特故事情节,结合芝士牛乳、果酱与咖啡,呈现独特风味体验:
消费者在购买联名系列新品时,有机会获赠魔杖摆件、徽章(12 月 16 日起)或贴纸(12 月 23 日起)等限定周边,魔法学院杯套及限定纸袋也已上线。
此外,至本月 29 日,星巴克还在全国 27 座城市的近 40 家门店开启哈利 · 波特主题店,供消费者体验打卡。

据中新网和新黄河报道,昨日凌晨,深圳一名消费者称,其在使用山姆会员商店「极速达」购买的麻薯盒中发现有活老鼠,并在社交平台发布相关图片,引发广泛关注。
图片显示,一盒麻薯中出现老鼠踪迹,部分麻薯表面存在明显凹陷。
对此,山姆方面回应称,已第一时间联动专业虫害公司开展全链路排查,经回溯商品制作、包装、仓库上架及拣货环节,均未发现虫害痕迹或异常。
山姆称,该订单地址的取货点位于室外,第三方虫害技术人员在取货点现场勘察时发现,周边花木丛为野生虫害提供栖息条件,并确认存在相关活动痕迹。综合调查结果,初步判断商品在取货点放置期间遭遇虫害偶然侵入。
目前,山姆已与消费者沟通并妥善解决此事,后续将加强包装管理与配送环节的防护措施,以降低类似风险。
山姆会员商店隶属于沃尔玛集团,自 1996 年进入中国市场以来已在全国开设超过 50 家门店。

财联社援引国家药监局此前发布的通知报道称,自 2026 年 1 月 1 日起,我国将全面禁止生产含汞体温计和含汞血压计产品。这一政策意味着水银体温计将正式退出历史舞台。
水银体温计因测量精准、价格低廉,长期以来在市场上颇受欢迎。
然而,汞作为有毒可挥发重金属,一旦泄漏会对人体健康和环境造成严重危害。
据苏州市人民政府发布的一篇文章,研究显示,一支水银体温计摔碎后,室内汞浓度可在短时间内升高近百倍,即使通风也需一个月才能恢复。
事实上,早在 2017 年,《关于汞的水俣公约》已在我国生效,明确要求自 2026 年起禁止生产含汞体温计和血压计。
国家药监局在 2020 年发布的相关通知进一步落实了这一要求,规定相关产品的注册证有效期不得超过 2025 年 12 月 31 日。
业内专家指出,随着禁产政策落地,电子体温计、红外额温枪、耳温枪等产品将逐步替代水银体温计,而电子血压计也将成为含汞血压计的主要替代方案。
这些新型设备在测量精度、使用便利性和安全性方面均具备优势,符合未来医疗器械的发展趋势。


成龙主演的跨年合家欢影片《过家家》昨日发布特别预告及角色海报,影片已定档 2026 年 1 月 1 日全国上映。
预告片展示了他孤独的日常:独自体检、独自吃饭、独自失眠,仿佛在诠释「我总是一个人在练习一个人」。然而,随着一群陌生人意外闯入他的生活,这个孤单的老人逐渐被卷入一个充满笑与泪的「过家家」故事。

电影《空枪》昨日正式官宣部分阵容,导演韩延携手多家实力主创团队,力求打造一部兼具品质与深度的犯罪剧情片。
在最新发布的阵容海报中,鎏金砖块层层堆叠,象征极致财富与欲望的诱惑,暗示故事核心围绕「欲望之城」的复杂博弈。

昨天,恐怖惊悚电影《星际变种》正式官宣定档 12 月 31 日跨年上映。影片以远古恶灵为核心元素,结合怪物设定与悬疑剧情,力图打造跨年档唯一的国产恐怖惊悚大片。
影片故事围绕主角雷杰米展开,他自始至终被远古恶灵纠缠,接连目睹身边人惨死。与女医生卢娜联手调查后,逐步揭开与童年母亲死亡相关的秘密研究。
在上个月底的享界 S9 发布会尾声,余承东带来了一个「One more thing」——鸿蒙智行首款旗舰 MPV 将落地智界。
而在刚刚「鸿蒙智行 超凡一步」的直播中,余承东和奇瑞董事长尹同跃宣布这款 MPV 正式被命名为智界 V9。

这也意味着,鸿蒙智行的产品线将将进一步拓展,覆盖轿车、SUV、旅行车、MPV 等多个细分品类。
根据直播中和近期谍照中透露的信息,智界 V9 在鸿蒙智行体系中属于旗舰级定位。
智界 V9 车长约 5.3 米,轴距或接近 3.2 米,与岚图梦想家(车长 5315mm)处于同一量级。车身造型整体偏方正,且采用了双电动侧滑门的设计,空间表现和使用便利性应当有保障。

在具体的座舱配置上,直播中透露智界 V9 将配备主副驾双零重力座椅、后排双抽屉、电吸电弹前备箱三项亮点配置。
而从前段时间的谍照中还可以观察到智界 V9 采用了一块横贯主副驾的大连屏,整合仪表、中控与副驾娱乐功能。相比起问界 M9 屏幕,V9 的这块屏幕似乎一体化程度更强,边框更窄,或许采用了华为自研的车规级 OLED 面板。

新车的中控台则是极简风格,配备电子怀挡、双无线充电面板和优化储物格。二排座椅则配备了多向电动调节、加热、通风功能,扶手后方疑似设置了一块触控屏来控制空调与影音。门板内侧则设计了一个旋钮,猜测智界 V9 的二排座椅或许可以支持 360 度旋转,与第三排形成对坐布局。此外,车顶横梁预留位被猜测用于安装后排屏幕。

从车内配置来看,智界 V9 的目标客户似乎并不局限于家庭用户,而是更多希望拓展到商务、聚会等更广泛的出行群体。
动力方面,智界 V9 已经确定将提供增程和纯电两种版本,增程器可能沿用与智界 R7 一致的 1.5T 四缸发动机,纯电版本的 CLTC 续航预计超 600 公里。
而在智能化的部分,智界 V9 将使用一枚 192 线的激光雷达,毫无疑问将搭载乾崑智驾 ADS 4 和鸿蒙座舱 5。

对于智界而言,V9 或许是其冲击高端市场的又一次宝贵机会。
目前智界有两款在售车型,轿车 S7 与中大型 SUV R7。
其中 S7 自上市以来始终未能站稳脚跟,近半年仅售出了 5866 辆,基本退出主流高端纯电轿车竞争序列。反倒是 R7 的表现相对亮眼,以 3 万多辆的成绩排在整个鸿蒙智行体系中的第 4 位。
但只凭借 R7 一款车型,显然难以在激烈的价格战和竞品围剿下突出重围,不仅既无法满足商务接待、多人家庭出行等高价值场景需求,也难以在用户心智中建立高端品牌的完整认知。

正因如此,奇瑞正在以前所未有的力度集中资源来支持智界。
(今年智界)最大的变化是——我听余承东的。
除了暂停原定由星纪元进行的高端 MPV 项目,转而将其交由智界开发外,奇瑞董事长尹同跃还表示奇瑞将在智界品牌上累计投入超 100 亿元资金,并组建一支超过 5000 人的专属研发团队,涵盖智能驾驶、电子电气架构、热管理、座舱生态等核心领域。这一投入强度远超星途或星纪元历史任何项目,甚至接近整个 EXEED 品牌三年的研发总和。

这种史无前例的支持力度背后,是奇瑞和智界对过往双线战略失败的深刻反思。
与智界同期推出的星纪元 ES/ET 系列,与智界 S7/R7 共享平台、动力总成甚至部分供应链,但在营销体系、渠道归属和品牌调性上却各自为战。结果就是导致终端价格混乱、用户认知模糊。2025 年上半年数据显示,星纪元 ES 月销长期徘徊在 1000 辆上下。双线作战并未带来 1+1>2 的效果,反而稀释了本就有限的研发与营销资源。
如今随着资金、团队与独立性的全部到位,奇瑞又迎来了一次机会,而 MPV,正是当前最合适的突破口。

▲ 星途目前的车型序列
MPV 在中国市场是个相对特殊的存在。
在新能源浪潮兴起之前,这一细分市场几乎被丰田、别克等合资品牌垄断,用途也高度集中于公务与商务场景。近年来,随着国产高端 MPV 的崛起,国产品牌开始加速切入中高端市场。然而,与家用 SUV 或轿车领域不同,MPV 市场并未出现国产对合资的「碾压式」替代,而是呈现出多方势力交织、势均力敌的格局。
无论是中国品牌与海外品牌的竞争,家用导向与商用导向的博弈,还是燃油车与新能源车的较量,目前都还处于胶着状态。
数据显示,近半年 MPV 销量冠军仍是丰田赛那,累计售出 46158 辆;别克 GL8 新能源与丰田格瑞维亚销量也均突破 3 万辆,与魏牌高山、腾势 D9 等国产新锐车型差距并不显著。

▲ 近半年的 MPV 销量榜前 6 数据来源:汽车之家
MPV 的核心价值固然在于空间,但要在激烈的竞争中脱颖而出,仅靠「大」远远不够。真正的胜负手,在于能否在空间基础上,叠加更多维度的差异化优势。
传统合资品牌走的是「空间 + 品牌溢价」路线;而国产品牌则尝试了多种组合策略——「空间 + 豪华」、「空间 + 节能」、「空间 + 场景化体验」,以及「空间 + 智能化」。然而至今,尚未有一款车型能在这些维度上做到全面领先、无懈可击。
因此,下一阶段 MPV 市场的破局点,或许就取决于是否会出现一款真正能够打破现有平衡、定义新标准的标杆产品。
那么问题来了:
这台集鸿蒙生态、华为智驾、奇瑞制造与旗舰定位于一身的智界 V9,会成为那个引领变革的「答案」吗?

这一次告白,我不要猜你喜欢
🍎
苹果芯片高管否认离职传闻
🔥
11 月被投诉钓鱼网站 TOP10 公布,腾讯、苹果中招
🐂
DeepSeek 创始人入选《自然》年度十大科学人物
📉
iPhone 17 Pro 系列官方降价 300 元
💰
罗永浩:手里有钱不排除重新启动做手机
🛰
马斯克最新设想:每年发射百万吨级卫星来扩张 AI 算力
✈️
影石创始人:影翎无人机可对标友商主流机型
😯
原字节高级公关总监加入理想汽车
💸
多个中国厂商入围全球手游发行商收入前 100
💡
Google DeepMind CEO:扩大 AI 规模是实现 AGI 的关键
👓
Google 公布 XR 设备路线
✍️
微信公众号大更新:文章支持 3 次修改
📱
vivo S50 系列将于 12 月 15 日发布
🔙
经典版 QQ 回归


近日有消息称,负责硬件技术的苹果高级副总裁 Johny Srouji 最近告诉库克,他正在「认真考虑」在不久的将来离职。
对于上述消息,Srouji 表示自己目前依然会留在苹果。其在部门内部的备忘录提到,大家都很关注他在苹果的未来发展猜测和谣言,同时也需要直接听到他自己的「声音」。
Srouji 强调,他爱自己的团队,并且也热爱在苹果工作,「我短期内没有计划离开苹果」。
据悉,Srouji 是苹果最受尊敬的高管之一,也是苹果自研芯片战略的操盘手。
作为苹果自研芯片战略的核心人物,Srouji 是 M 系列和 A 系列芯片的最大功臣之一,让苹果在性能和能效方面获得了对竞争对手的巨大优势。
据彭博社上周报道,库克以及整个苹果高管层都在疯狂挽留 Srouji,包括提供更加丰厚的薪酬待遇,以及许诺在未来给他更多职权。
公司内部一些高管提出的方案是,将 Srouji 提升为首席技术官,负责硬件工程和芯片技术的大部分工作——这将使他成为苹果第二有权势的高管。 而这也是非常「反传统」的做法:苹果历史上从未设立过正式的 CTO 职位。


日前,中国互联网协会原因 12321 网络不良与垃圾信息举报受理中心数据,据 12321 接到网民投诉的短信、邮件、网站等信息,2025 年 11 月被投诉的钓鱼网站前十名如下:
经核实,不法分子炮制逼真的山寨网站对广大用户实施钓鱼诈骗,是一种常见诈骗伎俩。用户如果访问这些钓鱼网站,并按照网站提示填写真实信息,将导致个人信息或银行卡信息被盗,或被对方以所得税、保证金、手续费等借口让你转账汇款来骗取钱财,进而蒙受经济损失。
12321 受理中心提醒,如果收到相关的诈骗钓鱼短信,不要打开短信中的链接、泄露自己的个人信息,更不要被骗子「法院起诉」短信威胁所吓倒。
同时 12321 再次提醒曾经丢失过苹果手机的用户,Apple 安全中心不会主动发送遗失找回短信、邮件和打电话,切勿上当受骗;建议向「官方网站」咨询或向 12321 受理中心投诉。

今天凌晨,《自然》杂志公布了 2025 年度十大人物榜单(Nature’s 10)。
据悉,该榜单由《自然》杂志编辑团队评选,旨在突出最具影响力的研究以及正在塑造世界的重要发展。入选者方面:

同时,《自然》还公布了值得关注的 2026 年人物,包含医学肿瘤学家 Georgina Long、索尼 AI 的全球人工智能治理负责人 Alice Xiang 等。

昨日,Apple Store 天猫官方旗舰店渠道宣布,限时调整 iPhone 17 Pro 系列价格:
iPhone 17 Pro/Pro Max 均限时直降 300 元。
具体来看,原价 8999 元起的 iPhone 17 Pro 现到手价 8699 元起,而原价 9999 元起的 iPhone 17 Pro Max 到手价降为 9699 元起。
而在昨日,「iPhone 17 Pro 系列破发」相关话题也登上热搜。其中也有不少网友表示「没降到位」「我是差那 300 元吗?」。
据博主「数码闲聊站」此前消息,iPhone 17 系列目前已完成中国市场 1000 万的激活量。
而机构「Counterpoint」也曾指出,iPhone 17 系列在中美两地都广受欢迎,吸引了不少用户升级,因此两地市场的年销售额都实现了两位数增长。
机构还指出,苹果的顶级智能手机销售商地位将会保持到 2029 年;接下来,将于明年发布的折叠屏 iPhone 以及 2027 年全新设计的 iPhone 都还会继续扩大优势。

日前,罗永浩在极客公园的 IF 2026 活动上,分享了自己对于手机、播客、AI 等行业的各种看法。
面对比工业革命还宏大的 AI 浪潮,罗永浩直言,「这轮要是做不出来,就没借口了」。未来十年,手机依然不会被取代,而罗永浩也依然没准备退场。
罗永浩表示,现在如果创业公司做出好的东西,跟巨头感兴趣的方向一致,大部分是被「抄死」,而不是被收购。其透露,尽管锤子科技倒闭 7 年,但(去年)依然有百万以上的日活用户数。
对于是否还会入局手机行业,罗永浩则表示「一直有人要投资,我也不敢再做手机了,怕把别人的钱赔光了。」同时他也称「如果我们做了一堆东西,取得了很大成功,手里有大把自己的钱,也不排除重新启动做手机。」
随后,罗永浩表示自己与团队在想,能不能在做这个的过程中,把「巨头」里的某一个给绑架进来。「如果成了,我是不是老板其实没那么介意,我只希望这个产品在一个正确的方向做对了。」
同时,面对目前「不再创新」的局面,罗永浩表示希望任何一家能把 AI 手机尽快做出来造福人类。其更是感叹「甚至如果是烧我自己的钱,我都愿意打版一个全世界最好的 AI 手机,然后让他们抄我,我倒闭,我都愿意。」

近日,马斯克在 X 上提出设想,计划通过每年发射百万吨级卫星来扩张全球 AI 算力。
他表示,未来 3 年内,具备本地化 AI 计算能力的卫星,只需从低延迟、太阳同步轨道传回结果,将成为生成 AI 比特流的最低成本方式;在 4 年内,这也将是扩展速度最快的路径。
马斯克指出,地球上易获取的电力资源已趋紧张,而通过在轨部署卫星,每颗配备 100kW 功率,可实现每年新增 100GW 的 AI 算力,且无需运营或维护成本。这些卫星将通过高带宽激光与 Starlink 星座连接,形成大规模计算网络。
更进一步,他提出在月球建立卫星工厂,利用质量驱动器(电磁轨道炮)将 AI 卫星加速至月球逃逸速度,无需火箭发射。该方案有望扩展至每年超过 100TW 的 AI 算力,并推动人类迈向卡尔达肖夫二级文明。
马斯克补充称,一旦月球工厂、机器人和驱动器形成闭环系统,该体系可能会脱离传统货币,以「瓦特」和「吨」为单位自主运行。
与此同时,马斯克还在另一则帖子中强调,芯片每万亿次操作的成本将在未来几年内骤降数个数量级,这意味着 AI 训练成本将显著降低,AI 算力也将走向普及化。
此前,他还预测,得益于太阳能与辐射冷却,未来 4~5 年内在太空运行大规模 AI 系统的成本将低于地球同类系统。

据 IT 之家消息,昨晚,影石创始人刘靖康发布内部信。
针对近日影翎无人机新品遇冷的消息,刘靖康在内部信中回应称:「影翎仅中国区 48 小时就卖了 3000 多万元,且多个海外市场目前正在进行认证流程,很快也将上市。影翎展现的全球市场潜力,可以对标友商一款主流成熟机型。」
在内部信中,刘靖康还表示,在供应链方面,临近飞机上市前半年,影石影翎多家核心供应商突遭「排他」压力,公司凭借预案在极限时间内切换供应链,守住了产品生命线。
刘靖康称:「这已不是我们第一次面对此类不公正的排他手段。这些非常规、密集的攻击,恰恰说明我们所做的事情,的确触动了某些现有格局。」
其认为,「我们受到的攻击越猛烈,越能说明我们方向的正确性,和对已有体系实现颠覆的可能。」
刘靖康还在信中谈到,全景无人机之于传统无人机是如同汽车之于马车的革命性品类。他表示,公司超过 70% 收入来自原创品类,将继续专注于通过技术创新解决无人解决的问题,服务好客户是长期唯一需要关注的事。
日前,影石正式发布影翎 A1 全景无人机,并成为全球首款全景无人机,其支持 8K 全景视频录制,能够体感操控,售价为 6799 元起。
据电车界报道,前字节公关总监杨继斌昨日(12 月 8 日)在朋友圈宣布,离开字节跳动,加入理想汽车。
杨继斌表示,本月正式加入了理想汽车。虽未透露职位,但报道猜测应该为公关一号位。
报道指出,杨继斌在网上个人资料极少,曾在字节跳动多年,参与过字节和腾讯的头腾大战。
内部人士透露,其在去年 9 月已经离开字节公关部,转为顾问,据说陆续参与了包括小米在内的一些科技公司面试。该传言未经本人证实。

日前,Sensor Tower 商店情报平台显示,2025 年 11 月共 33 个中国厂商入围全球手游发行商收入榜 TOP100,合计吸金 19.5 亿美元,占本期全球 TOP100 手游发行商收入 35.8%。
具体来看:
具体游戏方面:

12 月 8 日,智元(AGIBOT)量产工厂内,在新华社等多家媒体的直播见证下,智元联合创始人、总裁兼 CTO 彭志辉宣布:
第 5000 台通用具身机器人——灵犀 X2 正式量产下线。
现场同步公布智元三大产品系列累计出货数据:远征 A1/A2 下线 1742 台,灵犀 X1/X2 下线 1846 台,精灵 G1/G2 下线 1412 台。这一里程碑标志着具身机器人已从技术验证阶段全面迈入规模商用时代。
据悉,这台具有纪念意义的第 5000 台机器人,由彭志辉亲手交付给知名演员黄晓明的工作室。
黄晓明透露,自己与智元的结缘始于综艺《中餐厅》,节目中远征 A2 机器人小玖的陪伴让他深刻感受到中国机器人技术的强大,后续与智元团队的深入接触,让他决定为工作室添置一台机器人,紧跟具身智能的科技浪潮。
彭志辉强调,第 5000 台通用具身机器人量产下线,不仅验证了智元自身的规模化交付能力,为后续万台、十万台级产能规划奠定基础,更向全行业证实了通用具身机器人规模化量产的可行性。
同时,稳定的技术方案与供应链体系将带动行业成本进入下降通道,而规模化应用沉淀的海量数据,还将反哺技术迭代,吸引更多开发者与合作伙伴加入生态,推动产业进入良性发展周期。
日前,高盛在最新发布研报指出,虽然苹果在 Apple Intelligence 方面尚未取得实质性进展,但主要的中国智能手机品牌均已嵌入了由自研 LLM 和/或第三方 LLM 驱动的 OS 原生 AI 助手。
据悉,这份报告对中国 AI 厂商字节旗下豆包、小米和阶跃星辰进行了重点解读。
高盛认为,刚刚发布的豆包手机助手通过与智能手机 OEC 厂商合作实现了系统级整合,结合近期豆包发布的输入法产品,体现了字节向移动互联网基础设施和智能手机生态系统扩张的意图。
同时,高盛对小米 AI 布局进行了重点分析,指出小米在 GUI 方面投入巨大,旗下 AI 智能体超级小爱与 OPPO、华为助手并列中国前三大 OS 原生 AI 助手,在小米智能手机 MAU 中的渗透率为 71%。
高盛还提及了大模型厂商阶跃星辰近期开源了 GUI 智能体 Gelab,可在本地部署,且在多项基准测试中达到 SOTA(最先进水平)。据了解这家公司还曾与中兴合作面向老年人的手机助手,并与荣耀、OPPO、等国产手机厂商开展 AI 手机功能合作。

据《商业内幕》报道,Google DeepMind CEO 德米斯・哈萨比斯(Demis Hassabis)近日在旧金山举行的 Axios AI+ 峰会上强调:
人工智能(AI)的规模化发展必须「推向极致」,这是实现通用人工智能(AGI)的关键路径。
哈萨比斯指出,规模定律(scaling laws)是 AI 进步的核心原则,即「模型越大、数据越多、算力越强,智能水平就越高」。
我们必须把当前 AI 的规模化推向极致,它至少会成为通用人工智能的关键组成部分,甚至可能构成整个 AGI 系统。
AGI 被视为能够像人类一样进行推理和规划的理论型智能系统,是全球科技公司竞相追逐的目标。
不过,哈萨比斯也承认,仅靠规模定律可能不足以完全实现 AGI,未来或许还需要「一到两个额外的突破」。
他强调,规模化存在现实限制:公开数据量有限,增加算力意味着建设更多数据中心,不仅成本高昂,还会对环境造成压力。
与此同时,业界也出现了不同声音。
前 Meta 首席 AI 科学家 Yann LeCun(杨立昆)认为,规模定律并非万能。他在今年 4 月新加坡国立大学的演讲中指出:「大多数真正有趣的问题在规模定律下表现得极其糟糕,你不能简单地认为堆数据和堆算力就能产出更聪明的 AI。」
此前,LeCun 已离开 Meta 创办新公司,致力于研发基于空间数据的「世界模型」,旨在打造能够理解物理世界、具备持久记忆和复杂推理能力的新一代 AI 系统。

今天凌晨,Android Show 活动正式举行,Google 在活动上正式披露了他们眼中四种 XR 设备路线:
XR 头显设备、有线 XR 眼镜、无线 XR 眼镜、无线 XR 眼镜
其中,硬件的核心——Android XR 系统于去年年底首次正式公布。而 Google 强调,为 Android 开发,就是在为 Android XR 开发,后者可以直接兼容使用 Google PlayStore 上的大部分手机和平板应用。
据悉,Android XR 的号召力比 Meta Horizon 平台更强,也比苹果更开放,这意味着未来将有更多第三方厂商开发 Android XR 设备,蛋糕越做越大,XR 应用和内容的生产者更愿意加入生态。
硬件方面:

该产品于今年 5 月首次亮相,与国内 AR 眼镜厂商 XREAL 合作打造。
其为一款「有线 XR 眼镜」,以眼镜这种轻巧方便的形式,实现类似头显的双目 XR 效果。Aura 支持和头显一样的手势交互,并带有透视效果,用户能够看到周围环境,应用界面投射其上。
Aura 实现了 70° FOV,为消费级 AR 的最大实用视场,能够让 Gemini 助手更好地与真实世界进行互动,也能获得沉浸式的观影体验;性能方面则采用了三星 Galaxy XR 同款高通骁龙 XR2 Plus Gen 2 芯片组。

Google 宣布了这类产品将与 Warby Parker 以及 Gentle Monster 连个传统眼镜潮牌合作。
第一款眼镜,是类似 Ray-Ban Meta 的最基础形态,我们称之为「AI 眼镜」不带任何显示屏,用户可以用眼镜和 Gemini 沟通、拍照、听歌。这种产品虽然不是真的「XR」眼镜,却是大众接受度最高的品类。
Google 更看重的是第二款,其实就是在第一款的基础上增加单目 AR 显示屏,用来显示一些简单的卡片和组件,类似 Meta Ray-Ban Display,这也是今年 I/O 大会上进行过演示的品类。
值得一提的是,Google 向 The Verge 透露,为了更多人使用眼镜的多模态能力,明年 Android XR 眼镜还会支持 iOS。

据爱范儿观察发现,微信公众号日前悄悄更新了文章修改规则:
每篇内容可修改 3 次,支持对标题、正文文字、图片、视频、封面及摘要进行修改。
具体规则方面:

昨日,vivo 正式宣布,将于 12 月 15 日发布旗下 vivo S50 系列新机。
新机共有两个版本:标准版与 Pro mini 版本。外观设计上,标准版将采用矩形相机 Deco 设计,而 Pro mini 将采用「浮空岛」镜组设计。vivo S50 系列均提供航空铝金属中框,并且提供「告白」「悠悠蓝」等配色。
vivo S50 系列将提供后置三摄方案,全系搭载索尼 IMX882 大底潜望长焦;性能方面,Pro mini 将搭载高通骁龙 8 Gen5 处理器,配备 LPDDR5X Ultra + UFS4.1。
另外,新机还将配备 3D 超声波指纹 2.0、IP69 + IP68 级满级防水,Pro mini 支持 40W 无线闪充。

昨日,五菱汽车宣布,将在今日公布星光家族首款硬派 SUV 车型,并号称「新成员硬核来袭」。
从今年 7 月工信部《道路机动车辆生产企业及产品公告》(第 397 批)的车辆新产品公示清单中获悉,新车名单中有一款与海报中车型外观相似的全新 SUV 车型。
工信部信息显示,新车将提供纯电、插混、燃油三个动力版本,尺寸为 4745 x 1850 x 1755/1770mm,轴距 2810mm,提供 5/7 座。
动力方面,纯电版新车采用柳州赛克 100kW 功率电机;插混及燃油版分别采用柳州赛克的 1.5L 型号 LBG 发动机(78kW)和 1.5T 型号 LC4 发动机(130kW)。

昨日,梅赛德斯-奔驰正式发布了新一代的 GLB SUV 车型,先看价格:
起售价为 5.9 万欧元(约合人民币 48.59 万元),目前提供纯电版本,未来还将提供 1.5L 轻混四缸汽油版。
新车前脸采用全新的贯穿式灯组设计,与新款 CLA 保持相同风格。尾部同样采用贯穿式灯组设计,并且前后均有三叉星徽元素。
新一代 GLB 轴距增加了 60mm,达到 2889mm,车身长度则增长至 4732mm。因此,新车第三排有了更宽敞的空间表现——官方表示能够容纳 1.71m 身高的乘客。
内饰方面,新车采用新一代 MBUX 车载系统,可选装三联屏(中控屏及副驾娱乐屏均为 14 英寸)。同时,新车提供机械式前备箱、前排按摩。
性能方面,新一代 GLB 采用 800V 架构,提供后驱及四驱两个版本,分别为 260 匹马力和 349 匹马力;新车配备 85kWh 电池,支持最高 360kW 直流充电,续航最高可达 631km。
燃油版车型将在明年稍晚推出,搭载 1.5L 轻混四缸汽油机,共三种输出设定:134 匹前驱、161 匹前驱与 188 匹四驱。轻混系统包括 1.3kWh 电池与 27 匹电动机,集成在自动变速箱中,可在低速短距离纯电驱动。

昨天,智谱官方宣布正式开源 GLM-4.6V 系列多模态大模型,包括面向云端高性能场景的 GLM-4.6V(106B-A12B)与面向本地部署与低延迟的 GLM-4.6V-Flash(9B)。
据介绍,这一版本在多模态能力上实现了显著突破,能够从「看懂图片」到「自动完成任务」,展现出更强的理解与执行力。核心升级包括:
官方强调,通过开放模型能力,智谱希望加速 AI 在教育、科研、工业等领域的应用扩展。目前,GLM-4.6V 系列模型的权重、推理代码与示例工程已开源。
💻 GitHub:https://github.com/zai-org/GLM-V
🤗 Hugging Face:https://huggingface.co/collections/zai-org/glm-46v
👾 Model Scope:https://modelscope.cn/collections/GLM-46V-37fabc27818446


近期,有不少消费者发文吐槽,盒马的草莓盒子蛋糕出现「超级咸」的情况。
据老板联播报道,有消费者描述,蛋糕的奶油部分正常,但蛋糕胚却「咸得发苦」,怀疑在生产过程中误将糖替换为盐,网友调侃「人怎么能闯这么大的篓子」。
据悉,出现问题的蛋糕售价为 79.9 元,多属于同一批次,生产日期为 12 月 5 日,并于 12 月 6 日上架销售。
对于上述情况,盒马客服回应称,据核实,该商品系个别原料操作偏差影响口感,涉及商品在 7 家门店售出约 60 份。我们对此深表歉意,已在第一时间完成排查与调整,目前针对当地已售商品进行顾客回访和补偿。

昨天,腾讯 QQ 宣布,PC 端 QQ 支持双模式切换。
据介绍,更新后的 QQ 将重新支持消息列表和聊天窗口分开,实现经典的 QQ 好友列表显示,并且能够消息栏贴边自动隐藏。
同时,新版 QQ 调色盘也将免费使用,支持多种主题色搭配、自定义主题/气泡等颜色。另外还支持批量导入表情包、导入历史版本聊天记录等。

日前,《鹅鸭杀》手游正式宣布,将于 2026 年 1 月 7 日正式上线。
据此前消息,本次《鹅鸭杀》国行手游与金山世游进行深度合作,并共同推出。
据悉,《鹅鸭杀》是一款休闲策略型社交推理游戏,通过阵营对抗、任务机制、角色多样性及强互动性,成为近年现象级的热门联机游戏。2023 年 1 月,《鹅鸭杀》的 Steam 同时在线人数峰值突破 70 万,且全球超 70% 玩家来自中国。

昨日,2025 洛杉矶影评人协会奖获奖名单正式公布:
据守望好莱坞援引 Deadline 报道,丹尼尔·卡卢亚透露,其正在开发的朋克蜘蛛侠单人电影,并即将完成第一版剧本;同时卡卢亚与与 Ajon Singh 将一起担任编剧。
据悉,这版 Spider-Punk/Hobie Brown 来自《蜘蛛侠:纵横宇宙》,由卡卢亚担任配音。以「酷酷的」拼贴画风登场,也会回归《蜘蛛侠:超越宇宙》。
对于朋克蜘蛛侠的单人动画电影的更多信息,卡卢亚还无法透露,只表示「正在进行中」,他也称:
这几部「蜘蛛宇宙」电影,它们于我有共鸣,给我灵感。我想这些电影人、动画人是这个领域中最好的故事讲述者,我想让自己置身于这样的环境之中,去学习他们的知识。

日前,DC 超级英雄新片《超女:明日之女》曝光先导预告,影片将于明年 6 月 26 日北美上映。
据悉,影片改编自汤姆·金的 DC 漫画,讲述氪星幸存者超级少女卡拉·佐-艾尔协助外星少女露西·玛丽·诺尔展开星际复仇的故事,塑造了在残酷环境中成长的硬核女英雄形象。
该片由克雷格·吉勒斯佩执导,奥托·班德、汤姆·金、安娜·诺盖拉、阿尔·派拉斯提诺联合编剧,米莉·阿尔柯克、杰森·莫玛、马提亚斯·修奈尔、伊芙·雷德利主演。
人形机器人的尽头,可能是一个戴着 VR 头显的人类。
最近,特斯拉在迈阿密办了场名为「Autonomy Visualized(自主能力可视化)」的活动,一台特斯拉人形机器人 Optimus 机器人站在摆满水瓶的桌子后面,正一本正经地给观众发水,看着像模像样。
然后,戏剧性的一幕出现了。

Optimus 突然把双手一抬,像极了人类快速摘下 VR 头显的姿势。紧接着,机器人就像突然断线了一样,踉踉跄跄往后倒,最后「啪叽」一声仰面躺地,水瓶散落一地。
这个动作之所以引发热议,是因为它太有辨识度了——我们摘头显时确实会沿脸两侧一抹,而 Optimus 的动作轨迹几乎一模一样。
于是网友迅速得出一个合理又刺眼的推测:背后有人在远程操控。
昨天,这段视频很快在海外各大社交平台疯传,评论区也随之沸腾。
大量网友把这个情节与《机械战警》《刀剑神域》等作品联系起来,嘲笑现实越来越像科幻片里机器人「拔线就挂」的桥段。
有人说操作员估计是真累了,忘了先让机器人断电,就自己先把头显摘了;还有人开始算账:马斯克要量产一百万台机器人,那是不是还得配一百万个操作员?否则谁来救场?
网友的调侃不无道理,都说机器人能取代人的岗位。现在看来,倒是有种科技树点歪的即视感,反而还需要人类倒反天罡地扮演机器人。

而事实上,这已经不是特斯拉人形机器人第一次被「抓包」了。
2024 年 1 月,马斯克在 X 上发了段 Optimus 叠衣服的视频,配文「Optimus 会叠衬衫了」。视频里机器人从篮子里取出 T 恤,在桌面慢慢折叠整齐,看起来动作流畅。

眼尖的网友放大视频发现,画面右下角一瞬间出现了一个机械手臂的影子,运动轨迹和 Optimus 的动作完全同步。后续马斯克自己跳出来泼冷水,承认这段视频「不是自主完成的」。
再往后是去年 10 月的「We Robot」活动。
多台 Optimus 以牛仔造型现身,给来宾端饮料、陪观众玩投球游戏、还能和人对话。但会后曝光显示,这些机器人的对话和动作主要由幕后工程师远程遥控辅助完成,而特斯拉并没有主动说明这一点。

科技博主 Robert Scoble 在现场提问后得知,机器人由人类「远程协助」控制。甚至有一台 Optimus 当场用笨拙的电子音坦承:「今天我有人类在协助,还不算完全自主。」
尽管争议频繁,马斯克对 Optimus 的信念从未动摇。
他在多个场合把这个项目提升到「改变世界」的高度。2024 年「We,Robot」发布会上,马斯克豪言 Optimus 将是用途极其广泛的通用机器人。
「它能做你让它做的任何事。可以当老师,帮你看小孩;可以遛狗、修剪草坪、买杂货;还能做你的朋友,给你端茶送水。无论你能想到什么,它都能去做。」
在上个月的股东大会上,他更是兴奋地表示:「一旦 AI 和机器人成熟,我们甚至可以把全球经济扩大十倍甚至百倍。Optimus 大规模应用就是那个无限增益的秘诀。也许到了那时候,『金钱』这种东西都变得多余。」

他预言 Optimus 将使未来工作变成可选项。
大多数人可以因机器人劳作而领取「普遍高收入」,进入一个「富足时代」,在这个时代,商品和服务的成本将无限趋近于零,贫困将不复存在。
如果这话换别人说,大概率会被当成中二病晚期;但马斯克说这话,大家会犹豫一下,怀疑是不是自己格局小了。
在商业价值上,马斯克毫不掩饰自己的野心。
他曾多次提出,Optimus 将在长期为特斯拉带来 10 万亿美元级别的收入机会。他还预测未来市场需求量可能达到 100 亿至 200 亿台,超过人类总人口,占据特斯拉市值的 80% 以上,甚至推动公司市值达到 25 万亿美元。
当然,特斯拉机器人技术进展也确实存在。
从 2021 年真人扮演的概念秀,到 2022 年能缓慢行走的原型,再到 2023 年 Gen 2 能煎鸡蛋的灵巧手,以及 Gen 3 每只手拥有 22 个自由度的版本,2.3 千瓦时电池、8 个摄像头配合 FSD 芯片的端到端神经网络,这些都是实打实的工程积累。
目前 Optimus 已经能独立行走、维持平衡、识别物体、单腿站立、拾取搬运,甚至在踩滑时及时调整姿态防止跌倒。上周丝滑的跑步视频可以说是相当丝滑。

再说,远程操控也不能一棍子打死。
毕竟工业场景里,远程操作人形机器人依然能解决现实需求,比如危险环境、重复劳动,只要价格合适、稳定性够高,市场空间还是有的。
而且人形机器人的远程遥控本身就是个技术活。操作员通过 VR 设备控制机器人的动作,需要实现精准的力反馈、低延迟的信号传输、复杂的姿态映射。

这套系统要让机器人的手指灵活度、身体平衡性、环境感知能力都跟得上人类操作员的意图,难度一点不小。许多人形机器人机器人能跑能跳能后空翻,但那些高难度动作很多也是在特定场景下、经过无数次调试才实现的。
真正的完全自主智能,整个行业都还在攻坚。
而在此之前,特斯拉 Optimus 就像马斯克本人的风格一样,永远在「已经改变世界」和「即将改变世界」之间反复横跳;如同薛定谔的猫,只要不掀开盒子,它就永远有实现的一天。
「这确实是一个很棒的逆袭故事。」
11 月 19 日凌晨,Gemini 3 的发布彻底打破了平淡。上线当日,全球访问量便突破 5400 万次,创平台历史新高。
Google 这一次王者归来,震感甚至直接传导到了竞争对手的神经中枢。据 The Information 报道,面对 Google 步步紧逼的攻势,OpenAI CEO Sam Altman 本周一紧急在内部备忘录中宣布公司进入「红色警戒(code red)」状态,准备调动一切战略资源对 ChatGPT 的能力进行大幅升级。

据 The Verge 援引知情人士消息称,OpenAI 计划最早于下周初发布 GPT-5.2 模型, 这一时间表较原定的 12 月下旬计划大幅提前。
这不仅侧面印证了 Gemini 3 带来的压迫感,也让接下来的对话显得更加意味深长。
近日,DeepMind CTO、Google 新任首席 AI 架构师 Koray Kavukcuoglu 在 Logan Kilpatrick 的访谈节目中亮相,他说「我们曾是追赶者,但创新是唯一的出路。」
亮点速览:
1. Koray Kavukcuoglu 强调,Gemini 的优化重点集中在以下几个关键领域:
2. Gemini 3 是一款「全 Google 团队协作的模型」。来自欧洲、亚洲等世界各地的团队都做出了贡献,不仅有 DeepMind 团队,还有 Google 各个部门的团队。
3. 随着技术进步,文本模型和图像模型的架构、理念正在不断融合。过去,两者的架构差异很大,但现在越来越趋同。这是技术自然演进的结果:大家都在探索更高效的方案,理念逐渐统一,最终形成了共同的发展路径。
视频链接:
以下为完整内容的转录和翻译。(顺序有改动)
Logan Kilpatrick: 大家好,欢迎回到 Release Notes。我是 Logan Kilpatrick,我在 DeepMind 团队。今天很荣幸邀请到 DeepMind 的 CTO、Google 的新任首席 AI 架构师——Koray。Koray,感谢你的到来,期待与你深入交流。
Koray Kavukcuoglu: 我也很期待。谢谢邀请!
Logan Kilpatrick: 当然,Gemini 3 已经发布。我们此前就预感这款模型会表现出色,基准测试结果也非常亮眼,但真正将它交到用户手中后,实际反响……
Koray Kavukcuoglu: 这才是最终的考验。基准测试只是第一步,之后我们也做了大量测试,包括让可信测试者参与预发布体验等。所以我们能感受到这是一款优秀的模型,能力出众,虽然不完美,但用户的反馈确实让我很满意。
大家似乎很喜欢这款模型,而且我们觉得有意思的部分,他们也同样感兴趣。所以目前来看挺好的,一切都很顺利。
Logan Kilpatrick: 没错,我们昨天还在聊,核心话题就是感慨 AI 的发展速度从未放缓。回想上次,也就是去年 I/O 大会上我们发布 Gemini 2.5 时,听着演示、Serge 谈论 AI 的未来,当时就觉得 2.5 已经是最先进的模型,在多个维度上都突破了前沿。而现在,Gemini 3.0 再次实现了突破。我很好奇,关于「这种进步能否持续」的讨论一直存在,你现在的看法是什么?
Koray Kavukcuoglu: 我对目前的进展和研究都充满信心。身处研究一线,你会发现各个领域都洋溢着创新的热情,从数据、预训练、微调,到每一个环节,都有大量新想法、新突破涌现。
归根结底,这一切都依赖于创新和创意。当我们的技术能切实影响现实世界、被人们广泛使用时,我们能获得更多反馈信号,接触面也会扩大,进而催生更多灵感。
而且我认为,未来的问题会更复杂、更多元,这会带来新的挑战,但这些挑战是有益的,也是推动我们迈向通用智能的动力。
有时候,如果你只看一两个基准测试,可能会觉得进步放缓了,但这很正常。基准测试是在某个技术难题凸显时设立的,随着技术发展,它不再是前沿的代名词,这时就需要制定新的基准。
这在机器学习领域很常见:基准测试与模型开发是相辅相成的,基准测试指导模型迭代,而只有接近当前前沿,才能明确下一个目标,进而制定新的基准。
Logan Kilpatrick: 我完全认同。比如早期的 HLE 基准测试,所有模型的正确率都只有 1% 到 2%,而现在 DeepMind 的最新模型已经能达到 40% 左右,这太惊人了。ArcGIS 基准测试最初也几乎没有模型能应对,现在正确率也超过了 40%。
不过有些静态基准测试确实经受住了时间的考验,比如 GPQA Diamond,虽然我们现在只能一点点提升 1% 左右的正确率,但它依然被广泛使用,可能已经接近饱和了。

Koray Kavukcuoglu: 这些基准测试中确实有很多难题,我们目前还无法完全攻克,但它们依然具有测试价值。以 GPQA 为例,我们没必要追求 90% 以上的极致正确率,现在已经接近目标了,所以尚未解决的问题数量自然在减少。
因此,寻找新前沿、制定新基准至关重要。基准测试是衡量进步的一种方式,但并非绝对对齐。理想情况下两者完全一致,但现实中永远无法完全契合。
对我来说,衡量进步最重要的标准是:我们的模型是否在现实世界中被广泛使用?科学家、学生、律师、工程师是否在用它解决问题?人们是否用它进行写作、收发邮件等?无论简单还是复杂,能在更多领域、更多场景中持续为用户创造更大价值,这才是真正的进步。而基准测试只是帮助我们量化这种进步的工具。
Logan Kilpatrick: 我有一个不算争议性的问题:Gemini 3 在众多基准测试中表现出色,同步登陆 Google 所有产品端和合作伙伴生态,用户反馈也非常积极。如果展望下一次 Google 重大模型发布,你觉得还有哪些方面是我们需要改进的?比如「我们希望能在 X、Y、Z 方面做得更好」,还是说我们应该先享受 Gemini 3 带来的成果?
Koray Kavukcuoglu: 我觉得两者可以兼顾。我们应该享受当下,毕竟发布日值得庆祝,团队也应该为自己的成就感到自豪。但与此同时,我们也清楚地看到,模型在各个领域都存在不足:写作能力并不完美,编码能力也有提升空间。
尤其是在智能体行动和编码方面,还有很大的进步空间,这也是最令人兴奋的增长领域。我们需要找出可以优化的方向,然后持续改进。我认为我们已经取得了长足的进步:对于 90% 到 95% 的编码相关用户(无论是软件工程师,还是想构建产品的创意人士)来说,Gemini 3 可能是目前最好用的工具,但确实还有一些场景需要进一步优化。
Logan Kilpatrick: 你如何看待「逐步优化」?比如从Gemini 2.5 到 3.0,或者其他版本迭代中,我们的优化重点是什么?如今基准测试数量繁多,我们如何选择优化方向,无论是针对整个 Gemini 系列,还是专门针对 Pro 版本?
Koray Kavukcuoglu: 我认为有几个关键领域至关重要。首先是指令遵循能力。模型需要准确理解用户需求并执行,而不是随意输出答案,这是我们一直重视的方向。其次是国际化。 Google 的业务遍布全球,我们希望让全世界的用户都能用上这款模型。
Logan Kilpatrick: 确实,我今天早上还和 Tulsi 聊过,她提到这款模型在一些我们过去表现不佳的语言上,表现得非常出色。
Koray Kavukcuoglu: 这真的很棒。所以我们必须持续聚焦这些领域,它们可能不是知识前沿,但对用户交互至关重要。正如我之前所说,我们需要从用户那里获取反馈信号。
再说到更技术化的领域,函数调用、工具调用、智能体行动和代码能力也极为关键。
函数调用和工具调用能极大提升模型的智能乘数效应:模型不仅能自然使用我们已有的工具和函数,还能自主编写工具。本质上,模型本身也是一种工具。
代码能力之所以重要,不仅因为我们团队中有很多工程师,更因为代码是数字世界的基础。无论是软件开发,还是将任何想法变为现实,代码都不可或缺。它能让模型与人们生活中的诸多场景深度融合。
我举个例子,比如「即时编码」(vibe coding),我很看好这个功能。很多人富有创造力,但缺乏将想法落地的能力,而即时编码能让他们从「有创意」变得「能落地」:只需写下想法,就能看到对应的应用程序呈现在眼前,而且大多数时候都能正常运行。
这种从创意到产品的闭环非常棒,它让更多人有机会成为创造者。

Logan Kilpatrick: 太赞了!这简直是 AI Studio 的完美宣传点,我们会把这段剪辑出来发布到网上。你刚才提到的一个重要话题是,在 Gemini 3 发布之际,我们同步推出了 Google Anti-gravity 平台。从模型角度来看,你认为这种产品架构对提升模型质量的重要性有多大?显然,这和工具调用、编码能力息息相关。
Koray Kavukcuoglu: 对我来说,这至关重要。平台本身确实令人兴奋,但从模型角度看,这是双向作用的。首先,模型能通过与终端用户(指软件工程师)直接集成,获取他们的反馈,进而明确模型需要改进的方向,这对我们来说至关重要。
就像 Gemini、AI Studio 一样,Anti-gravity 平台也是如此。这些产品能让我们与用户紧密相连,获取真实的反馈信号,这是巨大的财富。Anti-gravity 平台作为我们的关键发布合作伙伴,虽然加入时间不长,但在过去两三周的发布筹备中,它的反馈起到了决定性作用。
搜索 AI 模式(AI Mode)也是如此,我们从那里获得了大量反馈。基准测试能帮助我们推动科学、数学等领域的智能提升,但了解现实世界的使用场景同样重要,模型必须能解决实际问题。
Logan Kilpatrick: 在你担任新任首席 AI 架构师后,你的职责不仅是确保我们拥有优秀的模型,还要推动产品团队将模型落地,在 Google 的所有产品中打造出色的用户体验。 Gemini 3 在发布当天就同步登陆 Google 所有产品端,这对用户来说是巨大的惊喜,也希望未来能覆盖更多产品。从DeepMind 的角度来看,这种跨团队协作是否增加了额外的复杂性?毕竟一年半前,事情可能还简单得多。
Koray Kavukcuoglu: 但我们的目标是构建智能,对吧?很多人问我,身兼 CTO 和首席 AI 架构师两个职位,会不会有冲突,但对我来说,这两个角色本质上是一致的。
要构建智能,就必须通过产品与用户的联动来实现。我的核心目标是确保 Google 的所有产品都能用上最先进的技术。我们不是产品团队,而是技术开发者,我们负责研发模型和技术,当然,我们也会对产品有自己的看法,但最重要的是,以最佳方式提供技术支持,与产品团队合作,在 AI 时代打造最优秀的产品。
这是一个全新的时代,新技术正在重新定义用户期望、产品行为和信息传递方式。因此,我希望能在 Google 内部推动这种技术赋能,与所有产品团队合作。这不仅对产品和用户有益,对我们自身也至关重要。
只有贴近用户,才能感受到他们的需求,获取真实的反馈信号,这是推动模型迭代的核心动力。这就是我们构建通用人工智能(AGI)的方式:通过产品与用户共同成长。
Logan Kilpatrick: 我完全认同。这简直可以作为你的推特文案了!我也觉得,我们本质上是在与客户、合作伙伴共同构建通用人工智能(AGI)——这不是某个实验室的孤立研究,而是与全世界共同推进的联合事业。
Koray Kavukcuoglu: 我认为这也是一个「可信测试体系」——我们越来越强调工程思维。这种思维很重要,因为精心设计的系统才会更稳健、更安全。
我们在构建现实世界的产品时,借鉴了很多「可信测试」的理念,这体现在我们对安全、隐私的重视上:我们从一开始就将安全隐私作为核心原则,而不是事后补充。
无论是预训练、微调,还是数据筛选,团队中的每个人都需要考虑安全问题。我们当然有专门的安全团队和隐私团队,他们会提供相关技术支持,但我们更希望 Gemini 团队的每个人都深度参与其中,将安全隐私融入开发的每一个环节,这些团队本身也是微调团队的一部分。
因此,在模型迭代、发布候选版本时,我们不仅会参考 GPQA、HLE 等基准测试结果,还会严格审查安全隐私指标。这种工程思维至关重要。
Logan Kilpatrick: 我完全同意。这也很符合 Google 的企业文化,毕竟,发布 Gemini 模型是一项需要全球团队协作的庞大工程。
Koray Kavukcuoglu: 说到 Gemini 3,我觉得最值得一提的是,它是一款「全 Google 团队协作的模型」。
Logan Kilpatrick: 我们可以看看相关数据,这可能是史上参与人数最多的项目之一,就像 NASA 的阿波罗计划一样,这是一项全球性的庞大工程。
Koray Kavukcuoglu: 没错,是全球性的。
Logan Kilpatrick: Google 所有团队都参与其中,这太不可思议了。
Koray Kavukcuoglu: 来自欧洲、亚洲等世界各地的团队都做出了贡献,不仅有 DeepMind 团队,还有 Google 各个部门的团队。这是一项巨大的集体努力:我们与 AI 模式(AI Mode)、Gemini 应用程序同步发布,这不容易。
这些产品团队在模型开发阶段就与我们深度协作,这也是为什么我们能在发布当天实现全平台同步上线。所谓「全 Google 参与」,不仅指直接参与模型构建的团队,还包括所有各司其职、默默付出的团队。
Logan Kilpatrick: 另一个我关心的话题是生成式媒体模型——虽然我们一直有关注,但过去并未作为重点。不过,随着 Veo 3、Veo 3.1、Nano Banana 模型的推出,我们在产品落地方面取得了很大成功。
我很好奇,在追求通用人工智能(AGI)的过程中,你如何看待生成式视频模型的作用?有时候我会觉得视频模型似乎与 AGI 无关,但仔细想想,它涉及对世界、物理规律的理解,所以两者应该是相互关联的。
Koray Kavukcuoglu: 10 到 15 年前,生成式模型主要集中在图像领域,因为当时我们能更好地观察图像生成的过程,而且理解世界、物理规律也是图像生成模型的核心目标。
Google 在生成式模型方面的探索可以追溯到 10 年前,甚至更早。我读博时,大家都在做生成式图像模型,比如像素卷积神经网络(Pixel CNNs)。后来我们意识到,文本领域的进步速度会更快。
但现在,图像模型的重要性再次凸显。DeepMind 长期以来在图像、视频、音频模型方面积累了深厚的技术实力,将这些技术与文本模型融合是顺理成章的。
我们一直强调多模态,包括输入多模态和输出多模态。随着技术进步,文本模型和图像模型的架构、理念正在不断融合。过去,两者的架构差异很大,但现在越来越趋同。这不是我们刻意推动的,而是技术自然演进的结果:大家都在探索更高效的方案,理念逐渐统一,最终形成了共同的发展路径。
这种融合的核心价值在于,文本模型拥有丰富的世界知识,而图像模型从另一个视角理解世界,将两者结合,能让模型更好地理解用户的意图,创造出更令人惊喜的成果。
Logan Kilpatrick: 我还有一个关于 Nano Banana 的问题:你觉得我们应该给所有模型起一些有趣的名字吗?这会不会有帮助?
Koray Kavukcuoglu: 不一定。我觉得名字应该自然产生,而不是刻意为之。比如 Gemini 3,我们并没有刻意设计名字。
Logan Kilpatrick: 如果 Gemini 3 不叫这个名字,你会起什么?会不会是很搞笑的名字?
Koray Kavukcuoglu: 我不知道,我不擅长起名字。其实我们的 Gemini 模型有内部代号,有些代号甚至是用 Gemini 模型自己生成的,但 Nano Banana 不是,它没有经过模型生成。
这个名字背后有个故事,我记得已经公开了。我觉得只要名字是自然、自发产生的,就很好。构建模型的团队能对名字产生情感共鸣,这很有意义。
「Nano Banana」这个名字之所以被沿用,是因为我们在测试时用了这个代号,大家都很喜欢,它是自发传播开来的。我觉得这种自然形成的名字很难通过流程刻意创造,有就用,没有的话,用标准名称也很好。
Logan Kilpatrick: 那我们来聊聊 Nano Banana Pro,这是基于 Gemini 3 Pro 打造的最先进的图像生成模型。我听说团队在完成 Nano Banana 后,发现将其升级为 Pro 版本后,在文本渲染、世界知识理解等更精细的场景中,性能有了很大提升。对于这方面的发展,你有什么看法?
Koray Kavukcuoglu: 这正是不同技术融合的体现。我们一直说,每个版本的 Gemini 都是一个模型家族,比如 Pro、Flash 等,不同尺寸的模型在速度、准确率、成本等方面各有取舍。图像生成模型也是如此,自然会形成不同定位的产品。
团队基于 Gemini 3.0 Pro 的架构,结合第一代模型的经验,通过扩大模型规模、优化调优方式,打造出了更强大的图像生成模型,这很合理。它的核心优势在于处理复杂场景:比如输入大量复杂文档,模型不仅能回答相关问题,还能生成对应的信息图表,而且效果很好。这就是输入多模态与输出多模态自然融合的体现,非常棒。

Logan Kilpatrick: 是啊,这简直像魔法一样!希望大家在这段视频发布时已经看到了相关示例,内部分享的一些案例真的太惊人了。
Koray Kavukcuoglu: 完全同意!当你看到模型能将海量文本、复杂概念,用一张清晰直观的图片呈现出来时,真的会惊叹「太厉害了」。这能直观地体现模型的能力。
Logan Kilpatrick: 而且其中还有很多细节值得品味。我还有一个相关问题:去年 12 月,Tulsi 曾承诺我们会推出统一的 Gemini 模型检查点(checkpoint)。你刚才描述的内容,是不是意味着我们现在已经非常接近这个目标了?
Koray Kavukcuoglu: 从历史上看,生成式模型的架构一直是统一的……
Logan Kilpatrick: 所以我猜这是我们的目标:让这些功能真正融入一个模型中,但现实中肯定有一些阻碍。你能从宏观层面解释一下吗?
Koray Kavukcuoglu: 正如我之前所说,技术和架构正在不断趋同,这种统一是必然趋势,但这需要验证。我们不能凭主观臆断,必须遵循科学方法:提出假设、进行测试、观察结果,有时成功,有时失败,但这就是技术进步的过程。
我们正在逐步接近目标,我相信在不久的将来,我们会看到更统一的模型,但这需要大量的创新。
这其实很难——模型的输出空间至关重要,因为它直接关系到学习信号的质量。目前,我们的学习信号主要来自代码和文本,这也是模型在这些领域表现出色的原因。
而图像生成则不同:它对质量要求极高,不仅需要像素级的精准度,还需要图像概念的连贯性,也就是每个像素都要符合整体画面的逻辑。要同时做好文本和图像生成,难度很大。但我认为这绝对是可行的,只是需要找到合适的模型创新方向。
Logan Kilpatrick: 太令人期待了!希望这也能让我们的工作更高效,比如拥有一个统一的模型检查点。
Koray Kavukcuoglu: 这很难说,但可能性很大。
Logan Kilpatrick: 我再追问一个关于编码和工具使用的问题。回顾 Gemini 的发展历程:1.0 版本聚焦多模态,2.0 版本开始搭建基础设施。虽然我们的进步速度很快,但为什么在多模态领域,我们没能从一开始就在智能体工具使用方面达到最先进水平?毕竟 Gemini 1.0 在多模态领域一直保持领先。
Koray Kavukcuoglu: 我不认为这是刻意为之。说实话,我觉得这与模型开发环境是否贴近现实世界密切相关,越贴近现实,就越能理解用户的真实需求。
Gemini 的发展历程,也是我们从「纯研究」转向「工程思维」、与产品深度绑定的过程。 Google 在 AI 研究方面有着深厚的积淀,拥有众多优秀的研究人员,但 Gemini 的特别之处在于,它让我们从「写论文、做研究」转向了「通过产品和用户共同开发」。
我为我们的团队感到骄傲——包括我在内,大多数人四五年前还在专注于发表论文、开展 AI 研究,而现在,我们站在技术前沿,通过产品和用户共同推进技术迭代。
这种转变非常惊人:我们每 6 个月就推出一个新模型,每 1 到 1.5 个月就进行一次更新。我认为,我们正是在这个过程中逐步完善智能体工具使用能力的。
Logan Kilpatrick: 还有一个有趣的话题:现在 DeepMind 拥有众多世界顶尖的 AI 产品,比如即时编码(vibe coding)、AI Studio、Gemini、Anti-gravity 平台等, Google 旗下也有很多前沿模型,比如 Gemini 3、Nano Banana、Veo 等。10 年甚至 15 年前,世界完全不是这样的。
我很好奇,回顾你的个人历程,你昨天提到,你是 DeepMind 的第一位深度学习研究员,这一点我和其他人都感到很意外。从 13 年前(2012年)人们对深度学习并不看好,到现在这项技术支撑着众多产品、成为核心驱动力,你有什么感想?这一切是在意料之中,还是让你感到意外?
Koray Kavukcuoglu: 我觉得这是最理想的结果。就像所有读博的人一样,你会坚信自己所做的事情很重要,会产生重大影响——我当时就是这种心态。
所以当 Demi 和 Shane 联系我,告诉我 DeepMind 是一个专注于构建智能、以深度学习为核心的团队时,我非常兴奋。我和我的朋友 Carl Greger(我们都来自纽约大学 Jan 的实验室)同时加入了 DeepMind。在当时,专注于深度学习和 AI 的初创公司非常罕见,所以 DeepMind 的理念非常有远见,能在那里工作真的很令人激动。后来,我组建了深度学习团队,看着它不断发展壮大。
我对深度学习的态度一直是:以第一性原理为基础,坚持「基于学习」的思维方式,这也是 DeepMind 的核心理念:一切都建立在学习之上。
回顾这段旅程,从早期的 DQN、AlphaGo、AlphaZero、AlphaFold,到现在的 Gemini,真的很令人感慨。我们一直怀着积极的期望推进工作,但同时也觉得自己很幸运。
我们有幸生活在这个时代,很多人曾为 AI 或自己热爱的领域奋斗一生,希望能见证技术爆发,但这一切现在真的发生了。AI 的崛起不仅得益于机器学习和深度学习的进步,还离不开硬件、互联网和数据的发展,这些因素共同促成了今天的局面。所以,我既为自己选择了 AI 领域而自豪,也为能身处这个时代而感到幸运。这真的太令人兴奋了。
Logan Kilpatrick: 我最近看了《思维游戏》(The Thinking Game)的视频,了解了 AlphaFold 的相关故事。我没有亲历那个时代,只能通过资料和他人的讲述来了解。你经历了 DeepMind 的多个重要项目,你觉得现在的工作与过去相比有什么不同?比如你之前提到的,「我们已经掌握了将模型推向世界的方法」,这种感觉与之前的项目有什么相似或不同之处?
Koray Kavukcuoglu: 如何组织团队、培养文化,才能将复杂的科学技术问题转化为成功的成果?我认为我们从多个项目中积累了很多经验,从 DQN、AlphaGo、AlphaZero 到 AlphaFold,这些项目都产生了深远影响。我们学会了如何围绕特定目标和使命,组织大规模团队开展工作。
我记得 DeepMind 早期,我们曾有 25 人共同参与一个项目,共同发表一篇论文——当时很多人都质疑「25 人怎么可能合作完成一篇论文」,但我们确实做到了。在科研领域,这种大规模协作并不常见,但我们通过有效的组织实现了。这种经验和思维方式,随着时间的推移不断演进,变得越来越重要。
而在过去两三年里,我们又融入了工程思维——我们有了模型的主线开发方向,学会了在主线基础上进行探索。
我觉得「深度思维模型」(Deep Think)就是一个很好的例子:我们用它参加国际数学奥林匹克(IMO)、国际大学生程序设计竞赛(ICPC)等顶级赛事。这些竞赛的问题难度极大,很多人会想为赛事定制专门的模型,但我们选择将其作为优化现有模型的机会。
我们坚信技术的通用性,通过赛事探索新想法,并将这些想法融入现有模型,最终打造出能参加顶级赛事的模型,再将其开放给所有人使用。
Logan Kilpatrick: 这让我想到了一个对应:以前是 25 人共同发表一篇论文,现在 Gemini 3 的贡献者名单可能已经有 2500 人了——很多人可能会觉得「 2500 人怎么可能都参与其中」,但事实确实如此。这种大规模协作解决问题的方式,真的很令人惊叹。
Koray Kavukcuoglu: 这一点非常重要,也是 Google 的优势所在。 Google 拥有全栈技术能力,我们能从中受益:从数据中心、芯片、网络,到大规模模型的部署,每个环节都有专家坐镇。
回到工程思维的话题,这些环节是密不可分的。我们设计模型时,会考虑它将运行的硬件;而设计下一代硬件时,也会预判模型的发展方向。这种协同非常美妙,但要协调这么多环节,确实需要数千人的共同努力。我们应该认可这种协作的价值,这真的很了不起。
Logan Kilpatrick: 这绝非易事。再回到 DeepMind 的传统:我们一直采用多元科学方法,尝试解决各种有趣的问题。而现在,我们已经明确这项技术在多个领域都有效,只需持续扩大规模。当然,这也需要创新支撑。
你认为在当今时代,DeepMind 如何平衡「纯科学探索」和「扩大 Gemini 规模」?比如「Gemini 扩散模型」(Gemini Diffusion),就是这种决策的一个体现。
Koray Kavukcuoglu: 这是最关键的问题:找到两者的平衡至关重要。
现在很多人问我,Gemini 最大的风险是什么?我认真思考过,答案是「缺乏创新」。我绝不相信我们已经找到了「万能公式」,只需按部就班执行即可。
我们的目标是构建通用智能,这需要与用户、产品深度绑定,但这个目标本身依然极具挑战性,我们并没有现成的解决方案——创新才是实现目标的核心动力。
创新可以有不同的规模和方向:在 Gemini 项目内部,我们会探索新架构、新想法、新方法;而作为 Google DeepMind 整体,我们还会开展更多跨领域的探索,因为有些想法可能在 Gemini 项目内部过于受限,无法充分发展。
所以, Google DeepMind 和 Google 研究院需要共同探索各类想法,然后将这些想法融入 Gemini,因为 Gemini 不是一种架构,而是一个目标:构建通用智能,让 Google 的所有产品都能依托这个 AI 引擎运行。
无论最终采用哪种架构,我们都会持续演进,而创新将永远是核心驱动力。找到平衡,或以不同方式推进探索,这至关重要。
Logan Kilpatrick: 我有一个相关的问题:在 I/O 大会上,我曾和 Sergey 聊过,当你把这么多人聚集在一起,共同发布模型、推动创新时,你能感受到一种「人性的温度」——这一点我深有体会。我当时坐在你旁边,也感受到了你的热情。
这一点对我个人来说很有意义,因为它也反映了 DeepMind 的整体文化:既有深厚的科学底蕴,又有友善、包容的团队氛围。很多人可能没有意识到这种文化的重要性,以及它如何影响工作。作为团队的领导者,你如何看待这种文化的体现?
Koray Kavukcuoglu: 首先,谢谢你的夸奖,这让我有点不好意思。但我确实相信团队的力量,也坚信要信任他人、给予他人机会。团队协作至关重要,这一点我也是在 DeepMind 工作期间学到的。
我们从一个小团队起步,在成长过程中始终保持信任。我认为,营造一个「专注于解决有影响力的复杂技术和科学问题」的环境,非常重要,这也是我们现在正在做的。
Gemini 的核心是构建通用智能,这是一个极具挑战性的技术和科学问题,我们需要以谦逊的态度去面对,不断质疑自己、优化自己。希望团队也能感受到这一点,我真的为我们的团队感到骄傲,他们齐心协力、相互支持。
就像我刚才在茶水间和团队聊的那样:「这很辛苦,我们都很累,但这就是构建前沿技术的常态。我们没有完美的流程,但每个人都在全力以赴、相互支持。」 而让这一切变得有趣、有意义,让我们有勇气面对挑战的,很大程度上是「拥有一支优秀的团队」,大家共同为技术的潜力而奋斗。
我可以肯定地说,20 年后,我们现在使用的大语言模型(LLM)架构肯定会被淘汰。所以,持续探索新方向是正确的选择。 Google DeepMind、 Google 研究院,以及整个学术研究社区,都需要共同推进多个领域的探索。
我认为,不必纠结于「什么是对的、什么是错的」,真正重要的是技术在现实世界中的能力和表现。
Logan Kilpatrick: 最后一个问题:我个人在 Google 的第一年多时间里,感受到了一种「 Google 逆袭」的氛围。尽管 Google 拥有强大的基础设施优势,但在 AI 领域,我们似乎一直在追赶。比如在 AI Studio 的早期阶段,我们没有用户(后来增长到3万人),没有收入,Gemini 模型也处于早期阶段。
而现在,随着 Gemini 3 的发布,我最近收到了很多来自生态系统各方的反馈,人们似乎终于意识到「 Google 的AI时代已经到来」。你是否也有过这种「逆袭」的感受?你相信我们能走到今天吗?对于团队来说,这种角色的转变会带来什么影响?
Koray Kavukcuoglu: 在大语言模型(LLM)的潜力逐渐显现时,我坦诚地说,我既认为 DeepMind 是前沿 AI 实验室,也意识到我们作为研究人员,在某些领域的投入还不够,这对我来说是一个重要的教训:我们必须拓宽探索范围,创新至关重要,而不是局限于某一种架构。
我一直对团队坦诚相待:大约 2.5 年前,当我们开始认真对待大语言模型、启动 Gemini 项目时,我们在很多方面都与最先进水平有差距,我们有很多不懂的东西,虽然也有自己的优势,但确实处于追赶状态。
这种追赶持续了很长时间,而现在,我认为我们已经进入了领先梯队。我对我们的发展速度、团队动态和协作节奏感到非常满意。但我们必须正视过去的追赶历程。
在追赶过程中,我们既要学习他人的优点,也要坚持自己的创新,找到适合自己的解决方案:无论是技术、模型、流程,还是团队运作方式,这些都是我们独有的。
很多人说「 Google 太大了,做事效率低」,但我认为这可以转化为优势。我们有能力做一些独特的、大规模的事情,比如让 Gemini 同步登陆所有 Google 产品。我对我们现在的状态很满意,但这是通过持续学习和创新实现的。这确实是一个很棒的「逆袭」故事。
当然,总会有各种比较,但我们的目标始终是构建通用智能——我们希望以正确的方式实现这一目标,并为此倾注全部心力和创新。
Logan Kilpatrick: 我觉得未来六个月可能会和过去六个月、乃至之前的六个月一样令人振奋。再次感谢你抽出时间接受采访,非常愉快!希望在明年 I/O 大会前我们能再聊一次。
虽然感觉还有很久,但时间肯定会过得很快。我相信下周就会有关于 2026 年 I/O 大会的规划会议了。再次祝贺你和 DeepMind 团队,以及所有模型研究人员,成功推出 Gemini 3、Nano Banana Pro 等一系列产品!
Koray Kavukcuoglu: 谢谢!这次交流非常棒。感谢团队的付出,也感谢你的邀请!
AI 领域迄今最大规模的用户行为实录,刚刚发布了。
这是全球模型聚合平台 OpenRouter 联合硅谷顶级风投 a16z 发布的一份报告,基于全球 100 万亿次真实 API 调用、覆盖 300+款 AI 模型、60+家供应商、超过 50% 非美国用户 。
我们能从里面看到人类真的在怎么用 AI,尤其是那些不会出现在官方案例、不会被写进白皮书的对话。
APPSO 从里面的发现了三个最反直觉的结论:
1. 人类最真实的刚需不是生产力,是「荷尔蒙」和「过家家」。超过50%的开源模型算力,被用来搞角色扮演、虚拟恋人和 NSFW 内容。写代码?那只是第二位。
2. 真正的高端用户根本不看价格标签,而便宜到几乎免费的模型,死得反而更快。早期抓住用户痛点的模型,会更容易锁住用户。
3. 中国模型只用一年就撕开了防线。 从 1.2% 到 30%,DeepSeek 和 Qwen 为代表的的国产模型一跃成为开源的王。
必须要注意的是:这份报告不可避免地带有「偏见」。
OpenRouter 的用户主要是个人开发者、中小企业、开源爱好者,而非 500 强企业。那些每月在 Azure、AWS 上烧掉数百万美元的大厂 AI 预算,并不在这份数据里。所以:
但回头想想,这恰恰是这份报告的价值所在。
当所有人在发布会上鼓吹 AI 如何改变生产力时,我们可以清楚看到:谁在裸泳,谁在通吃,谁在悄悄统治那些不可描述的领域
如果把 AI 市场看作一张世界地图,2024 年之前,它是属于 OpenAI 和 Anthropic 的闭源帝国。他们筑起 API 的高墙,收着过路费,定义着规则。
但墙塌了。
看这张使用量分布图,开源模型(OSS)的 token 使用量已经飙升至总量的三分之一,而且这个数字还在以惊人的速度攀升。
2024 年夏天是一个分水岭时刻。
在此之前,市场是死水一潭。OpenAI 的 GPT 系列和 Anthropic 的 Claude 分食大部分蛋糕,开源模型只是点缀。
在此之后,随着 Llama 3.3 70B、DeepSeek V3、Qwen 3 Coder 的密集发布,格局瞬间攻守易形。那些曾经高高在上的 API 调用量,开始遭遇断崖式的分流。
这里必须专门谈谈中国模型的崛起,因为这是过去一年最具侵略性的叙事。
数据显示:
从 1.2% 到 30%,这是一场自下而上的包围战。
DeepSeek 以总计 14.37 万亿 token 的使用量稳居开源榜首,虽然其霸主地位正在被稀释,但体量依然惊人。Qwen 紧随其后,以 5.59 万亿 token 占据第二,而且在编程领域的表现极为凶猛,可以直接与 Claude 掰手腕。

更关键的是节奏。中国模型的发布周期极其密集。DeepSeek 几乎每个季度都有重大更新,Qwen 的迭代速度甚至更快。这种「高频打法」让硅谷的巨头们疲于应对:自己刚发布一个新模型,对手已经连发三个变种。
现在,让我们戳破那些想当然的泡沫,看看 AI 在真实世界里到底被用来干什么。
真相一:「小模型已死,中型崛起」
市场正在用脚投票,抛弃那些「又快又傻」的极小模型。
数据显示,参数量小于 15B 的模型份额正在暴跌。用户发现,速度再快也没用,如果 AI 傻得像个复读机,那还不如不用。
中型模型(15B-70B 参数)成为新宠。 这个市场甚至是被 Qwen2.5 Coder 32B 在 2024 年 11 月一手创造出来的。此前,这个参数区间几乎是空白;此后,Mistral Small 3、GPT-OSS 20B 等模型迅速跟进,形成了一个新的战场。
既不便宜又不够强的模型正在失去市场。你要么做到极致的强,要么做到极致的性价比。
真相二:不是 programming,更多是 playing
虽然我们在新闻里总看到 AI 如何提高生产力,但在开源模型的使用中,超过 50% 的流量流向了「角色扮演」(Roleplay)。
更直白一点说:
超过一半的开源 AI 算力,被用来做这些事:
这是基于 Google Cloud Natural Language 分类 API 对数亿条真实 prompt 的分析结果。当 AI 检测到一个请求属于 /Adult 或 /Arts & Entertainment/Roleplaying Games 时,这条请求就会被打上标签。
这意味着,对于海量 C 端用户而言,AI 首先是一个「情感投射对象」,其次才是一个工具。
同时流媒体和硅谷巨头出于品牌形象(Brand Safety)考量,刻意回避甚至打压这一需求。但这恰恰造就了巨大的「供需真空」。用户对情感交互、沉浸式剧情、甚至 NSFW(少儿不宜上班别看)内容的渴求,被压抑在主流视线之外,最终在开源社区报复性爆发。
编程是第二大使用场景,占比 15-20%。 没错,写代码这件被媒体吹上天的事,在真实世界里只排第二。
所以真相是什么?
别装了。人类最真实的两大刚需,一个是荷尔蒙,一个是代码。 前者让人类感到陪伴和刺激,后者让人类赚到钱。其他那些「知识问答」「文档总结」「教育辅导」,加起来都不到这两者的零头。
这也解释了为什么开源模型能快速崛起,因为开源模型通常审查较少,允许用户更自由地定制性格和剧情,非常适合情感细腻的互动。
真相三:娱乐至死的 DeepSeek 用户
如果我们单独拉出 DeepSeek 的数据,会发现一个更极端的分布:
– Roleplay + Casual Chat(闲聊):约 67%
– Programming:仅占小部分
在这份报告里,DeepSeek 几乎是一个 C 端娱乐工具,而非生产力工具。它的用户不是在写代码,而是在和 AI「谈恋爱」。
这和 Claude 形成了鲜明对比。
为什么有的模型昙花一现,有的却像胶水一样粘住用户?
报告提出了一个概念:Cinderella 「Glass Slipper」Effect(灰姑娘的水晶鞋效应)。
定义: 当一个新模型发布时,如果它恰好完美解决了用户长期未被满足的某个痛点(就像水晶鞋完美契合灰姑娘的脚),这批用户就会成为该模型的「死忠粉」(基础留存用户),无论后续有多少新模型发布,他们都很难迁移。
值得注意的是,机会只有一次。如果在发布初期(Frontier window)没能通过技术突破锁定这批核心用户,后续再怎么努力,留存率都会极低。
为什么?
因为用户已经围绕这个模型建立了整套工作流:
– 开发者把 Claude 集成进了 CI/CD 流程
– 内容创作者把 DeepSeek 的角色设定保存了几十个版本
– 切换成本不仅是技术上的,更是认知和习惯上的
赢家画像:DeepSeek 的「回旋镖效应」
DeepSeek 的留存曲线非常诡异:
用户试用 → 流失(去试别的模型)→ 过了一段时间骂骂咧咧地又回来了
这就是所谓的「回旋镖效应」(Boomerang Effect)。数据显示,DeepSeek R1 的 2025 年 4 月用户组,在第 3 个月出现了明显的留存率上升。
为什么他们回来了?
因为「真香」。在试遍了市面上所有模型后,发现还是 DeepSeek 性价比最高:
输家画像:Llama 4 Maverick 们的悲剧
相比之下,像 Llama 4 Maverick 和 Gemini 2.0 Flash 这样的模型,它们的留存曲线让人心疼:
从第一周开始就一路向下,永不回头。
为什么?因为它们来得太晚,也没啥绝活。当它们发布时,用户已经找到了自己的「水晶鞋」,新模型只能沦为「备胎」。
在 AI 模型市场,迟到的代价是永久性的边缘化。
在这场战争中,没有谁能通吃,大家都在自己的 BGM 里痛苦或狂欢。让我们给每个玩家贴上最准确的标签:
Claude (Anthropic):直男工程师的「神」
人设:偏科的理工男,只懂代码,不懂风情
数据不会撒谎,Claude 长期吃掉了 编程(Programming)领域 60% 以上 的份额。虽然最近略有下滑,但在写代码这件事上,它依然是那座不可逾越的高墙。
用户画像:
– 超过 80% 的 Claude 流量都跟技术和代码有关
– 几乎没人拿它来闲聊或角色扮演
Claude 就像那个班里的学霸——只有在考试时你才会找他,平时根本不会一起玩。
OpenAI:从「唯一的神」到「平庸的旧王」
人设:曾经的霸主,如今的工具箱
OpenAI 的份额变化极具戏剧性:
– 2024 年初: 科学类查询占比超过 50%
– 2025 年末: 科学类占比跌至不足 15%
它正在从「唯一的神」变成一个「什么都能干但什么都不精」的工具箱。虽然 GPT-4o Mini 的留存率依然能打,但在垂直领域,它已经不再是唯一的选择。
核心问题在于: 被自己的成功困住了。ChatGPT 让它成为大众品牌,但也让它失去了专业领域的锋芒。
Google (Gemini):通才的焦虑
人设:什么都想要,什么都不精
谷歌像个茫然的通才。法律、科学、翻译、通识问答都有它的身影,但:
– 在编程领域份额仅 15%
– 在角色扮演领域几乎不存在
但在一个越来越垂直化的市场里,通才意味着平庸。
DeepSeek:野蛮人的胜利
人设:不按常理出牌的颠覆者,C 端娱乐之王
DeepSeek 用极致的性价比撕开了口子,证明了即使不依靠最强的逻辑推理,靠「好玩」+「免费」也能打下江山。
核心数据:
– 总使用量 14.37 万亿 token(开源第一)
– 67% 的流量是娱乐和角色扮演
– 回旋镖效应明显,用户试完别的还是会回来
它的成功证明了一件事:在消费级市场,「足够好」+「足够便宜」+「没有限制」 就能通吃。
xAI (Grok):马斯克的「乱拳」打法
人设:半路杀出的程咬金,靠免费抢市场
Grok 的数据非常有趣:
– 早期 80% 都是程序员在用(Grok Code Fast 针对编程优化)
– 免费推广后,突然涌入大量普通用户,用户画像瞬间变杂
免费能拉来流量,但流量 ≠ 忠诚度。一旦收费,这批用户会立刻流失。
最后,让我们用一张图看懂这个江湖。
当前大模型市场已形成清晰的四大阵营格局:
首先是 「效率巨头」 阵营,以 DeepSeek、Gemini Flash 为代表,核心优势在于 「便宜大碗」 的高性价比,专为跑量场景设计,尤其适用于无需复杂逻辑推理的重复性 「脏活累活」,成为追求效率与成本平衡的首选。
其次是 「高端专家」 阵营,Claude 3.7 与 GPT-4 是该领域的标杆,尽管定价偏高,但凭借顶尖的准确率和复杂任务处理能力,赢得了企业用户的青睐。
与此同时,「长尾」 阵营的生存空间正持续收缩,数量众多的小模型因缺乏差异化优势和技术壁垒,正逐渐被市场淘汰。
此外,以中国模型为核心的 「颠覆者」 阵营正快速崛起,凭借高频迭代的技术更新、高性价比的定价策略以及深度本土化的适配能力,市场份额仍在持续扩张,成为搅动行业格局的关键力量。
作为观察者,APPSO 从这份报告中观察到的一些趋势变化,或许将定义 AI 未来的竞争格局:
1. 多模型生态是常态,单模型崇拜是病态
开发者会像搭积木一样,用 Claude 写代码,用 DeepSeek 润色文档,用 Llama 做本地部署。忠诚度?不存在的。
2. Agent(智能体)已经吃掉了一半江山
推理模型(Reasoning Models)的份额已经超过 50%。我们不再只想要 AI 给个答案,我们想要 AI 给个「思考过程」。多步推理、工具调用、长上下文是新的战场。
3. 留存 > 增长
除了早期用户留存率,其他的增长数据都是虚荣指标。
4. 垂直领域的「偏科」比全能更有价值
Claude 靠编程通吃,DeepSeek 靠娱乐称王。想要什么都做的模型,最后什么都做不好。
5. 价格不是唯一变量,但「好用」是永远的硬通货
数据显示,价格和使用量之间相关性极弱。真正的高端用户对价格不敏感,而低端用户只认那几个「性价比神机」。夹在中间的平庸模型,死得最快。
6. 中国模型的进攻才刚刚开始
从 1.2% 到 30% 只用了一年。站稳脚跟后,下一步是什么?是定义规则,还是被规则驯化?这将是 2026 年最值得关注的故事。
AI 的世界不是由发布会上的愿景定义的,而是由用户每天真实发送的那万亿个 Token 定义的。
那些 Token 里,有人在写代码改变世界,也有人在和虚拟女友说晚安,理性的代码与感性的对话并行不悖。
或许不得不承认,AI的发展,也是人类欲望的延伸。
2012 年,Google 推出了「Project Glass」智能眼镜原型机,可以录像,支持语音交互,镜片上一寸不到的 LED 屏幕还能显示一些应用的界面,完全如同科幻电影走进现实。
最终,这款超前的设备由于隐私争议和技术限制等原因,只度过了短暂的一生,但也让世人瞥见了一种全新的智能设备形态。
13 年后的 2025 年,智能眼镜成为新兴的硬件浪潮,Google 作为这个品类曾经的先行者,带着 Android XR 和 Gemini 又杀了回来。
刚刚的 Android Show 活动只有半个小时,内容却干货满满,Google 正式披露了他们眼中四种 XR 设备路线:

Android XR 这个系统于去年年底首次正式公布,顾名思义就是一个为 XR 设备开发的 Android 系统。
Google 强调,为 Android 开发,就是在为 Android XR 开发,后者可以直接兼容使用 Google PlayStore 上的大部分手机和平板应用。

跟手机上的 Android 一致,Android XR 为行业里的厂商,提供了一个相当完善的系统和生态平台,能直接利用现成的 Android 应用生态,调用 Google 服务和 Gemini AI;而专门开发 XR 应用的开发者,也得到了一个分发应用的平台。
对于新型的 XR 初创公司,Android XR 就是他们等待已久的平台,XREAL CEO 徐驰告诉 The Verge:
目前世界上只有两家公司能够真正构建起一个生态系统:苹果和 Google 。苹果不会与其他公司合作,Google 是我们唯一的选择。
The Verge 提前体验了一款 Android XR 原型机,当编辑使用 Uber 打车时,眼镜的显示屏弹出一个 Uber 的小部件,显示预计接客时间、车牌号等信息,以及前往上车点的地图路线指引,这些功能都直接来自 Uber 原本的 Android 应用。

Android XR 的号召力比 Meta Horizon 平台更强,也比苹果更开放,这意味着未来将有更多第三方厂商开发 Android XR 设备,蛋糕越做越大,XR 应用和内容的生产者更愿意加入生态。
我们最熟悉的 Android XR 设备,自然是十月底发布的三星 Galaxy XR 头显,爱范儿此前已经进行过详细报道,这次活动中 Google 也推出了三个更新:

这次 Android XR 的重头戏,当然是三款不一样的眼镜。
在今年 5 月的 I/O 大会上,Google 首次公布了与国内 AR 眼镜厂商 XREAL 合作的 Project Aura 产品,今天的活动则带来了更多体验和使用上的细节。
Project Aura 是一款「有线 XR 眼镜」,这款设备的理念很简单,就是以眼镜这种轻巧方便的形式,实现类似头显的双目 XR 效果,适合出门使用。

当然,比起传统的眼镜,Aura 要更大更重,硬件形态与 XREAL 其他产品很类似: 一个 AR 投屏眼镜,以有线的形式连接一个 Android XR 计算终端——终端还能充当一个触控板。
不同的是,Aura 支持和头显一样的手势交互,并带有透视效果,用户能够看到周围环境,应用界面投射其上。

Google 选择 XREAL 这家初创公司的原因,大概率是看中了 XREAL 做 AR 眼镜硬件的强大实力:Aura 实现了 70° FOV,为消费级 AR 的最大实用视场,能够让 Gemini 助手更好地与真实世界进行互动,也能获得沉浸式的观影体验;性能方面则采用了 Galaxy XR 同款高通骁龙 XR2 Plus Gen 2 芯片组。
得益于 Android XR 系统,Aura 能够直接使用那些专门为 Galaxy XR 头显设备开发的 XR 应用,只要有对应的 SDK,应用的功能和体验就能自动调整到适合 XR 眼镜的状态。
比起又大又重的头显,Project Aura 更适合「PC 连接」功能,用户在工作时可以将 Aura 当成一个外接大屏, Windows 应用可以以大窗口形式在 Aura 中显示,工作中不会的操作甚至可以让 Gemini 教你。

根据多家外媒,Project Aura 的使用体验确实非常接近 Galaxy XR 头显,重量却要轻上不少,不过考虑到小巧的体积和强大的性能,Aura 的发热和续航将成为一个问题。
不过,Project Aura 在这次活动上依旧未能正式推出,Google 承诺将于明年发布。
另外两款眼镜,则是完全无线的产品,更适合日常佩戴,因此也更需要强调时尚属性,因此除了三星,Google 也宣布了这类产品将与 Warby Parker 以及 Gentle Monster 连个传统眼镜潮牌合作。
第一款眼镜,是类似 Ray-Ban Meta 的最基础形态,我们称之为「AI 眼镜」不带任何显示屏,用户可以用眼镜和 Gemini 沟通、拍照、听歌。这种产品虽然不是真的「XR」眼镜,却是大众接受度最高的品类。
Google 更看重的是第二款,其实就是在第一款的基础上增加单目 AR 显示屏,用来显示一些简单的卡片和组件,类似 Meta Ray-Ban Display,这也是今年 I/O 大会上进行过演示的品类。

▲ 活动上出现的原型机
操控这个 XR 眼镜的方法有两种,第一种就是利用眼镜柄上的触控板,第二种当然就是 Gemini 语音输入了。Gemini Live 能够基于当前看到的视觉环境上下文,以及用户的自然语音控制,去完成多步骤、复杂的任务。
这次演示的内容和 I/O 类似,同样展现了智能眼镜语音指令识别、识物、记忆、导航、实时翻译等等能力。
重点是,Google 单目 XR 眼镜是一款「手机配件」,它大部分的运算都在手机,并且直接使用 Android 手机上的应用——作为对比,Meta 只能用自家几个社交媒体应用。Aura 的界面简洁干净,没有应用列表,只提示最重要的信息,来自手机 App 实时通知,给人感觉更像是智能手表。

▲ 图源:Android Authority
即使智能眼镜正在井喷式发展,但未来的十年里,人人兜里依旧会有智能手机,Google 深知这个道理,于是他们的目标,只是想通过这种单目式的 XR 智能眼镜,慢慢减少你掏出手机的次数。同样是单目 XR 眼镜,Google 的产品也比 Meta 要小巧很多。
并且,Google 还告诉 The Verge,为了更多人使用眼镜的多模态能力,明年 Android XR 眼镜还会支持 iOS。
当年导致 Google Glass 折戟的另一个导火索——隐私问题,Google 也抓门进行了说明,这些 Android XR 眼镜在录制时都会发出明亮的脉冲光,并用红绿光区分录制和 Gemini 摄像头使用。
和 Project Aura 一样,这两款 AI 眼镜产品也将于明年推出,目前 Google 正在和三星、Warby Parker 以及 Gentle Monster 这些合作伙伴不断调整产品。

▲ 用语音让 Gemini 拍摄、调用 Nano Bana 创作
作为曾经领先过时代的先行者,面对这两年智能眼镜的浪潮,Google 的整个步调,却走得比想象中慢不少,来得甚至比擅长「后发制人」的苹果还要更晚。
Android XR 于去年年底正式官宣,这期间,Google 找了不少厂商合作,有老搭档三星高通,有新朋友 Xreal,还有跨界的伙伴 Warby Parker 和 Gentle Monster。

▲ Android XR 由 Google、三星、高通合作开发
目前这四种不同的产品形态,其实都有不同程度妥协,明显都不是最终形态。
实际上,Google 给 Android Authority「剧透」了一款没有在活动上公开的新产品,实际演示效果给媒体留下深刻印象:无线双目 XR 眼镜,视野广阔,画面效果更好,目前公布的四款产品身上的优点集其一。
但 Google 表示,无线双目 XR 眼镜短期内不会对外销售,最早也要等到 2027 年。
很明显,这款有点小彩蛋性质的神秘产品,才是 Google 心目中的「Google Glass」升级版,但他们并没有选择直接发布这款产品,甚至没有放到发布会上谈。
Google 其实不必担心会在这场新兴硬件的激烈竞争中落后,他们已经吸收了 Google Glass 当年的教训,手握 Android XR 和 Gemini 两大王牌回归。
不仅是 Google Glass,即使对于现在的 XR 眼镜,应用和内容生态不足,杀手级场景的缺乏,还是难以突破的困局。
Android XR 不仅能利用现成的 App 生态,这个平台本身也能吸引大量的设备厂商和开发者,大大降低了门槛,成长速度值得期待。

更重要的是,作为目前最出色的 AI,Gemini 填补了杀手级 App 的空缺。借助智能眼镜的摄像头、麦克风和 XR 显示屏,Gemini 强大的上下文理解与多模态能力得以充分发挥,创造出智能手机和其他硬件难以触及、专属于智能眼镜的独特场景。

对 Google 来说,接下来就是按部就班把画的饼一一填上的过程,比当年激进和实验的 Google Glass 更有章法。接下来几年我们都能看到这些产品逐步迭代,渐渐朝最理想的形态靠拢。
当然,这三款新的「Google Glass」究竟是不是一个良好的重新出发,还需要等产品实际问世,由时间验证。
但至少,不管是 Google 还是整个智能眼镜行业,明年都相当值得期待。
梅赛德斯-奔驰于今日正式发布了新一代的 GLB 车型,这也是继纯电 CLA 之后,第二款采用 MMA 架构的车型。
MMA 平台是奔驰专为紧凑级车型开发的新一代模块化架构,其最大亮点在于「双模兼容」设计:既能支持纯电驱动,也可搭载轻混内燃机系统。这种灵活性,使奔驰在应对欧洲日益严苛的排放法规的同时,也能更好地满足全球不同市场的多样化需求。
按照规划,新一代 GLB 将于 2026 年初率先登陆欧洲市场。燃油版起售价约为 4.1 万英镑(约合 38.6 万元人民币),纯电版则接近 5 万英镑(约合 47.1 万元人民币)。
作为目前 MMA 家族中尺寸最大的成员,新一代 GLB 提供五座和七座两种座椅布局。其车身长宽高分别为 4732mm / 1861mm / 1687mm,轴距达到 2889mm,相较前代增加了 60mm。与前代 EQB 相比,驾驶员和前排乘客的最大头部空间增加了 35mm,后排第二排和第三排的乘坐空间分别增加了 64mm 和 10mm。

作为对比,同样拥有三排座椅的特斯拉 Model YL 的长宽高分别为 4976 / 1920 /1668mm,轴距为 3040mm,考虑到 Model YL 的第三排空间已经只是堪堪够用的水平,新一代 GLB 的三排乘坐体验想必称不上有多舒适。
对此,奔驰官方称,「GLB 的三排可舒适容纳身高 168 厘米以下的乘客,配合更大的车门开口和可调节的第二排座椅,进出便利性有所改善。」
不过轴距的增加还是为新一代 GLB 带来了更充裕的腿部和头部空间,车辆的第二排座椅支持纵向滑动,这让车内的装载空间变得极为灵活。

储物方面,新一代 GLB 配备了一个 127 升的前备厢,是奔驰新家族中最大的,足够放下一个小型帐篷或一箱饮料。后备厢在五座/七座状态下分别拥有 540/480 升的容积,放倒后排座椅后,可扩展至的 1715/1605 升。

外观上,新一代 GLB 延续了平直腰线、方正车顶、外扩轮拱的设计语言,加上黑色塑料防擦条和裸露式下护板,强化了「硬派感」。

电动版与燃油版在前脸细节上有所区别,电动版毫不意外的采用封闭式面板,嵌入 94 颗可编程 LED「星徽」,支持迎宾/送别光效;燃油版则保留传统镀铬星阵格栅并搭配了发光边框。车尾则统一使用集成动态动画效果的贯穿式灯带。


此外,奔驰也没有忘记给 GLB 的天窗玻璃加上 158 颗星星闪闪发光的三叉星辉,这一源自纯电 CLA 的设计语言,正逐步成为奔驰新一代产品的标志性元素。
走进车内,新一代 GLB 换装了源自旗舰 S 级的「Superscreen」一体式三联屏:10.25 英寸仪表盘 + 14 英寸中控屏 + 14 英寸副驾娱乐屏,横向贯穿整个仪表台。
不过与高配 GLC EV 所采用的真·一体化大连屏不同,GLB 的三屏之间仍存在明显边框分隔,豪华感稍显逊色。

如果有关注 smart 精灵 5 EHD 的朋友或许会发现,GLB 的内外饰设计语言似乎和 smart 有些许相似,这并不意外,毕竟两者都有奔驰的全球设计中心参与研发。

▲ smart 精灵 5 EHD 内饰
新一代 GLB 的车机系统此次也升级至了最新版 MBUX 智能交互系统。
新 MBUX 的一大突破,在于深度整合 AI 能力。其语音助手「Hey Mercedes」升级为基于 ChatGPT 的多轮对话系统,具备短期记忆,能理解上下文语境。更关键的是,它还接入了 Google Gemini AI,用于处理复杂的个性化导航请求,比如「找一家附近有充电桩、评分高于 4.5、且提供儿童座椅的餐厅」。
此外,尽管强调触控与语音交互,奔驰却还是「听劝」的重新引入物理音量滚轮和自适应巡航控制实体开关。

与 CLA 一样,GLB 将率先推出纯电版本,初期提供两个配置:后驱 GLB 250(260 马力)和四驱 GLB 350 4Matic(349 马力),全系标配 85kWh 电池,CLTC 工况下最高续航约 630 公里。
得益于全面转向 800V 高压平台,新车峰值充电功率可达 320kW,10 分钟即可补充约 260 公里续航。
稍晚些时候,入门级 GLB 200 将加入阵容,搭载 58kWh 电池,续航约 450 公里,功率降至 221 马力。

燃油版车型预计于 2026 年下半年上市,彻底告别饱受争议的 1.3T 发动机,换装全新的 1.5T 四缸轻混动力系统。燃油版共有三种输出版本:134 马力(前驱)、161 马力(前驱)和 188 马力(四驱)。混动系统配备 1.3kWh 电池和 27 马力电机,支持低速纯电行驶。参考技术相同的 CLA 混动车型,WLTC 综合油耗预计在 5.5L/100km 左右。
而在操控与行驶质感上,奔驰没有因为 GLB 的「入门」定位而妥协。
前悬采用优化后的麦弗逊结构,下控制臂由锻造铝合金制成的横向臂与推力臂组成,转向节亦为铸铝材质,在实现轻量化的同时,特别强调高外倾刚度,确保精准的转向响应与低噪音表现。
真正的亮点在于后桥——全新开发的多连杆独立后悬架首次被下放到 B 级车型上。这一通常用于 E 级、S 级等高端车型的高规格底盘结构,显著提升了行驶稳定性、滤震能力与整体高级感。
此外,GLB 全系标配带自适应可调阻尼的悬挂系统。驾驶员可通过 DYNAMIC SELECT 旋钮在「舒适」与「运动」模式间切换。系统通过多个传感器实时监测车辆状态、路况及驾驶风格,并能对每个车轮的减震器进行毫秒级独立调节,实现动态平衡。

奔驰还特别介绍了在 GLB 上首次得到应用的多源热泵系统。
这套源自技术旗舰 VISION EQXX 的成果可以并行利用三个热源:电驱系统和电池产生的废热,以及环境空气中的热量。通过回收这些热能,该系统仅需消耗传统辅助加热器约三分之一的电能,就能达到同等的制热效果,从而显著减少对电量的消耗。
在-7°C 的环境下,GLB 仅需 20 分钟即可将车内加热至舒适温度,速度是上一代车型的两倍,甚至优于同级别的燃油车。更关键的是,能耗却只有上一代的一半左右。

目前,特斯拉尚未将 Model YL 引入欧洲市场,因此在该地区,新一代 GLB 确实缺乏直接对标车型。它是当前唯一同时提供纯电与轻混动力、并可选七座布局的豪华品牌紧凑型 SUV。这种「双模+多座」的组合,在法规趋严与家庭用户需求之间找到了一个务实的平衡点。
但在中国市场,本土新势力在智能化、补能效率和成本控制上的优势,使得纯电版 GLB 很难在 30 万–50 万元价格区间形成竞争力。相比之下,燃油版或许更具竞争力,它不仅彻底告别了争议多年的 1.3T 发动机,内饰也同步升级至最新版的大连屏,整体产品力明显提升。
今年前 10 个月,国内市场一共售出了约 2.87 万辆 GLB,月销峰值接近 5000 辆。这一数字虽远不及 GLC,但在豪华品牌整体承压、消费者购车更趋理性的背景下,属于相当稳健的表现。
换言之,新一代 GLB 的真正机会,或许不在于「颠覆」,而在于「巩固」,通过补齐短板、优化体验来稳住现有用户基本盘,在依然认可奔驰品牌的用户心中,继续扮演一个可靠、体面且功能完整的选项。
没想到在华为 Mate 80 系列、三星首款三折叠接连发布的一周里,最火的会是搭载豆包手机助手技术预览版的中兴 nubia M153。
发售即售罄就不说了,首批工程机在二手平台上普遍加价数百元转卖。相比官方 3499 元的定价,市场需求确实旺盛。
尽管豆包手机助手官方多次强调,目前的技术预览版并不面向普通的消费者。其定位更像是一个技术展示和生态探索的实验田,吸引开发者和技术发烧友参与体验。

但这根本挡不住大众体验的热情。除了点外卖发帖子这些基操,还有网友用它 10 分钟投了 30 份简历。
不过争议也随之而来,微信、淘宝等一众 App,开始通过「环境异常检测」等门槛把豆包手机助手拦在门外。
官方目前也调整部分 AI 操作手机的能力,官方表示希望「推动形成更清晰、可预期的规则」,避免一刀切否定用户合理使用 AI 的权利。
罗永浩则发文力挺,称这是谁都拦不住的技术革命,将来人们会记住这历史性的一天。荣耀表态欢迎,而魅族厂商则表示期待深入合作,打造更繁荣的生态。

而在国内出圈后,豆包手机助手甚至火到了海外,在 X 平台上,一堆老外都在疯狂讨论这事,甚至有人直接给它冠上了「另一个 DeepSeek 时刻」的称号。
这评价,可不是随便给的。
雪牛资本(Snow Bull Capital)CEO 泰勒·奥根(Taylor Ogan)直接在平台上发了一长串体验报告,兴奋劲儿都快从屏幕里溢出来了。
他的评价很直白:这是全球第一款真正意义上的智能手机。

在豆包手机助手的协助下,AI 能完全控制手机——能「看懂」界面、自己选应用或下载 App、点击按钮、输入文字、拨打电话,甚至还能执行一整串多步骤任务链。
拿到手机后,他整了不少花活儿。比如随手拍张蔚来换电站问「这是啥」,AI 秒答。

拍个酒店门口,豆包不仅能识别出是哪家酒店,还能根据 Ogan 的需求预定房间,并查询宠物政策。

打辆无人驾驶出租车去公园,豆包能够规划好路线,用最近的上车点完成预约。Ogan 全程只需要用语言表达意图,其它都交给豆包。

用它下单两杯饮料后,外卖无人机很快就把订单飞送到附近储物柜。

走在街上, Ogan 拍了家新开的店,问它是不是本地的品牌,豆包也能查询工商和商标信息,然后果断回答:「是的」。

全程 AI 自己干活,人就负责躺平。
一顿丝滑操作下来,海外网友们大为震惊。

随便翻翻评论区,清一色的点赞声。有网友感慨:「此刻,操作系统变成了管家,手机变成了执行者,而不再只是工具。」有网友猝不及防地表白:「我本来就喜欢豆包,现在更爱它了。」
还有网友直接化身「哇塞哥」:
这是下一级别的东西。我在企业级见过类似的东西,Agent 控制你的 PC 并执行任务,但在手机上有这种技术真的很有意思。想象一下,当谷歌开始在 Pixel 设备和几乎所有 Android 手机上这样做时会发生什么……

Pixel 内心 belike,不对劲,怎么感觉有人在点我?
当然,质疑声也有。有人问:「但它真的智能吗?这模型能在设备上本地运行吗?」Taylor Ogan 的回应是:「它太智能了。你可以选择在设备端运行或云端运行。」

在 Reddit 平台上,讨论同样火热。
有网友表示:「只要这些功能是设备本地的(不使用云服务),并且使用是可选的,我就支持这个。」还有网友一针见血地点出了 AI 的真正意义:「这就是 AI 应该做的事情,为个人节省时间,而不是试图消除个人的价值。」

有一说一,在豆包手机助手发布之后,网友分享在 X 平台上的玩法,也是一个比一个「邪修」。有用豆包点咖啡,也有让豆包 AI 操作安卓机,模拟人手滑页面,主打一个全流程自动化。
还有网友用豆包手机助手下单买了个椰子,由于没够起送价,豆包贴心地帮博主选了一个 1.99 元的一包食用盐来凑单。

APPSO 在之前对豆包手机助手的体验提到,我最直观的感受是,手机变「薄」了,它把各个 App 的能力都「拍扁」了,交互更加自然、直观和高效。
问题来了,这是怎么做到的?这和「phone use」智能体又有什么不同?
在用了一周豆包手机助手后,APPSO 也扒出了背后更多的技术细节。
在豆包手机助手发布之前,手机行业其实已经折腾 AI+ 好一阵子了。
手机硬件厂商试图通过系统层级的 AI 能力,打破应用间的壁垒,实现「一句话办事」。比如华为、小米、vivo、荣耀等主流手机厂商的 AI 智能体,都曾在不同场合展示过自动发送消息、执行多步骤任务等功能。
这些演示虽然在具体场景和实现方式上略有不同,但核心逻辑都是一致的:通过 AI 大模型理解用户意图,并结合模拟用户操作,从而实现跨应用的自动化任务执行。
听着挺玄乎,但实际体验嘛……咳咳,还是有不小的提升空间。

而豆包手机助手的下场,进一步掀起了全网的讨论。更重要的是,根据我之前的体验,豆包手机助手的确是真正意义上把 AI 操作手机这件事做到了可用级别,不局限于几个场景,而是能够流畅自然地通过图形界面操作完成长任务、复杂任务。
APPSO 在知名预印本平台 ArXiv 发现了一篇由字节团队发布的技术报告,里面的信息或许能解释其中的关键原理。
附上地址:https://arxiv.org/abs/2509.02544

豆包手机助手的图形界面操作能力,来自字节跳动 Seed 团队开发的 UI-TARS 模型。它把屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,其开源版本是目前最受欢迎的开源多模态智能体模型。
根据 UI-TARS 2.0 技术报告,这个模型的厉害之处在于,它不是简单的模块化拼凑,而是采用了端到端的学习方式,将感知、推理、行动和记忆整合在一起。

数据不会骗人,在 GUI 基准测试中,UI-TARS-2 的成绩相当能打:
这些成绩不仅明显优于前一代模型,还在多个场景中超越了 Claude 和 OpenAI 等强劲基线模型。其中 AndroidWorld 的 73.3 分更是比 OpenAI CUA-o3 模型高出 20 多分,展现出强大的竞争力。

在游戏环境中,UI-TARS-2 在 15 款游戏组成的测试集中取得了平均标准化得分 59.8,约为人类水平的 60%。相比 OpenAI CUA 和 Claude Computer Use,UI-TARS-2 的表现分别提升了 2.4 倍和 2.8 倍。
这是什么概念?就是 AI 打游戏已经快接近普通人类玩家水平了。

在 LMGame-Bench 中,它依然能与当前最前沿的闭源模型掰手腕,进一步证明其在长时序游戏推理中的稳健性。
更厉害的是,UI-TARS-2 不仅能处理 GUI 任务,还能通过 GUI-SDK 扩展能力,与系统级资源(如终端和外部工具)集成。在信息检索任务(BrowseComp 29.6 分)、软件工程任务(Terminal Bench 45.3 分、SWE-Bench Verified 68.7 分)上都有竞争力。
一个模型走天下,这就是通用性的体现。
值得一提的是,通过接近豆包团队的人士透露,豆包手机助手用的 UI-TARS 是私有模型版本,性能比开源版更强,还针对手机场景做了专门优化。这或许也解释了为啥豆包手机助手实际体验这么丝滑。
豆包手机助手,确实有点技能在身上的。
作为一个长期关注科技产品的编辑,今年令我十分感慨,在这个恨不得把「万物皆塞入手机」的行业,却出现两个异类,分别在设计与交互的维度上,走向了极致。
一个是 iPhone Air,当 Pro 系列不可避免地走向堆料的终局,这种对轻薄的偏执,在参数党眼中或许别无他用,甚至让人一时分不清这是倒退还是进化,直到你把它握在手里,原来,轻盈本身就是一种功能。

而豆包手机助手则站到了交互界面的另一个极端,它不要你去找服务,而是让服务来找你。甚至要掀了 GUI (图形用户界面)的桌子,有一天那块屏幕可能都不是必需的。

一个是硬件,一个是软件,但它们殊途同归。iPhone Air 削减了物理上的累赘,豆包手机助手剥离了交互上的繁琐。
你会发现,当 AI 公司参与到硬件的设计中,他们对交互设计的思路都和传统硬件厂商有所不同。
OpenAI 也正在和前苹果传奇设计师 Jony Ive 打造 AI 硬件,Sam Altman 就曾透露这块设备希望重新定义交互:不需要一堆 app,而是 AI 作为主界面与操作层。
当然,历史告诉我们这类新技术落地必然面临阵痛:适配、隐私、生态……还有各方利益的博弈。先进技术和广泛应用的「双向奔赴」尚需时日,但也是大势所趋。

OpenAI 联创 Andrej Karpathy 前段时间也表达了自己对交互未来的预判:
人机深度协作的时代,那些用户界面(UI)极其复杂(有大量滑块、开关、菜单)、不支持脚本、并且建立在不透明的、自定义的二进制格式上的产品,注定是死路一条(ngmi)。
未来,AI 在理解和操作人类图形界面(UI/UX)方面会越来越强(比如像 Operator 这样的前沿项目),但我怀疑,那些只想坐等这一未来实现,而不主动与当前技术发展水平「双向奔赴」、做出改变的产品,它们的下场不会太好。
敢于吃螃蟹这件事本身,就已经算是值得瑞思拜了,我们也希望看到更多「异类」出现在科技行业。
🍎
苹果高层离职潮持续:芯片负责人正考虑
🛫
北京大兴机场年旅客吞吐量首破 5000 万人次
🤖
众擎老板亲自挑战机器人,被一脚踹翻
🔬
OpenAI 高管否认 ChatGPT 投广告
🛠
史上最大更新,英伟达 CUDA 更新
📱
贾斯汀·比伯怒斥 iPhone 语音输入
🕵
Netflix 收购华纳兄弟细节曝光
💡
李飞飞:拒绝 AI 两极化炒作,回归理性
🤯
被 Gemini3 整怕了,曝 GPT-5.2 本周发布
🚗
140 万元,领克 03+ TCR 赛车售罄
🧚♀️
smart 掀背轿车精灵 6 号亮相
❄️
12306 上线「雪具便利行」功能
🎮
多邻国将与原神展开限定联动
🎥
B 站抖音回应 AI 虐向视频
💰
《疯狂动物城 2》进入年度票房前三

过去一周,苹果接连失去了人工智能主管 John Giannandrea(退休)、设计负责人 Alan Dye(跳槽 Meta)、法务负责人 Katherine Adams(退休)和政府事务主管 Lisa Jackson(退休)。
更糟糕的是,据彭博社援引知情人士透露:负责硬件技术的高级副总裁 Johny Srouji 最近告诉库克,他正在「认真考虑」在不久的将来离职。
Srouji 是苹果最受尊敬的高管之一,也是苹果自研芯片战略的操盘手。他已经向同事透露,如果最终离开,绝对不会是「退休」,而是打算加入另一家公司。
据悉,作为苹果自研芯片战略的核心人物,Srouji 是 M 系列和 A 系列芯片的最大功臣之一,让苹果在性能和能效方面获得了对竞争对手的巨大优势。
报道称,库克以及整个苹果高管层都在疯狂挽留 Srouji,包括提供更加丰厚的薪酬待遇,以及许诺在未来给他更多职权。
公司内部一些高管提出的方案是,将 Srouji 提升为首席技术官,负责硬件工程和芯片技术的大部分工作——这将使他成为苹果第二有权势的高管。 而这也是非常「反传统」的做法:苹果历史上从未设立过正式的 CTO 职位。
此外,据知情人士透露,即便获得了 CTO 的职位,Srouji 仍然希望不用向 CEO 汇报,而是可以有极大的自主权——这对层级森严,汇报体系多年以来一成不变的苹果来说,同样是个麻烦。
值得注意的是,据此前爆料,库克至少要在 CEO 任上到 2026 甚至 2027 年——一种可能性是,库克或许会安排在 iPhone 20 周年,也即 2027 年,正式交棒 CEO。
另外报道还指出,库克在近几个月中,手部会偶尔出现无法解释的颤抖,这一现象在会议和公司大型集会中已被高管和普通员工注意到。但库克身边的人都表示其身体健康,并驳斥了流传在硅谷中的谣言。


据中新网报道,自投运以来,大兴机场年旅客吞吐量首次突破 5000 万人次大关,刷新年度客流新纪录。
截至 12 月 6 日,大兴机场今年累计保障进出港航班 32.25 万架次,迎送进出港旅客 5008.34 万人次,其中国际及地区旅客量达 549.79 万人次,较 2024 年同期分别增长 6.31%、8.41%、25.39%。
据悉,6 年来,大兴机场进出港旅客吞吐量超过 1.93 亿人次,进出港航班超过 141.22 万架次。
今年以来,大兴机场航班放行正常率、起飞正常率均达到 90% 以上,其中起飞正常率在全国 26 个旅客吞吐量 2000 万人次 (含) 以上机场中排名第一。
据介绍,目前,大兴机场已入驻中外航空公司达 70 家,在运营航线近 190 条,通达国内外航点约 180 个,通航亚洲、欧洲、非洲等 25 个国家。

近期,众擎机器人官方发布视频称,团队十分好奇机器人 T800 一脚踹到人身上到底有啥感觉。对此「用老板做了个实验测试下」。
从众擎团队公布的视频来看,T800 对准众擎机器人 CEO 赵同阳伸腿后,赵同阳整个人向后「飞」出去。
挨踹后的赵同阳直呼:「太暴力了、太残暴了。如果不戴护具没人能撑得住,绝对会骨折。」有网友表示:「你们员工太狠了,让老板亲自上阵。多少带了点私人恩怨。」
据了解,众擎 T800 身高 1.73 米,自重 75 千克,系众擎发布的首款「打工机器人」,售价为 18 万元起。
近期,据 X 平台用户 Tibor 发现,ChatGPT 安卓应用 1.2025.329 测试版中出现了与「广告功能」相关的新代码,包含「集市内容」、「搜索广告」和「搜索广告轮播」等字眼,表明广告功能即将向公众推出。
针对 ChatGPT 加广告这一情况,ChatGPT 产品经理 Nick Turley 日前发文回应表示「目前没有进行广告的功能测试」。Nick 指出,网传的任何截图要么是假的,要么就压根不是广告。
其称,如果 OpenAI 真的要推行广告功能,那么团队会采取审慎的态度。「人们信任 ChatGPT,我们做任何事都会设计得尊重这种信任。」
值得一提的是,从用户规模看,ChatGPT 已具备广告业务的坚实基础。目前每周活跃用户量约 8 亿。OpenAI 支持的研究曾预计,到今年 7 月将有 7 亿用户每周发送 180 亿条消息,其他分析师估算月访问量达 50 亿至 60 亿次。
OpenAI 可以利用这些数据在 ChatGPT 上投放高度个性化的广告,精准推荐用户真正想购买的产品,也可能像谷歌搜索广告那样在搜索结果中植入广告。

日前,英伟达宣布,其 NVIDIA CUDA Toolkit 13.1 正式发布,并且号称「20 年来最大的一次更新」。具体来看:
🔗 想了解 CUDA 新功能小伙伴可以前往:https://developer.nvidia.com/blog/nvidia-cuda-13-1-powers-next-gen-gpu-programming-with-nvidia-cuda-tile-and-performance-gains?ncid=so-twit-259531
据 Business Insider 报道,Meta 正在开发一款代号为 Phoenix(凤凰) 的新型混合现实眼镜,但它的发布时间已从 2026 年下半年延后至 2027 年上半年。
此外,根据此前彭博社报道,Meta 创始人扎克伯格计划大幅削减元宇宙项目资源。
知情人士透露, Meta 高管正考虑明年将元宇宙部门预算削减高达 30%, 最早可能在明年 1 月启动裁员,不过最终决定尚未敲定。削减范围涵盖虚拟世界产品 Meta Horizon Worlds 和 Quest 虚拟现实部门, 其中 VR 团队将承受最大冲击, 因其占据了元宇宙相关支出的大部分。
Meta 已证实削减计划, 并表示节省的资金将转向 Reality Labs 部门的其他未来项目,** 重点是 AI 眼镜和可穿戴设备。**这次削减是 Meta 2026 年度预算规划的一部分。
知情人士称, 上月扎克伯格在其夏威夷住所召开了一系列预算会议, 要求各部门全面削减 10%, 这是近年来标准做法。但元宇宙团队被要求削减更多, 因为 Meta 并未看到最初预期的行业竞争态势。
尽管大幅收缩元宇宙,Meta 仍致力于消费级硬件研发, 本周还聘请了苹果公司顶级设计高管 Alan Dye 加盟。Meta 将成立一个新的设计工作室,并任命他负责硬件、软件以及界面中整合 AI 的设计工作。

日前,歌手贾斯汀·比伯发文怒斥 iPhone 的语音输入按钮设计。
比伯指出,iPhone 的 iMessage 中的语音输入按钮设计不合理,不仅会因为摆放位置容易误触,并且还会造成正在播放的音乐被强制中断。比伯表示,其打算找到苹果的所有人,并且对他们使出后颈锁喉技能。
同时其还指出,就算关了语音输入也依然会有 iMessage 的语音发送功能按钮,同样会导致误触以及音乐中断。
对此,比伯认为,「发送按钮不应该在同一位置具有多种功能」。
据 IT 之家消息,昨日,零一万物 CEO、创新工场董事长李开复在 2025(第二十三届)影响力企业家年会上发表了主题演讲。
他认为,AI Agent 带来的革命不只是制造了一个工具,而是能帮助重构公司,帮助公司增效。公司以后会有越来越多的 Agent,一个 CEO 管着很多 Agent,而且这些 Agent 会一年会比一年便宜,因为推理成本在快速下降。
他还指出未来办公司就像搭积木一样快,以后企业的竞争力就体现在:
据悉,这并不是李开复第一次提出类似观点。
在 11 月 1 日举办的 2025 GOTC 全球开源技术峰会上,李开复就曾指出,如今一个企业的组织架构基本是以人作为单位的,慢慢地这些人作为单位的企业,有些可能部分或全部被 AI Agent 替代,「最终一个公司的组织架构大部分都会 Agent,人会越来越少,可能在里面就会去做一个比较难的、安排性的任务。」

日前,Meta 宣布已经正式收购可穿戴 AI 设备制造商 Limitless。同时,Limitless CEO Dan Siroker 在社交媒体上发文称:
Meta 最近宣布了一项新的愿景,旨在让每个人都能拥有个人超级智能,而其中的关键部分就是打造强大的 AI 可穿戴设备。我们与 Meta 拥有相同的愿景,并将携手合作,将这一目标变为现实。
在完整声明中,Siroker 解释了做出这一决定的背景:
五年前我们创立 Limitless 时,世界还完全不同。那时,人工智能在很多人眼中只是空想,硬件创业公司往往难以获得资金,而同时做 AI 和硬件的企业,更是被认为不切实际。但如今,时代已经变了。我们不再在探索一条『边缘』的道路,而是在建设一个看似必然到来的未来。
此次收购意味着 Limitless 将停止销售其许多现有产品。其中包括一款能够记录会议和对话内容的爆火可穿戴 AI 设备 Pendant(吊坠)。不过, Limitless 将继续为现有 Pendant 用户提供至少一年的技术支持。
发布初期,Dan Siroker 称 Limitless Pendant 是世界上最容易穿戴的 AI(硬件)。该产品尺寸只有 31.9mm 宽,16mm 薄。
其次,没有屏幕的 Pendant 其实保留了大部分电子设备零部件,比如它支持 Wi-Fi 和蓝牙连接,即使在没有手机,Limitless 也能单独使用。
该产品专注于 AI 录音。设备可以根据你即将要做的事情,根据你先前的背景和经历,给出专属于你的行动建议。

近日,Netflix 正式宣布将以 827 亿美元的价格收购华纳兄弟探索、HBO 及 HBO Max。而在 6 日,路透社曝光了收购的细节内容。
知情人士透露,Netflix 原本只是为了了解情况而展开的一次调研,最终却引向过去十年最具分量的媒体收购之一,并可能重塑全球娱乐业的竞争格局。
有趣的是,Netflix 在 10 月还刻意淡化「收购好莱坞大型制片厂」的传闻。但当华纳兄弟探索公司拒绝派拉蒙三轮主动报价并于 10 月 21 日正式启动竞拍时,Netflix 决定入局。
报道透露,根据七位顾问与高管首次完整披露的 Netflix 内部决策过程、与华纳董事会的讨论,Netflix 原本只是想摸清这家百年制片厂的业务结构,但很快意识到机会远比想象中更大。
除了片库内容对于流媒体平台的巨大价值(观看量占比可达 80%),华纳的制片体系、宣发能力与 Netflix 形成互补;而 HBO Max 也能借助 Netflix 多年积累的经验加速成长。
在华纳兄弟探索公司宣布将拆分为两家上市公司后,Netflix 开始认真考虑收购制片厂与流媒体资产,因为拆分将为买方创造更清晰、可操作的交易窗口。
而在今年秋季之后,竞争开始变得激烈,Netflix 需要同时面对派拉蒙与康卡斯特。
派拉蒙方面为抢在拆分前完成交易提交了多轮报价,希望避免拆分削弱其整合传统电视网络业务的能力,并避免被 Netflix 等竞争者抢走制片厂部分。派拉蒙在最后一刻将报价抬到 780 亿美元,不过董事会对其融资能力存疑。
而 Netflix 那边是一刻也不肯懈怠:Netflix 团队与顾问团队过去两个月每天开会,连感恩节都在准备投标,务求赶上 12 月 1 日的截止日期。
据悉,Netflix 于上周四提交的最终报价,是华纳董事会认为唯一具约束力且信息完整的方案。Netflix 还提出 58 亿美元的巨额分手费,以消除监管风险带来的不确定性。
日前,在斯坦福经济政策研究论今天正式公布的论坛视频中,李飞飞分享了自己对于当前 AI 圈子的部分看法。
在她看来,25 年前她进入这个领域时,正值 AI 寒冬,没光环、没钱、没人关注。现在 AI 成了「文明级别」的技术,但她最失望的恰恰是行业里满天飞的极端言论。
她更关心的是另一件事:空间智能。
人类光靠「说话」灭不了火。开车、做三明治、拥抱孩子,这些动作都和语言无关,而是和视觉、几何、空间、操作有关。李飞飞认为,如果说大语言模型已经打赢了第一仗,那么下一章就是空间智能,也就是让机器真正能「看见」和「行动」。
李飞飞认为,现在大家应该要「拒绝两极化炒作,回归理性」。她承认,AI 发展快得惊人,但极度反感当前舆论场中「末日论」(人类灭绝)和「乌托邦论」(无限繁荣)并存的极端现象。
她认为这会误导缺乏 AI 素养的公众,呼吁大家关注技术本身对普通人生活的实际影响,而非沉溺于夸张的预测。
同时,李飞飞也不忘「空间智能」。她指出,智能不等于语言(大模型)。人类进化的核心是视觉与行动,而非单纯的语言。AI 的下一阶段必须突破「空间智能」,即让机器具备在三维世界中感知、推理和行动的能力。这将彻底改变机器人、创意制作和模拟训练领域,比语言模型更具挑战性。


据 The Verge 援引知情人士消息称,OpenAI 计划最早于本周初发布 GPT-5.2 模型, 这一时间表较原定的 12 月下旬计划大幅提前。目前公司已将发布日期暂定为 12 月 9 日。
消息人士称, 此次提前发布直接源于竞争对手施加的压力。
Google 上月推出的 Gemini 3 模型在多项评测排行榜中领先, 其表现甚至令 OpenAI CEO Sam Altman 感到震惊。知情人士表示,GPT-5.2 的性能提升将有望缩小 Google 此前建立的领先优势。
最近,X 博主 @iruletheworldmo 也分享了关于这款基础模型的基准测试成绩。不过,真实性尚未得到确认,请谨慎看待。
除了新模型发布,OpenAI 正在调整产品战略方向。未来数月内,ChatGPT 的改进重点将从增加新奇功能转向提升 ChatGPT 的响应速度、系统稳定性和个性化定制能力。

12 月 6 日,领克在 CO 客大会现场正式发售全球首台中国品牌自研量产 TCR 赛车——领克 03+ TCR 赛车,新车售价 140 万(人民币),定金 28 万(人民币)。
官方介绍,这台由领克汽车自主研发打造的全新国产赛车在场地类冲刺赛的基础上,将拓展到更考验车辆综合性能的耐力赛领域,开启领克汽车运动新篇章。
据悉,领克 03+ TCR 赛车是以领克 03++量产车为原型打造,竞技式宽体造型,配以红色为主的设计涂装。同时,CMA 世界级架构为新赛车动力、操控和底盘提供了更为坚实的技术支持。
领克 03+ TCR 赛车延续 Drive-E 2.0 升 4 缸涡轮增压直喷发动机的优势,并针对散热部件全新调教,底盘更稳、操控更敏捷,最大输出功率 350 匹马力,峰值扭矩达到 420 牛米。
而在开启预定后,领克官方表示目前首批订单已售罄(2026 年 4 月前产能已售罄)。

日前,在工信部发布的最新一批新车申报信息名录中,smart 精灵 6 号正式曝光。
新车将定位豪华掀背轿车,尺寸为 4906×1922×1508mm,轴距 2926mm。该车由梅赛德斯-奔驰全球设计团队打造,沿用「感性·灵锐」设计哲学,采用动感十足的掀背设计,尾部配备多档位电动尾翼。
精灵 6 号采用 smart EHD 超级电混,源自行业领先最新一代雷神电混 2.0 技术——搭载 1.5T 高效发动机与 3DHT(3 档混动专属变速箱)组成的黄金动力总成。
此外,新车的综合续航里程达到 1810km,同时刷新 smart 品牌与现阶段同级车型续航数据。

据新华社报道,12 月 7 日起至 2026 年雪季结束,铁路部门在京张高铁北京北至崇礼间各车站运行的 G 字头列车试点推出「雪具便利行」服务,铁路 12306 客户端同步上线「雪具便利行」功能。
国铁北京局客运部相关负责人介绍,此前,铁路部门按照《国铁集团铁路旅客运输规程》「旅客乘坐动车组列车随身携带的行李物品长、宽、高之和不超过 130 厘米」的规定,对超过上述尺寸标准的雪具推出了「雪具快运」服务。
服务相关内容汇总:

近日,多领国宣布将与原神展开限定联动,活动将于今日(2025 年 12 月 8 日)上午 8:00 开始,到 12 月 28 日上午 7:59 为止。
据悉,用户需在多邻国中连续 3 天延续连胜,即可赢得独家多邻国主题原神奖励包。
奖励包将包含头像「勤思勉学」×1、名片「庆典·梦读」×1、食谱「香辛炸鸡块」×1、料理「香辛炸鸡块」×1、原石 ×60、精锻用魔矿 ×4、大英雄的经验 ×2。
另外,完成特别任务后,还可以在多邻国领取宝石。
据红星新闻报道,近期有不少网友反馈,称在网络视频平台上出现大量以动画人物形象为原型的玩偶 AI 视频与图片。
据悉,部分内容涉嫌呈现血腥暴力、低俗辱虐、恐怖等不当要素,并通过玩偶外观包装提升点击,且评论区出现「幼儿园儿童沉迷观看」等反馈。
据不完全统计,仅在哔哩哔哩,类似的 AI 低俗、辱虐相关视频就有至少数百条,在抖音平台也有上百条,小红书、百度等平台亦有零星出现。
针对上述「虐向」视频传播的问题,哔哩哔哩和抖音相关负责人通过报道做出表示,对最新出现的涉嫌侵害引导的内容已展开全面排查,从严管控,目前在搜索及内容端已展开定向处置。
而抖音方面表示,《抖音社区自律公约》鼓励用户创作积极、有价值的优质作品,对此类新型邪典内容坚决打击,已对相关违规内容予以下架处置。


据灯塔专业版,截至 12 月 7 日,《疯狂动物城 2》总票房(含预售)已突破 30 亿,进入 2025 年票房榜前三名。
信息显示,目前全国票房排名前二分别为《哪吒之魔童闹海》以及《唐探 1900》,均为 1 月 29 日上映,票房分别为 154.46 亿元和 36.12 亿元。
据悉,除票房外,影片的商业联动也在中国市场掀起热潮。澎湃新闻指出,《疯狂动物城2》上映前后已有近 60 起品牌联名活动,涵盖潮玩、餐饮、服饰、汽车等多个领域,形成全方位的消费狂欢。

12 月 6 日晚,中美合拍大型动画《我的哪吒与变形金刚》正式开播,首播 26 集,每晚 20:30 在 CCTV14 少儿频道播出,爱奇艺、优酷、腾讯视频、哔哩哔哩同步播出。
据介绍,《我的哪吒与变形金刚》由央视动画与美国孩之宝公司联合制作,将中国神话人物哪吒与美国变形金刚两大经典 IP 进行跨界融合。该项目于 2017 年启动合作、2019 年正式公布预告、2024 年调整片名后计划首播。
动画剧情围绕哪吒与变形金刚组成联盟对抗反派势力展开,片中引入全新小学生角色作为故事视角,通过儿童幻想设定串联起跨文化角色联动的冒险主线。

据守望好莱坞消息,《使女的故事》续集《证言》首曝剧照,并宣布明年 4 月 Hulu 开播。
据悉,《一战再战》女主 Chase Infiniti 等饰演 Gilead 新一代的女人,她们成长起来,面对惨淡的未来,继续为自我和自由斗争。
该剧同样为玛格丽特·阿特伍德作品改编:《使女的故事》后续小说《证言》曾获 2019 年布克奖,设定在《使女》结局的 15 年多以后的反乌托邦神权政体 Gilead。
该本剧描述聚焦 3 个女性角色,也是 Gilead 新一代女人的成长故事。年轻的她们所有思维都是在 Gilead 被灌输,没有在外面的世界生活的记忆,面对凄凉暗淡的前景——结婚、被奴役……她们必须找到帮手——不管是熟人还是新人——来帮助自己去斗争,争取自由和应得的生活。