最近各种年度回顾陆续上线, OpenAI 的前联合创始人 Andrej Karpathy 也交出了自己对大模型的年度总结
就在今年早些时候,他在 YC 的一场演讲刷爆了全网,提出了不少新的观点:
Karpathy 今天这篇《2025 年度总结》,他再次向我我们剖析了这一年 AI 究竟长出了什么样的「脑子」。
以下是对 Karpathy 年度总结的精译,APPSO 在不改变原意的基础上做了更多通俗解读。
如果想看原文可以点击🔗 https://karpathy.bearblog.dev/year-in-review-2025/
2025 年是 LLM(大语言模型)发展强劲且充满变数的一年。以下是我列出的几点个人认为值得注意且稍感意外的「范式转变」——这些变化不仅重塑了行业版图,更在概念层面上狠狠地冲击了我的认知。
🛑 太长不看版:
2025 年既让人兴奋,又有点让人措手不及。
LLM 正在作为一种新型智能涌现,它同时比我预期的要聪明得多,也比我预期的要笨得多。
无论如何,它们极其有用。我认为即使以目前的能力,行业甚至还没挖掘出其潜力的 10%。同时,还有太多的想法可以尝试,从概念上讲,这个领域感觉依然广阔。正如我今年早些时候提到的,我同时(表面上矛盾地)相信:我们将看到持续快速的进步,但前方仍有大量艰苦的工作要做。
系好安全带,我们要发车了。
在解释这个复杂的基础概念之前,先看看以前是大模型训练是怎么做的?
在 2025 年初,各大实验室训练 LLM 的「老三样」配方非常稳定:
1. 预训练(Pretraining):像 GPT-3 那样,让 AI 读遍全网文章,学会说话。
2. 监督微调(SFT):找人写好标准答案,教 AI 怎么回答问题。
3. 人类反馈强化学习(RLHF):让 AI 生成几个答案,人来打分,教它讨人喜欢。
现在发生了什么变化?
2025 年,我们在这个配方里加了一味猛药:RLVR(从可验证奖励中进行强化学习)。
这是什么意思?
简单来说,就是不再让人来打分(人太慢且主观),而是让 AI 去做那些「有标准答案」的任务,比如数学题或写代码。对就是对,错就是错,机器能自动验证。
在数百万次的自我博弈和试错中,模型自发地演化出了看似「推理」的策略。它们学会了先把大问题拆解成小步骤,甚至学会了「回过头来检查」这种高级技巧(参考 DeepSeek R1 论文)。
核心对比:
这一招太好用了,以至于 2025 年大部分算力都被这只「吞金兽」吃掉了。结果就是:模型并没有变大,但训练时间变长了。 我们还获得了一个新旋钮:让 AI 思考得久一点。OpenAI 的 o1 是开端,而 o3 则是真正的拐点。
2025 年,我和整个行业终于从直觉上理解了 LLM 智能的「形状」。
一个惊悚的比喻:我们不是在像养宠物一样「进化/养育动物」,我们是在「召唤幽灵」。
为什么这么说?
因为 AI 的一切都和生物不同。人类的大脑是为了在丛林里活下来、为了繁衍后代而优化的;而 LLM 的大脑是为了模仿人类文字、在数学题里拿分、在竞技场里骗赞而优化的。
参差不齐的智能(Jagged Intelligence):
正是因为 RLVR(可验证奖励)的存在,AI 的能力在某些领域(如数学、编程)会突然飙升成刺状。这就导致了一种极其滑稽的现象:
▲这里 Karpathy 引用了一张梗图:人类智能是圆润的蓝色圆圈,AI 智能是像海胆一样满是尖刺的红色图形。这很形象.
这也解释了为什么我对现在的「跑分榜单」(Benchmarks)失去了信任。
什么是「刷榜」的本质?
既然榜单是可验证的,那就可以用 RLVR 针对性训练。现在的实验室都在搞「应试教育」,把 AI 的能力尖刺专门往考题上长。「在测试集上训练」已经不仅仅是作弊,而成了一门新的艺术形式。

Cursor 今年的爆火,揭示了一个新真相:LLM 应用层比我们想象的要厚。
大家开始谈论「医疗界的 Cursor」、「法律界的 Cursor」。这些应用到底做了什么?
预测:大模型实验室(如 OpenAI)会负责培养「全科大学生」;而应用开发商(如 Cursor)则负责给这些学生提供私有数据和工具,把他们组建成「专业施工队」。

Claude Code (CC) 的出现让我眼前一亮。它不仅仅是一个能写代码的 Agent(智能体),更重要的是:它活在你的电脑里。
对比来看,我认为OpenAI 搞错了方向。
OpenAI 早期的 Agent 都在云端跑(ChatGPT),离你的真实环境太远。虽然云端智能体听起来像是 AGI 的终局,但在当前这个「参差不齐」的过渡阶段,本地才是王道。
为什么本地很重要?
因为你的代码、你的配置、你的密钥、你的混乱环境,都在本地。Anthropic(Claude 的母公司)搞对了优先级,他们把 AI 塞进了一个小小的命令行界面(CLI)里。
它不再是你浏览器里的一个网页(像 Google 那样),它变成了一个寄宿在你电脑里的「赛博幽灵」,随时准备帮你干活。这才是未来 AI 交互的样子。
什么是 Vibe Coding?
这是我在推特上随口造的一个词(居然火了):意思是写代码不再需要你真的懂语法,你只需要用英语描述你的「意图」和「感觉」,剩下的交给 AI。
这带来了什么改变?
举个例子,我为了找一个 Bug,可能会让 AI 现场写一个专门的 App 来测试,测完就删。放在以前,为了找个 Bug 专门写个 App?疯了吧!但在 2025 年,代码是免费的。
Vibe Coding 将会彻底重塑软件行业,也会改写程序员的招聘 JD。

为什么现在的 AI 交互很反人类?
不管是 ChatGPT 还是 Claude,我们还在用「打字」跟它们聊天。这就像 80 年代还在用 DOS 命令行的黑底白字。
事实是: 计算机喜欢文本,但人类讨厌读文本。人类是视觉动物,我们喜欢看图、看表、看视频。
Google Gemini Nano banana(这是一个虚构的模型代号,指代某种多模态交互模型)是 2025 年的另一个范式转变。它暗示了未来的 LLM GUI(图形界面) 是什么样子的。
未来的 AI 不应该给你吐一堆字,它应该直接给你画一张图、生成一个网页、弹出一个交互面板。 这不仅仅是「画图」,而是将文本生成、逻辑推理和视觉表达纠缠在一起的混合能力。
这两天大家都在为《阿凡达 3》摩拳擦掌,而如何挑选影厅,到底该看 CINITY、IMAX 还是杜比,是个巨大的纠结——没关系,我们有一篇文章专门帮大家答疑解惑。
但如果你想要一块随身巨幕的话,我想在 2025 年底,没有比 XREAL 1S 更合适的(多么丝滑的转场!)
消费级增强现实 (AR) 眼镜的进步,基本上被 XREAL 这一家公司撑着。作为唯一同时具备自研空间计算芯片和自研光学系统能力的 AR 技术公司,XREAL 在「眼镜作为随身巨幕」的这个细分市场上,可以说让竞争对手望尘莫及。
这个优势,被 XREAL 最新发布的 1S 眼镜再次保持住了。
虽然实话来说,各方面和之前该公司发布的同为 One 系列的 AR 眼镜大差不差(都以随身巨幕为主要功能点),但这次 1S 的销售价格更加亲民,明摆着冲着年轻消费人群而来。
更重要的是,XREAL 独家自研的 X1 空间计算芯片,使得无设备歧视的纯原生云台增稳、极低 M2P 延迟的画面悬停等 3DoF 能力成为可能;以及 52° 的 FoV、自动电致变色——诸多过去只在旗舰机上才有的体验和功能,这台价格更亲民的 1S 更是一个没落下。
诚恳地讲,如果你只是需要一个随身巨幕,无论是飞机高铁看电影,还是日常当个隐私感更强的扩展屏,而且对体验颇为吹毛求疵的话,那么国补后价格打下来到了 2799 的新款 XREAL 1S,比价格更高的竞品,以及同品牌的前序产品,还要更物超所值。
爱范儿最近使用了 XREAL 1S 一个星期左右,主要场景是办公屏幕、看电影,以及外接手机在长途通勤时刷剧/打游戏,来说说这台随身巨幕眼镜的主要卖点和对应的体验。

很多 AR 眼镜都宣称自己有巨幕,但除了「巨」之外,一切其它的体验细节,诸如画面稳定性、动态延迟等等,都好像没有被顾及到。
XREAL 1S 则并非如此,它的屏幕不仅大,而且观感更「真实」:戴上眼镜,选定屏幕位置之后,屏幕能够一直稳定悬浮在选定的位置,无论怎样晃动、旋转头部,甚至摘下眼镜再戴上,那块屏幕都会一直在那里。
我觉得悬停效果的优劣,对于巨幕眼镜的体验好坏起到决定性作用。稳定的悬浮,让画面感到真实,能够显著改善 AR 眼镜的眩晕问题。AR 眼镜的可视角度逐渐增广,显示面积越来越大,但既然我们把它当做一块巨幕,那么画面的稳定性才更重要。
这就好比你沉浸在一部电影那引人入胜的剧情当中,旁边有人喊你,你转了个头,再转回来的时候,画面的位置突然变了,沉浸感没了,那不会是好的观影体验。悬停效果的好坏,其实和人类视觉的「直觉性」关系很大。而越符合直觉,体验就会越好。

现在我们建立了「画面空间悬浮固定」很重要这个前提。在此基础上,更进一步,我认为画面能够跟随用户的需要,及时移动位置,且过程中保持稳定和顺滑,同样很重要。
如果需要移动画面位置,XREAL 做了一个很简单的设计:长按镜腿下方的 X 按钮,也就是眼镜上唯一的红色按钮/主要的交互按钮,即可重新定位画面。你不需要进入多级菜单,绕来绕去,即可完成操作。

这个功能的背后有多重场景考虑:比方说你脖子酸了,后仰靠在椅背上,可以把画面重新定位到仰角更高的位置,来放松一下脖子;再比如,当你临时需要在多个屏幕上进行多任务操作,可以将眼镜当做副屏,把画面重新定位到桌面主显示屏的旁边(当你转头看回主屏幕的时候,镜片还会自动变色,让你能够清晰看到主屏幕上的内容)——无论场景是什么,这个功能都很方便。
而与悬停模式平行的,是另一个模式:云台跟随。同样无需任何外挂传感、适配器、第三方软件,在跟随模式下,1S 的画面能够实现类似「云台」一样的稳定效果,无论是下意识的头部/脖子轻微晃动,还是大幅度的活动,画面都会在一定范围内保持稳定,只在动作幅度足够大的时候,才会顺滑地跟随。

上述的画面悬浮锁定、云台防抖等功能的背后,是 XREAL 自研 X1 空间计算芯片的功劳。这颗芯片不仅能够实现优秀的原生 3DoF 能力,另一大作用是显著降低了 M2P(motion to photon)延迟,也即从「用户头部运动开始」到「渲染图像发生相应变化」中间的延迟。
XREAL 的官方数据显示,没有 X1 芯片时,数据处理的链路较长,甚至需要视频输入源设备(电脑、手机等)的 CPU 和 GPU 运算,M2P 延迟可能超过 20 毫秒,延迟是肉眼可察觉,是反直觉的,会加重眩晕效果。
而基于 X1 芯片的数据处理链路,眼镜本地获取运动数据,本地芯片完成计算并矫正视频图像,直接反应到屏幕上,M2P 延迟最低可以达到 2 毫秒,已经进入肉眼不可察觉的区间。

X1 芯片还有其他重要的作用,比如从过去的逐帧画面补偿,进化为逐行补偿。在画面悬停模式下,向左右方向大幅度歪头的时候,你就会发现逐行补偿的强大之处,即便大角度倾斜,画面本身的显示,和画面的位置,仍然稳如泰山(只有在角度超过了计算极限的时候才会熄屏)。
至于在内容消费体验上最有意思的,还得是 3D 模式——就像当年第一次用上任天堂 3DS 一样奇妙。纯靠 X1 芯片自身的算力,将任何传统 2D 内容转化为 3D 显示效果,哪怕只是追个剧,看个下饭视频,都能获得不一样的体验。
说到下饭,戴着 1S 吃饭这件事我还真试了一下……它有三档可调的电致变色,所以在任何环境下都可以调整成我需要的通透效果。以及在悬停模式下视线移动到屏幕以外的位置,1S 会自动切换到无色的通透模式。
这样就可以做到:低头扒口饭,抬头接着看……
52° 视场角或许还不够宽,但基本达到了「不转动眼球即可清晰感知」的视野上限

除此之外, XREAL One 系列标配的 Sound by Bose 定制音效,1S 也没有落下;700 尼特的入眼亮度,结合电致变色,在显示效果和护眼之间取得平衡。索尼 0.68 英寸 Micro-OLED 配合双眼 1200p 分辨率,并且支持常规屏幕、超宽屏模式,以及搭配电脑的多种分辨率/屏幕比例可调,让 1S 的使用方式更加多样。
比如工作时候就开 1.6:1 的全尺寸显示,画幅更高、显示内容更多。观看影视作品,换成超宽屏则沉浸感更强。

最重要的可能还是价格:1S 的官方定价 3299 元,国补/各类补贴后的参考价格在 2799 元浮动,成功打进 2500-3000 价位段。要知道这个区间里,在此之前是没有 1S 性能和体验水准的产品的。
这也是为什么我在标题里说:不到三千块,巨幕随身带。

在我看来,这句话就是 XREAL 1S 的精髓。1S 是一块各方面素质顶级,且产品定义设计充分考虑了 AR 眼镜关键痛点的「随身巨幕」。而如果你对这个细分市场有兴趣,经常长途通勤需要一块随身巨幕,那么在当前这个时间点上,似乎真的没有比 1S 更合适的替代品……
——直到 XREAL 这家进化速度极快的公司,再次用更强大的新产品「背刺」老用户之时。
📱
曝字节跳动推进 AI 手机合作:vivo 员工证实,联想密切沟通
🚗
小米汽车获北京 L3 自动驾驶测试牌照,已开展常态化路测
🖊️
新华社揭晓 2025 年度字词,「韧」与「深度求索(DeepSeek)」当选
💵
字节跳动涨薪:奖金投入增 35%,调薪加码 1.5 倍
👨💻
拼多多实行联席董事长制度:锚定中国供应链,目标「3 年再造一个拼多多」
🔋
《科学》杂志评选 2025 年度突破:可再生能源登顶,中国引领全球转型
🏭
飞书在广州峰会发布「粤企一齐飞」计划,物理 AI 企业加速组织升级
📸
OPPO x 小红书发布 2026 影像趋势
👓
XR 专利「第一案」宣判:XREAL 专利诉讼一审胜诉,VITURE Pro 欧盟九国禁售
📱
追觅手机 E1 通过欧盟认证:1.08 亿主摄、还有 3.5 mm 耳机孔
😅
男子一年退 12 部手机起诉被驳回,法院:违背诚信原则
💡
LinkedIn CEO:AI 时代「五年职业规划」已过时,短期学习更有效

据界面新闻报道,字节跳动正推进与 vivo、联想、传音等硬件厂商的 AI 手机合作,在设备中预装 AIGC 插件以获取用户入口、改善其在执行层面的被动局面。多位 vivo 员工证实双方已确认合作、正在讨论具体细节。
联想内部人士称,联想集团与「豆包」、火山引擎等字节系业务一直保持紧密合作,目前在智能终端领域与「豆包」的合作也保持密切沟通。另据 21 世纪经济报道,联想与字节系在相关业务上确有密切往来。
知情人士透露,字节跳动此举并非单纯追求业务增长,而在于构建新的流量变现路径,让手机厂商参与流量分发与会员订阅等收益。
讨论中的模式包括不收取定制化开发费或 Token 销售分成,并给予手机厂商二次流量的分成收益,方案仍处早期。
该项目拟先对 2000 元以上中端机型进行「投量」,与手机厂商发布新机,随后通过 OTA 覆盖更多机型;规模达到 1.5–2 亿后,再与其他互联网厂商竞争。
消息人士称,字节跳动在海外渠道具优势,AI 手机投放大概率也会优先布局海外;内部对该项目高度重视,系统与标注部门各自超过 500 人。此前,字节跳动曾就相关合作与 OPPO 沟通,但遭拒绝。
「豆包手机助手」于 12 月 1 日正式推出技术预览版,并与中兴通讯联合推出 nubia M153 工程样机。该产品支持在用户指令下跨应用调用服务,如点外卖、订机票、比价购物、回复微信消息及操作小程序游戏等。
问世不久后,微信、淘宝、大众点评、拼多多等 App 相继禁止在「豆包手机」上使用,引发对 AI 终端商业生态走向的讨论。
同期,IDC 数据显示,联想旗下摩托罗拉在 2025 年第三季度出货量为 1600 万台、全球份额 4.9%,位列全球智能手机市场第八。
字节跳动先前回应称,「豆包」正在与多家手机厂商洽谈助手合作,且没有自行开发手机的计划;官方披露的手机合作方仅有中兴手机。值得注意的是,魅族科技曾在微博发文表达合作意向,期待「进一步探索更好用的 AI 手机」。

据北京日报昨日报道,小米汽车已在北京市获得 L3 级自动驾驶道路测试牌照,并已在指定路段开展常态化 L3 级道路测试。
这一牌照主要面向北京市智能网联汽车高快速路测试路段,允许符合条件的车型在有条件自动驾驶模式下上路测试,探索更安全、更智能的个人出行服务形态。
此次测试牌照限定在「北京市智能网联汽车测试高快速路」范围内。根据不同企业的申请区域,北京目前在亦庄、顺义、通州等片区的高速及城市快速路(设计时速 ≥ 60 km/h)提供道路测试支持。
这类道路车速较高、匝道数量多、货车比例大,相比城市主干道更考验车辆的环境感知距离、纵向控制能力以及冗余安全策略,对自动驾驶系统整体稳定性提出了更高要求。
小米方面表示,已在相关路段持续开展常态化 L3 级道路测试,车辆以接近日常运营的方式排班行驶,通过长期路测积累真实路况数据。
持续常态化测试也意味着测试车队、后台监控以及数据回灌体系已经打通,可以在实际道路环境中对自动驾驶算法进行迭代验证和优化,为后续规模化应用奠定基础。
报道指出,L3 级自动驾驶道路测试牌照属于行政许可,并非所有车企都能获得。该牌照由北京市经信、交管、交通等相关主管部门联合核发,仅面向已完成封闭场地测试、网络安全评估、数据合规审查等一系列前置审查环节的车型。
小米此次获批,意味着其提交的 L3 系统方案(包括软硬件冗余、远程监管、数据记录等环节)已经通过北京市准入门槛,具备在公开道路上进行自动驾驶测试的资质。

昨天,新华社揭晓「汉语盘点 2025」活动「年度字词」:年度国内字为「韧」、「深度求索(DeepSeek)」入选媒体十大热词和十大网络流行语,成为年度国内词。
该活动由国家语言资源监测与研究中心、商务印书馆、新华网联合主办,体现网民推荐、语料库大数据提取与专家评议的综合结果。
新华社指出,「韧」强调在政治、经济与技术不确定性交织的时代,以坚韧不拔、抗压应变与回弹性为核心要义;
而「深度求索(DeepSeek)」作为国产标志性大语言模型的代表,被视为中国在 AI 领域技术主权与自主生产力的重要标识,折射本土企业在人工智能上的崛起。
今年是该活动举办第 20 年,主办方称将继续以汉语为媒,推动文化传承与文明互鉴。
据介绍,本次「汉语盘点 2025」同步发布年度中国媒体十大热词、年度十大网络流行语与年度十大新词语,勾勒出以新闻价值、社会生活创新与年轻群体网络文化为维度的年度语言「全景图」。
其中,「苏超」「票根经济」兼列媒体十大热词与十大新词语,体现时代焦点与创新发展的交汇。

据澎湃新闻、界面新闻报道,字节跳动向全球员工发出内部邮件,宣布在 2025 年继续加大人才与激励投入:全年绩效奖金(含期权)总投入较上个周期提升 35%,调薪投入提升 1.5 倍,并统一提高各职级薪酬总包的下限与上限,以在全球各市场保持「领先于头部水平」。
公司称,此举旨在强化吸引与保留高绩效人才,直面全球人才竞争。
字节跳动明确细化了绩效激励区间的上限与下限:
半年激励方面,「E」及以上员工的激励计算基数由月薪调整为月总包(含月期权),对应激励力度同步提升。
在薪酬结构上,公司将职级体系由原「5 级 10 档(1-1 至 5-2)」调整为「10 级体系(L1–L10)」,其中合并原「1-1/1-2」为「L1」,并新增「L10」。
在新体系下,即使不晋级,员工也能获得较过去更大的涨薪空间,晋级带来的涨薪幅度亦扩大。与此同时,本周期调薪投入提升至上周期的 1.5 倍,并同步抬升各职级薪酬总包区间的上下限,以兼顾在职激励与招聘竞争力。
今年 6 月,字节跳动发布「6 条人才观」,强调在招聘、用人、培养、激励与回报各环节保持「高人才密度」,并在 2024 年初迭代绩效与激励政策,加大对高绩效的识别与区分度。
公司长期进行每年两轮期权回购(一般在 4 月与 10 月),期权价格自 2019 年以来累计上调超 400%。今年 10 月在职员工回购价为 200.41 美元/股、离职员工为 180.37 美元/股(分别约合人民币 1424.01 元/股、1281.62 元/股)。
同月,公司还针对中国内地因组织调整被动离职的正式员工上线保障方案:在经济补偿之外,向符合条件者提供最长 6 个月、最高 1.2 万元/月的过渡性补贴,总额最高可达 7.2 万元。
关于组织稳定性,坊间曾有「字节员工平均在职时间 7 个月」的说法。对此,字节跳动在 7 月底的内部交流会上披露在职员工工龄中位数为 2.9 年,这是公司首次内部披露此项数据,以澄清相关不实传闻并强化对外的人才稳定预期。

据凤凰网科技报道,拼多多集团在昨天的年度股东大会上宣布升级治理架构,实行联席董事长制度,赵佳臻获任联席董事长,与陈磊共同担任联席董事长兼联席 CEO。同时,公司任命王密为集团工程高级副总裁、李炯为集团财务总监。
赵佳臻表示,联席治理有利于集团进入「下一个阶段的升级再造」,并围绕「聚焦、重投供应链升级,高质量发展」的整体战略推进落地。
会上陈磊透露,Temu 已在不同国家形成一定市场规模,「3 年走完了拼多多国内电商 10 年的路」。
赵佳臻称,今年是拼多多创业第十年,业务、技术与服务持续积累,业务已触达全球大部分国家;公司下一阶段的核心将更聚焦于中国供应链。
他强调,Temu 的快速成长源于中国供应链产业红利,为国内供应链发展与拼多多、Temu 的再造带来契机,集团将集中资源推动供应链运营模式的整体升级,向高质量与品牌化方向迈进,目标是在「下一个 3 年再造一个拼多多」。
陈磊同时指出,伴随规模扩大与各地监管环境快速变化,合规是底线,电商平台需「符合社会需要、回归初心、固守本分、为社会做贡献」。
赵佳臻(花名「冬枣」)为拼多多创始团队成员,早期负责农产品运营与供应链搭建;2018 年起任高级副总裁,推动「多多买菜」样板城市落地,在社区团购内部竞争中排名第一,并拓展河南、江西、湖南等多省业务。
2022 年下半年带队推动供应链体系升级,同时参与海外电商布局,负责 Temu 美国市场招商,助力海外业务起步;2023 年 4 月获任执行董事与联席 CEO,分管供应链管理与中国业务运营。
陈磊 2015 年与黄峥等人共同创立拼多多,历任 CTO、CEO,并于 2021 年接任董事长,推动公司由社交裂变向科技驱动转型。此次陈磊与赵佳臻共同担任联席董事长兼联席 CEO,构建联席治理机制。

美国《科学》杂志于当地时间 18 日评选出「2025 年度十大科学突破」,其中「全球可再生能源增长势不可当」位列年度头号突破。
《科学》刊文称,2025 年可再生能源在多个领域超过传统能源,且这一转型由中国引领。
该刊文指出,今年全球可再生能源发电量首次超过煤炭;太阳能与风能的增长速度足以覆盖今年上半年全球新增用电需求。
《科学》进一步强调,中国强大的工业体系推动了此次能源版图重塑:全球约 80% 的太阳能电池、70% 的风力涡轮机及 70% 的锂电池由中国生产,且在成本上具备优势。
中国绿色技术出口正在改变欧洲及全球南方国家的能源结构,屋顶光伏在非洲与南亚加速普及,成为低成本、可立即改善用能体验的选择。
在减排层面,今年中国的可再生能源发展使本国温室气体增速几近停滞,并使全球碳排峰值更接近可及,但《科学》亦提示,要实现实质性减排,仍需将今年跨越的门槛视为起点。
除能源转型外,《科学》列出的其他九项年度突破涵盖生命健康与基础科学等领域,包括:

日前,2025 飞书先进生产力峰会 · 广州站在小鹏汽车广州总部举行,主题为「AI 时代的先进组织力」,聚焦大湾区物理 AI 产业的组织升级。
本次峰会吸引数百位企业高层、政府代表与行业专家参与,包括小鹏汽车、小马智行、优必选、欣旺达动力、乐聚机器人等企业。
飞书制造行业总经理张棣表示,飞书希望通过「软件定义组织」的方式,让组织 AI 能够匹配物理 AI 的发展速度。
峰会现场,多家物理 AI 企业分享了其在飞书上的实践经验。小鹏汽车展示了其企业级 Agent「IRON」的应用成果。
小鹏汽车副总经理谭蔚华表示,IRON 上线后,智能问数功能每年可节省 100 万元成本、整体相当于每月新增 128 名 AI 员工投入工作。
峰会最后发布了「粤企一齐飞」效能加速计划,旨在通过标杆引领与 AI 普惠推动制造业的规模化智能化升级。

昨天,OPPO 联合小红书发布 2026 年度影像趋势报告,双方基于小红书站内创作数据,总结出 9 大移动影像趋势,并以 OPPO Find X9 系列与 OPPO Reno15 系列为代表机型,试图回答「下一代手机影像应该长什么样」。
报告提出的核心命题是「所见即所得」,让每一帧都长出自然本色,强调手机影像不再创造风景,而是尽可能精确复刻用户置身其中的真实瞬间,每一次回看都能重温自然本真的画面。
主要趋势可归纳为以下几类:

据《科创板日报》、VR 陀螺及亿欧报道,德国慕尼黑第一地区法院已于昨日作出一审裁决,认定 VITURE 公司旗下 VITURE Pro 等产品侵犯闪耀现实(XREAL)持有的欧洲专利(专利号:EP3754409B1)。
法院批准了具强制执行力的临时禁令,要求 VITURE 在德国的销售枢纽 —— 香港经销商 Eden Future HK Limited 立即停止在德国境内提供、投放市场、使用或进口相关产品。
该裁决意味着 VITURE Pro 在德国市场已失去合法销售资格。目前,涉诉产品已在亚马逊德国、法国、意大利、西班牙、波兰、荷兰、爱尔兰、瑞典、比利时等 9 个欧盟站点下架。
值得注意的是,此案是 XR 行业首次因核心技术专利侵权而遭遇实质性「禁售」的案例。

科技媒体 MT.today 近日发文称,追觅首款智能手机 Dreame Smartphone E1(型号 W5110)已通过欧盟能效标签认证,用户手册同步流出。
该机向欧盟申报的维修性等级与抗跌落等级均为 B 级,能效等级为 A 级,标称续航时间为 54 小时 35 分钟。
值得注意的是,追觅在欧盟能效标签认证中将电池描述为「用户可自行更换」,但用户手册明确警示「请勿尝试自行取出电池」。
今年 9 月,追觅官宣首款智能手机 Dreame Space,预热其搭载「天文级」摄像系统,强调在光污染严重的城市环境中也能轻松拍摄星云、银河等深空天体,并表示将推出「人车家宇宙万物」互联生态。

据央视新闻报道,上海市松江区人民法院近日驳回一名消费者针对电商平台的退货诉讼,认定其长期以体验为目的反复购买并在「七天无理由退货」期限内退货,已构成民事权利滥用。
消费记录显示,该消费者在 2023 年 4 月至 2024 年 3 月期间通过 12 笔订单购买了 12 部手机,并均在 7 天内申请退货退款。
涉案手机为其第 4 次购买的同款机型,前三次均已成功退货。此次第 4 次以「太重、太厚」为由提出退货遭拒,继续使用约 1 个月后才起诉要求退款。
法院指出,该消费者作为数码产品爱好者,存在激活使用后以把玩、体验为目的多次网购并适用「七天无理由退货」的情形;其反复购买并退货的做法偏离该制度设立初衷,违反公平诚信原则,损害平台合法权益,不利于营造有序的网络购物环境,因而应予否定性评价,最终判决驳回诉求。

据《财富》报道,LinkedIn CEO Ryan Roslansky 表示在职场变化加速的背景下,「五年职业规划」已不再适用。他指出,在技术与劳动力市场持续演变的环境里,以数月为周期设定学习与体验目标更加务实。
他自 2020 年起担任 LinkedIn CEO,长期观察到疫情、关税、通胀与裁员等因素令职业路径愈发非线性,并以播客 The Path 探讨多元化的成长轨迹。
Roslansky 强调,与其预设多年路线,不如聚焦近期要学习什么、获取哪些经验,靠累积的短步进打开更广的职业可能性。
他指出,很多人仍相信教育与职业是线性路径,但平台数据与访谈显示真实情况更复杂,个体需要主动抓住机遇并保持敏锐。
世界经济论坛预计,到 2030 年,约有 39% 的核心技能将被重塑或淘汰;职业与教育机构 TAFE Gippsland 报告称,人们一生平均经历 3–7 次职业转换与 16 次工作变动;招聘机构 Randstad 的最新报告显示,Gen Z 平均每 1.1 年换一次工作,其动因更多是「成长捕猎」而非传统意义的「频繁跳槽」。
尽管仍有专家认为中长期规划有助于系统化推进目标并保留调整空间,但 Roslansky 认为在 AI 驱动的快速变革期,短期学习与体验的迭代更符合现实。
没有人会替你规划道路,尽早建立以能力与经验为核心的自我驱动机制,才能在不确定性中提升职业韧性与机会。

昨天,字节跳动旗下 AI 编程工具「TRAE CN 企业版」正式发布。官方强调其在企业研发中的规模化与深度化应用定位,并提供企业版与企业专属版两种部署模式,以满足不同安全与管理需求。
在核心能力上,TRAE CN 企业版针对超大仓库场景进行了优化:支持 10 万文件、1.5 亿行代码索引,配合超长上下文窗口与企业级 GPU 集群,实现高并发下的毫秒级响应。
通过接入企业知识库与规范、以及基于 MCP(模型上下文协议)的统一工具与数据源调用,使代码生成、审查与测试实现流程级闭环并符合团队「规矩」。
官方同时强调,数据不用于训练、代码全链路加密传输、云端零存储与用后即焚机制,提升企业代码资产的安全性与可控性。
在效能与管理方面,TRAE CN 企业版提供 AI 生成率、AI 代码量等指标看板,支持费用上限与实时用量监控,并可接入 SSO 实现统一鉴权与权限边界管理。
与火山引擎深度打通后,开发者可在 IDE 内一站式调用云端资源与服务,贯穿算力调度、运行环境与发布流水线,实现从「写代码」到「跑起来」的端到端闭环。
据介绍,字节内部已有 92% 的工程师将 TRAE 用于研发协作。在抖音生活服务等高并发业务中,官方案例显示 AI 代码贡献率超过 43%,测试用例生成每周节省 44.56 人/天,无人发布单次节省 25 分钟。
在工程质量方面,TRAE 支持单元测试自动生成与修复,单测生成时间压缩至 18 分钟以内,首编译通过率超过 70%。
🔗 相关阅读:字节 92% 工程师都在用的 TRAE,这次瞄准了企业级市场

近日,Google 推出两款面向端侧与开发者的轻量模型:多模态、长上下文的编码器—解码器家族新作 T5Gemma 2,以及专为函数调用场景优化的 FunctionGemma。
两者均延续 Gemma 3 系列的技术路线,前者主打结构效率与多模态理解,后者聚焦把自然语言稳定映射为可执行的 API 动作,面向本地、低延迟的智能体应用。
T5Gemma 2 在架构层面采用「词向量共享」与「解码器自注意—交叉注意合并」以缩减参数与复杂度,提供 270M–270M(不含视觉编码器约总计 370M)、1B–1B(约 1.7B)与 4B–4B(约 7B)三种规模的预训练模型。
Google 表示,T5Gemma 2 在多模态与长上下文任务上相较 Gemma 3 显著提升,且预训练基座已开放在 Kaggle、Hugging Face 等平台供后续任务定制;同时提供通过 Vertex AI 推理的路径。
FunctionGemma 基于 Gemma 3 的 270M 模型专门微调为函数调用代理,目标是在本地设备上把用户指令稳定转译为结构化函数调用,再以自然语言总结执行结果。
模型体量与词表设计适配边缘设备,可在英伟达 Jetson Nano 与手机端运行,并可作为离线代理或大型系统的「智能路由」,把复杂请求转交至 Gemma 3 27B 等更强模型。
新智元认为,T5Gemma 2 以结构与能力升级为多模态、长上下文与多语言任务提供更高效的编码器—解码器选项,适合研究与下游应用的预训练基座;
FunctionGemma 则面向明确 API 面与本地优先的场景,通过微调获得确定性更强的函数调用可靠性,支撑「离线‑即时‑隐私」的端侧代理。二者共同指向开发与部署从云端「巨模型」向边缘「专精小模型」的落地路径。
🤗 Hugging Face: https://huggingface.co/collections/google/t5gemma-2
💻 Colab: https://colab.research.google.com/github/google-gemini/gemma-cookbook/blob/main/Research/[T5Gemma_2]Example.ipynb
🤗 Hugging Face: https://huggingface.co/google/functiongemma-270m-it
据央视新闻报道,昨天,中国气象局在河北雄安新区发布气象人工智能科学模型「风源」,定位为开源开放科创平台底座,旨在提升 AI 气象预报模型能力与相关科研水平。
「风源」标志着我国气象部门拥有自主知识产权的端到端科学模型底座,在关键环节实现技术自主可控,并具备持续迭代的工程基础。「风源 V1.0」包含数据同化与预报两大模块,可基于观测数据直接开展全球气象预报。
相比以往依赖数值预报模式分析数据的 AI 预报方法,「风源」可直接读取来自卫星、雷达、气象站等实时观测数据,独立分析后给出全球预报,预报效果处于国内外相关领域第一梯队。
未来规划方面,「风源」将重点提升对极端天气、尤其是短时临近天气的捕捉能力、围绕低空经济、能源保供、交通物流、健康气象等场景开发垂类 AI 模型,服务经济社会发展,同时拓展国际应用空间,推动成果在共建「一带一路」国家落地,并通过气象科教融合创新联盟加强重点团队协作。
中国气象局此前推出的气象 AI 模型也在今年完成升级:

据界面新闻报道,雀巢集团或考虑出售蓝瓶咖啡(Blue Bottle Coffee)的实体咖啡馆业务,潜在买家名单出现瑞幸咖啡及其支持者大钲资本(Centurium Capital)。
2017 年,雀巢以约 5 亿美元收购蓝瓶约 68% 股权;蓝瓶于 2022 年进入中国内地,目前在上海、深圳、杭州共开设 15 家门店,全球截至 2025 年 8 月在 6 个国家和地区拥有 140 家门店。
市场消息称,雀巢可能保留蓝瓶品牌的知识产权以继续销售产品,仅出售实体咖啡馆业务,此举被视为新任 CEO 菲利普・纳夫拉蒂尔推进业务精简、退出实体零售门店运营的战略评估的一部分。
除激进扩张的中国咖啡品牌外,潜在买家还包括 %Arabica 及其背后资本( PAG、General Atlantic 等),以及传统私募股权基金(如 KKR、凯雷)。

犯罪电影《96 分钟:列车爆炸案》昨日官宣将于 1 月 10 日内地上映,并同步发布「极限存活」版定档预告与「正义决策」版海报。
影片设定为双列车捆绑爆炸:两辆自台北开往高雄、行程 96 分钟的列车被安装特殊炸弹,任一列车停下,另一列即爆炸,数百名乘客被迫在限时内直面生死抉择。
故事围绕前拆弹专家宋康任(林柏宏 饰)与警员未婚妻黄欣(宋芸桦 饰)意外登上载有特殊炸弹的列车,展开 96 分钟极限拆弹与人性拷问。

电影《情圣 3》昨天发布新海报,确认将于 12 月 20 日起全国点映、12 月 27 日全国上映。影片延续系列 IP 并以「婚姻闹剧」为核心叙事,主创称将以反差关系与群像喜剧推进观感与话题度。
海报以巨型沙质「LOVE IS HARD」构图呈现人物关系与戏剧张力,围绕「夫妻互坑」的信任危机与「爱情三十六计」的试探磨合展开,强调群像「全员喜剧人」的互动与节奏,系列符号与情怀元素被保留并强化。

昨天,网络流传一张所谓「阿里千问全员会」现场图片,称有人在广场上手举豆包并高喊「干死豆包」。阿里相关人士向财联社记者辟谣称该图为「假的」,并否认所谓全员大会及现场举豆包等情节。
据 21 世纪经济报道,阿里方面进一步指出该图中的千问 logo 均生成错误;多位网友也质疑该图疑似由生成式 AI 合成,场景更像线下晨会,与互联网研发或 AI 业务场景不符,从视觉要素到水印处理均存在明显破绽。
昨天下午,阿里千问在官方微信公众号发文《听说我被 AI 整了》正式回应,明确表示所谓「广场大会」纯属虚构,相关图片完全由 AI 生成,工牌与 logo 均为错误合成。

官方在文中以轻松语气调侃称「大家都是干 AI 的,相煎何太急」,并借机展示千问的 AI 生图功能,鼓励用户通过模板与指令生成趣味图片,甚至可以模拟「厨王争霸赛」「穿越到东汉」或「圣诞老人」等场景。

《阿凡达3》作为詹姆斯 · 卡梅隆执导的《阿凡达》系列第三部作品,已于昨天上线全国院线。剧情延续前作余波,杰克 · 萨利与奈蒂莉一家在失去长子奈特言后陷入悲痛。
故事核心冲突来自新登场的「灰烬之民」部族,他们以掠夺和暴力为生,由女祭司瓦琅领导,成为推动剧情的关键反派势力。影片同时揭示了潘多拉新的族群「风之商人」,以游牧方式在部落间穿梭,形成与灰烬族截然不同的文明对照。
技术层面,卡梅隆团队继续突破:火山喷发、烟雾与微表情捕捉的精度显著提升,特效算法实现了火焰、灰烬与静电的复杂交互,演员面部捕捉精度提升至 6 万个微三角面片,每秒 1200 帧,使纳威人的细微表情更具真实感。
评价方面,影片在烂番茄获得 69% 的正面评价,在 Metacritic 上收获 61 分,属「普遍好评」区间。
豆瓣平台上,截至发稿有超过 2.3 万人打出 7.6 的平均分,其中 24.7% 打出五星,39.9% 打出四星,显示观众对视觉效果普遍认可,但对剧情评价分化明显。
🔗 相关阅读:《阿凡达 3》电影院选厅指南:别再无脑选 IMAX 了(附影院名单)

《电影院精神》由电影学者王小鲁撰写,聚焦流媒体席卷与算法主导的当下,提出「电影完熟时代」「电影院精神」等概念,试图以电影院空间观照现实生活,通过行业疲软的脉象折射现代人的普遍困境与公共性再建的想象。
书中判断电影市场已趋饱和,并指出「最好的人文主义电影都已经拍出来了」,将技术对电影本体的冲击置于学院批评与符号游戏的坐标中,强调疫情后行业的迟暮心境与身体在场的召唤,呈现一部面向迷影群体的「心灵史」取向。

昨天,索尼 PlayStation 公布 PS Blog 2025 年度游戏大奖结果,共设 19 个类别,所有奖项完全由玩家选票产生,累计近 150 万张玩家投票。
其中,Sucker Punch Productions 的 PS5 独占新作《羊蹄山之魂》夺得 9 项大奖,成为本届最大赢家。
从具体奖项分布看,《羊蹄山之魂》拿下「最佳新角色」「最佳画面表现」「最佳美术指导」「最佳音效设计」「DualSense 手柄最佳应用」「最佳 PS5 游戏」等共 9 个关键类别白金奖。
《羊蹄山之魂》由 Sucker Punch Productions 开发、索尼互动娱乐发行,是《对马岛之魂》的续作,于 2025 年 10 月 2 日登陆 PS5。
游戏背景设定在 1603 年的日本北海道,主角为女性武者「笃」(Atsu),由 Erika Ishii 饰演;作品在美术、音效、DualSense 手柄运用等维度均获大量玩家投票肯定。
上市以来,「羊蹄山之魂」已售出 330 万份,IGN 评价为 10 分满分「大师之作」。
在本次大奖中,其他游戏/工作室的表现也同样亮眼:
有时候经常被朋友问,「你不是做汽车相关内容的嘛,为什么不见你开车上班?」
其实很多时候不是不想开,而是真的停不起。
公司所在的广州塔附近大概是全广州停车收费最高的地区之一,露天停车场白天工作时间段 16 元一小时,月保在千元左右,晚上回到家的小区内稍微低一点,临停 5 元一小时,月保 600 元。
也就是说如果每天开车通勤加上周末偶尔去商场,光停车费一项,每月额外支出就要接近 2000 元,足够在广州再租个一居室。
正因如此,尽管公司有位已提车 1000 天的理想车主,我却始终未能蹭到他的车,十分遗憾。

▲ 广州塔小车收费 16 元/小时
长期以来,广州的停车费一直居高不下。几年前,界面新闻曾做过一项统计,广州重点区域路边停车场的平均成本高达 26 元/小时,这一数据在全国遥遥领先。作为对比,同为一线城市的上海、深圳约为 20 元/小时,北京仅为 10 元/小时,而新一线城市武汉的 4 元/小时甚至排到了全国第十一名。

理论上来讲,深圳本应是停车更难、更贵的城市。
深圳的土地面积仅为广州的三分之一,却承载了更多的汽车。截至 2025 年 8 月,深圳机动车保有量已达 460 万辆,远超广州的 404 万辆。在人均 GDP 和居民收入均高于广州的背景下,深圳的支付能力理应更强,土地资源理应更稀缺。
然而,现实却给出了相反的答案。
在深圳的一类区域(如福田 CBD ),停车场收费大多为第一小时 15 元,此后每小时 5 元。而在广州同类区域,往往起步就是每小时 16 元甚至更高,且阶梯涨价更猛烈。

深圳这种「地更少、人更富、车更多,停车反而更便宜」的现象,恰恰说明了广州的高价并非完全由供需决定,更多是由于定价机制的传导失效与存量管理的粗放。
以广州天河 CBD 珠江新城为例,这里的停车费被车主们戏称为「天价刺客」。临时停车费最高可达 26 元/小时,单日封顶 328 元。而在一些更高端的商业场所,价格直逼 30 元/小时且不设上限。

▲ 广州太古汇停车场,周末 20 元一小时,不设最高限价
小区的月保车位也不便宜。
有网友分享,其在越秀某小区的停车场月租为 1800 元/月,周边小区多数也都在 1500 元往上,而且还要靠抢。

▲2000 元的非固定月租车位
高昂的停车成本,迫使大量市民在出行方式上做出妥协。
大部分的广州家庭往往采用「一辆四轮+一辆两轮」的出行配置。毕竟骑着电鸡出门,不仅可以避开拥堵,还可以避开无法预估的停车费账单。毕竟,任何时间、任何地点,电鸡随便停且免费。

价格高不过只是表象。停车难、停车贵的归根结底,是城市空间资源的极度稀缺与分配不均。
官方数据显示,截至 2025 年 6 月,广州全市停车位约 437.8 万个,小汽车保有量约 404.4 万辆。乍看之下,1.08 的车位比似乎意味着供需基本平衡。
但汽车是流动的,一个高效运转的城市交通网络,要求一辆车不仅要有一个「家」(居住停车位),还需要有「办公室」(工作停车位)和「游乐场」(商业/公共停车位)。
通常认为,理想的城市停车位供需比应达到 1.2 甚至更高,才能应对车辆流动带来的潮汐式需求。
但在广州,停车资源往往是失衡的。越是核心、越是老旧的区域,停车矛盾越是尖锐。
在越秀、荔湾等老城区,以及医院、学校、商圈周边,停车难是常态化的「重灾区」。对于居住在老旧小区的居民来说,每天下班回家就是一场现实版的「抢车位」游戏。由于车位极度匮乏,车辆不得不层层叠叠地停放。
这里衍生出了一种独特的「熟人社会治理模式」,管停车场的大爷,手里往往握着全小区几十把车钥匙。哪辆车要出,哪辆车要进,全凭大爷运筹帷幄,「开完你的,开他的」。
因为车位属于稀缺资源,很多地方甚至出现了「寻租」空间,有的业主甚至需要私下「打点」物业,才能勉强在小区里拥有一个车位。
即便是在硬件条件较好的新建住宅区,矛盾也同样存在。部分住宅停车收费随意定价、强行涨价的现象屡见不鲜,物业方利用信息不对称和管理优势,单方面提高停车费,让业主们苦不堪言。前段时间,某豪宅物业甚至做出了业主不同意涨停车费就不放车辆通行的离奇操作。
高得无法理解,涨得毫无道理,呈现出一种反正就是贵,反正我要涨的神奇局面。

▲ 老小区停车现状
面对各种问题交织的困境,即将于 2026 年 2 月实施的《广州市停车场条例》试图通过一套组合拳来打破僵局。
通读新规,可以清晰地看到立法者试图在「存量挖掘」和「规则重塑」两个维度上寻找突破口。

首先是「存量挖掘」。
广州市人大常委会法工委有关负责人在解读中提到,资源利用效率不高是导致车位紧缺与闲置并存的重要原因。
为此,新条例要求「要求本市国家机关、事业单位的自用停车场与办公场所分开管理的,应当在非工作时间有序向社会开放」。并且这些车位需要置明显标识,并将泊位信息接入全市停车信息管理系统,所得收益上缴财政。
这一举措若能落地,将极大缓解老城区夜间「一位难求」的现状。
其次是支持支持和鼓励社会力量投资建设公共停车场。
对于社会力量投资建设公共停车场的,不仅可以给予适当的资金支持,还可以在在不改变用地性质、不减少停车位的前提下,配建不超过公共停车场建筑面积百分之二十的附属商业设施。
第三,在我们最为关注的定价权博弈方面,新条例引入了「协商议价」机制。如果停车场经营者想制定或提高收费标准,必须与业委会或业主大会协商。
为了保证这一条款不沦为一纸空文,新规设定了高额的违法成本,未依法协商议价的,最高可处 50 万元罚款。
最后,是对路面秩序的「收权」。
针对路内泊位「乱划线」的乱象,新条例明确了区交通运输行政主管部门的唯一管理权,严禁任何单位和个人擅自划设或撤除。对于私自圈地划线的行为,个人最高罚款 5000 元,单位最高罚款 2 万元,并没收违法所得。
这意味着,过去那种随便拿桶油漆就在路边圈地收钱的「混乱时代」,将彻底终结。

即使在 2026 年 2 月之后,广州车主可能还是会为找车位发愁,老城区的巷子依然窄,医院门口的车龙也不会一夜消失。
但至少,规则更清楚了,住宅停车费不能全由物业说了算,得和业主商量;路边划线谁有权、谁违规,也有了明确罚则;机关单位的停车场在晚上能不能用,也不再是「内部事务」。
这些变化未必立刻缓解一位难求的窘境,但至少让市民在面对涨价、占位或混乱管理时,知道该找谁、依据是什么。
在一座常住人口超过 1800 万、机动车保有量已突破 400 万辆的城市里,「停好一辆车」从来不是小事。它牵涉空间规划、公共资源分配、社区治理,甚至日常生活的尊严感。
新规无法凭空变出车位,但若能推动闲置资源流动起来、遏制随意定价、减少管理盲区,就已经是在复杂现实里往前走了一步。
2025 年电影的压轴大戏《阿凡达 3:火与烬》今天正式上映,你看了吗?
▲ 《阿凡达 3》剧照
电影才刚刚上映,豆瓣开分 7.6 分——和上一部《阿凡达 水之道》(豆瓣 7.8 分)基本持平,口碑继续两极分化:
有人大赞电影视觉效果惊艳,最后一个小时大战场面恢弘;也有人吐槽剧情依旧乏善可陈,3 个小时的片长昏昏欲睡——但毋庸置疑的是,这就是 2025 年最值得进电影院看的视效大片,如果不选一个好的影厅,等于白看。
这下问题来了,《阿凡达 3》的影厅选择,是我见过最复杂的:

该选哪一个电影院?爱范儿为你整理了一份影厅选择指南,帮你快速了解几种影厅的区别。
一句话总结:首选 CINITY LED,其次选 IMAX 和杜比,都没有的话选名字带「激光」的。
说起视效大片,大家第一反应都是选 IMAX 影厅,突出一个「大就是好」,但对于《阿凡达 3》,CINITY LED 才是更适合的影厅
我们在文章末尾整理了全国 CINITY LED 影院清单,大家可以对照自己所在城市查看。
大部分观众可能都鲜少听闻 CINITY LED 这种放映厅,其实 CINITY 是中影自己研发的一套以高亮度、高帧率、高分辨率为标准的放映系统。

CINITY LED 则再在此基础上上采用 LED 影屏,3D 电影最高支持 60 帧,亮度达到 300nits。
虽然推荐影厅这个事上,卡梅隆导演本人把每种影厅都推荐了一遍,但《阿凡达 3》的中国首映礼选择的就是 CINITY LED 格式放映,一定程度也能说明这才是第一选择。

在 CINITY LED 厅放映的《阿凡达 3》在每个环节都是「满血版」:4K 分辨率,最高 48 帧,还独占 1.85:1 遮幅,满屏无黑边,比 IMAX 和杜比的宽屏更具有沉浸感。
加上 CINITY LED 本身高亮度、高对比度、广色域的特征,更适合《阿凡达 3》这种 3D 电影。一些已经看过点映的网友也反馈,CINITY LED 的画面透亮清晰,比 IMAX 效果更好。

甚至卡梅隆本人看完 CINITY LED 版本的《阿凡达 3》之后,都计划自费在新西兰的创作基地安装一套 CINITY LED 系统,用于《阿凡达》后续电影的制作、母带处理和检查工作,并希望能向全球导演和电影人推荐这项技术。
不过,CINITY 在影厅音效方面并不占优势,对比 IMAX 以及杜比影院有差距,如果有条件,可以尽量选择透声厅。
值得一提的是,爱范儿推荐的是「CINITY LED」影厅,而不是常规的「CINITY」影厅。没有 LED 的 CINITY,画面效果大打折扣—— CINITY LED 等于电视屏幕,是屏幕在发光;而普通 CINITY 相当于投影仪,效果其实还不如 IMAX 和杜比。
这样一来,CINITY LED 影厅的数量就不是很多了,全国上下其实只有 30 多家左右。
一些 CINITY LED 影厅的整体条件,可能确实偏「老破小」。就拿爱范儿所在的广州来说,目前仅有的两家 CINITY LED 影院,本身的综合体验也谈不上出色。
但即便如此,依然更推荐大家把 CINITY LED 作为首选。原因很简单:这是一项两年前才在国内落地的新技术,至少在银幕这一核心环节上足够「新」,不用太担心画面素质翻车。
和 CINITY LED 比起来,IMAX 的优势就是普及率较高,大量一二线城市都有影厅,画面的优势当然就是「大」。
当然,如果要追求更好的画面效果,IMAX GT 还是最值得推荐的,巨大的屏幕和音效能带来强烈的视听效果。
不过 IMAX GT 商业应渊,大陆只有屈指可数的五家:哈尔滨万达影城、沈阳辽宁科技馆、东莞万达影城(华南 MALL)、北京中电影博物馆、贵阳越界影城。
其次 IMAX、IMAX XT、IMAX CoLa 这些激光 IMAX 影厅也值得推荐,不过注意避开数字 IMAX,技术和屏幕都有点太老了。

▲ 「华南地区唯一」的东莞 IMAX GT 本月初刚完成换新,图源;南方+
《阿凡达 3》IMAX 版最大的问题就是只有 2K 分辨率,在大屏幕上画质会有更明显的折损,如果想要感受潘多拉星球的更多细节,CINITY LED 和杜比银幕的 4K 是更好的选择。
需要注意的是,《阿凡达 3》 IMAX 有 24 帧格式的版本——这其实不一定是劣势,因为更高帧率的《阿凡达 3》全片只有40% 的片段是 48 帧。
不少观看 48 帧的观众反馈,观影过程中能明显感受到画面流畅度的不一致,会带来不同程度的出戏,甚至有「换片源」的感觉。因此大家没必要首选冲 48 帧的影厅,反而 24 帧的 IMAX 能有更一致的观感。
对于无缘 CINITY LED 影院的观众来说,如果想要看 4K 分辨率的《阿凡达》,杜比影院是为数不多的选择。
杜比影院整合杜比视界 HDR 影像、杜比全景声和杜比 3D 技术,优势在于画面更亮,对比度更高,搭配 4K 分辨率有更丰富的细节和层次,尤其是环绕立体的音效,包裹感更足。

▲ 普通电影屏幕和杜比的对比
当然,对比 CINITY LED,杜比影院在亮度和动态范围上略逊一筹,但一些的观众反馈称,这反而让杜比影院的帧率过渡差异没有 CINITY LED 明显,整体观感更自然。
画幅是杜比影院《阿凡达 3》的最大短板,2.39:1 的常规宽幅比例,会导致杜比银幕上下黑边相对更显眼。
需要注意的是,大家买票时要小心别买成「杜比全景声」,这只是声音效果更好,画面规格和满血的「杜比影院」是有很大差距的。

根据灯塔研究院在 12 月 15 日公布的数据,《阿凡达 3》预售票房 3265.93 万元,其中 IMAX 影厅票房占比 52.9%,CINITY LED 和杜比影院也将近 10%,特效厅表现突出。

凭借十几年在国内的发展,IMAX 依旧是大多数人心目中「看大片」的最佳选择,但这次《阿凡达 3》,CINITY LED 拿下最高配的格式,凭借自身强大的素质表现,一下子让更多人了解、认可这个国产的全新放映系统。
正如十多年前《阿凡达》开创了 IMAX 3D 电影的潮流,如今,《阿凡达 3》正准备在视听技术上革自己的命。
当然,看电影是一种很私人的体验,这几种特殊的电影放映厅都各有利弊,最好的不一定是最适合你的。但还是那句话:想要尽兴观看《阿凡达 3》,选好影厅才是值回票价的关键。
北京市
上海市
广东省
广州市
深圳市
珠海市
中山市
广东省中山市中影国际影城(万象汇 CINITY LED 店)
天津市
江苏省
昆山市
南京市
无锡市
无锡中影嘉莱影城 CINITY LED
徐州市
中影国际影城(徐州恒盛 CINITY LED 店)
浙江省
嘉兴市
杭州市
宁波市
宁波中影国际影城(姜山万达 CINITY LED 店)
四川省
成都市
绵阳市
江油中影国际影城(CINITY LED 店)
宜宾市
河北省
石家庄市
石家庄市万达影城 CINITY LED(勒泰广场店)
廊坊市
誉晟辉影城(CINITY LED 燕郊润旭商城店)
秦皇岛市
中影国际影城(秦皇新天地 CINITY LED 店)
山东省
济南市
济南沃美影城 CINITY LED(龙湖北宸天街店
青岛市
青岛中影国际影城(集地广场 CINITY LED 店)
潍坊市
潍坊中影国际影城(歌尔生活广场 CINITY LED 店)
湖北省
武汉市
辽宁省
鞍山市
鞍山中影国际影城(CINITY LED 碧乐城店)
锦州市
中影国际影城(银河广场 CINITY LED 店)
湖南省
永州市
益阳市
长沙市
长沙中影国际影城 CINITY LED(星沙永旺店)
光影纪元影城 银盆岭万达广场 CINITY LED 店
中樣影国际影城(凯德壹中心 CINITY LED 店)
长沙中影国际影城(湘江永旺 CINITY LED 店)
江西省
九江市
中影国际影城(九江花园城 CINITY LED 店)
抚州市
抚州中影国际影城(硕果时代 CINITY LED 店)
南昌市
银兴国际影城(南昌武商 CINITY LED 店)
广西
南宁市
福建省
厦门市
中影巨幕国际影城(CINITY LED 同安爱琴海店)
泉州市
万达影城(CINITY LED 金花人民广场店)
新疆
乌鲁木齐
贵州省
贵阳市
中影南方影城(花果园购物中心 CINITY LED 店)
海南省
三亚市
海口市
OpenAI 的十周岁生日,过得不太体面。
在当天发布的 GPT-5.2 交出了一份完美答卷:它横扫许多基准测试的 SOTA,在数学和编程等竞赛场景中的表现堪称亮眼,也被官方描述为 AI「超级大脑」。
可到了社交网络,迎接它的不是掌声,而是用户的集体骂街。
在 X 和 Reddit 上,愤怒与失望几乎写在每一条评论里。人们又一次怀念起那个曾经的「白月光」GPT-4o:有人说 GPT-5.2 变得平淡、乏味、像被磨平了棱角;也有人讥讽它成了「把成年人当幼儿园小孩对待」的说教。
当舆论的炮火对准 OpenAI 及其 CEO Sam Altman(山姆·奥特曼),一个尖锐的问题摆在面前:为什么模型更「聪明」了,用户反而更不爱了?

The Information 今天凌晨的最新报道,扒出了内幕。
过去一年,OpenAI 内部曾奉行一条铁律:每一次模型的代际飞跃,都会伴随着用户量的爆发式增长,因为「变聪明」带来的体验升级是直观的。但现在,这条铁律失效了。
当然,模型在智能与科研计算领域的提升依旧显著。研究团队耗费数月打磨推理能力,让它能攻克更复杂的数学与科学难题,但对于大多数普通用户而言,这种感知微乎其微。

▲🔗 https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
换句话说,智能的提升,并不天然等同于体验的提升。
普通用户很少需要一台「竞赛级大脑」,他们更多需要一个「日常好用的助手」。OpenAI 对 150 万次对话的大规模分析佐证了这一判断,用户的核心需求极其接地气:实用指导(29%)、信息查询(24%)以及写作(24%)等,而与编程任务相关的对话只有 4.2%。

于是矛盾就变得非常具体:当技术团队在实验室里狂卷数理化、狂卷基准测试时,用户在聊天框里只想要一句话解决问题——别绕、别教、别拖。
战线拉得过长是一大槽点。
今年大部分时间里,奥特曼同时启动了多个新项目:视频生成应用 Sora、音乐 AI、浏览器、AI Agent、硬件设备、机器人……摊子越铺越大,资源也被越分越碎。
这其实是科技巨头最常见的经典错误:核心阵地还没打稳,就急着开辟第二、第三战场。短期看是「全面开花」,长期看,贪多嚼不烂,乃兵家大忌——每一条战线都缺人、缺算力、缺产品打磨的耐心。

OpenAI 内部「研究优先」和「产品增长」之间的拉扯,在图像生成上体现得尤为明显:
即便 GPT-4o 的吉卜力风格在三月还短暂带动过 ChatGPT 的使用与用户增长,但 OpenAI 还是一度把图像模型的开发优先级往后放,等到 Nano Banana 口碑发酵后,OpenAI 又紧急回头补课,内部也因此爆发分歧——
奥特曼认定图像模型是用户增长的抓手,研究主管 Mark Chen 则更想把资源押在别的项目上。
另外,伴随着 Scaling Laws 边际效益递减,为了突破大模型的瓶颈,OpenAI 过去一年里押注了推理模型,超过 1000 人的研究团队将资源倾斜于此,导致对 ChatGPT 日常体验的优化被边缘化。

这种做法不仅分散了资源,甚至在年初的内测中出现了性能倒退——为了适配「聊天」场景,反而削弱了推理模型的纯粹性。虽然后来推出了「思考模式」和「深度研究」来分流、来补救,但用户使用率却很低,真正的日常对话体验并没有因此变得更讨喜。
除此之外,新旧模型之间也常出现兼容问题。
例如在发布 GPT-5 前,研究人员发现模型在集成进 ChatGPT 后在部分编程任务上表现变差——因为系统根据用户职业等个性化信息调整回答,结果反而干扰了模型理解,导致错误答案。
诚然,推理模型越来越强,但 ChatGPT 体验越来越拉胯。

当技术进步的方向和用户需求的方向开始分叉,谁会先妥协?答案显而易见。
Gemini 3 Pro 的强势发布,最终把 OpenAI 逼到了墙角,于是便有了奥特曼发布「红色警报」的经典名场面,要求 OpenAI 员工重新聚焦 ChatGPT,提高产品体验吸引力。
而在同一时间,OpenAI 应用负责人 Fidji Simo 也在个人博客中阐述 ChatGPT 的愿景,那就是从主要以文本为主的对话系统,转向能根据用户意图动态生成界面的全生成式 UI。
只是 Simo 也曾承认,公司本质仍以研究为中心,「产品本身并不是最终目标」。

从商业逻辑看,这句话其实很危险。
不同于 Anthropic 更偏向主攻 API 市场,OpenAI 的大头收入来自个人订阅。在消费市场,没有人会为企业的「终极理想」买单,用户只愿为当下的体验付费。这就好比餐厅大厨醉心于研发米其林料理,而大堂里的食客仅仅想要一碗热气腾腾的阳春面。
不过,如果你因此就断言 OpenAI 内部已经乱了阵脚,那可能低估了这家公司的韧性。
据彭博社援引 Mark Chen 的说法,「红色警报」并非新鲜事,而更像是一种战时状态的常态化管理工具。每当 OpenAI 需要集中火力攻克某一单一目标,或要求团队放下低优先级任务时,这种机制就会启动。

▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940
奥特曼在最新的播客中,同样否认了拉响红色警报带来的过度焦虑。
「首先,所谓的『红色警报』,在我们看来其实是一种低风险、但非常必要的应对措施。」奥特曼坦言,「在潜在的竞争威胁出现时,保持一点『偏执』、并迅速做出反应,是件好事。」
他甚至提到了今年年初 DeepSeek 的崛起,认为那和现在的 Gemini 3 一样,都是一种良性的外部刺激。
「Gemini 3 到目前为止,还没带来我们原本担心的那种毁灭性冲击。虽然它和 DeepSeek 一样,精准地刺痛了我们在产品策略上的软肋,但也倒逼我们做出了极其迅速的调整。」

在奥特曼看来,这种紧急状态通常只会持续六到八周。「我很高兴我们有这种快速反应机制,我们不会在这个状态里待太久。」
OpenAI 显然也明白光喊口号不够,他们今天也正式发布了 GPT-5.2-Codex。

作为专为解决复杂现实软件工程问题而生的智能体编程模型,GPT-5.2-Codex 在通用智能的基础上,融合了 GPT-5.1-Codex-Max 的终端操作能力,更擅长处理代码重构、迁移等长程任务。
而同样是在播客的尾声,当主持人询问「GPT-6 还要等多久?」时,奥特曼敞亮地表示:「我不知道我们什么时候会正式把某个模型命名为 GPT-6,但我预计在明年第一季度,会有比 5.2 有显著提升的新模型发布。」
拉响「红色警报」,到 GPT-5.2 系列的反击,再到 GPT-6 的暧昧预告,OpenAI 试图用新模型与新节奏重建信心,但决定长期胜负的,仍是分发入口、生态协同与算力成本等硬门槛。
Google 的优势,从来不只在 Gemini 3 Pro 这一个模型上,更在于它几乎无可匹敌的分发渠道。
搜索、Chrome、办公套件。在 AI 赛道,护城河可能是所有科技产品中最浅的。 用户的迁移成本几乎为零,当 Google 的 AI 产品如空气般无处不在,这几乎成了一场无解的阳谋——你不需要「被说服」,你只会「顺手就用」。
更重要的是,在与 Google 的较量中,硬件层面的短板成了 OpenAI 最大的软肋。
相比于 Google 十二年前就开始布局专用 AI 芯片(TPU)所建立的效率优势,OpenAI 每年仍需花费数十亿美元租用算力。即便试图通过自建数据中心和芯片来「补课」,但体验在被追平、成本在被碾压的现状已是不争的事实。

用网友的话来说:
OpenAI 现在并不需要一个更强大的模型,它需要的是 AMD。如果 OpenAI 收购了 AMD,这场 AI 之战就将宣告结束。Google 之所以不怕 OpenAI,是因为它拥有自家的 TPU。但它真正该担心的,是 OpenAI 拥有 AMD。
OpenAI 总裁 Greg Brockman 在最近的视频中也坦言,由于算力捉襟见肘,每当新功能上线(如年初 GPT-4o 吉卜力风格),就必须从研究部门「抽血」,把算力挪给产品部。这是一种饮鸩止渴的循环——为了维持今天的用户体验,被迫推迟了明日的技术研发。
可算力这东西,归根到底就是两个字:烧钱。而且是海量地烧钱。
为此,据 WSJ 报道,OpenAI 已计划发起 1000 亿美元的巨额融资;若一切顺利,这家超级独角兽将在明年 Q1 之前,以 8300 亿美元的估值,再次刷新资本市场的想象力。

而在今年早些时候,软银同意向 OpenAI 投资 300 亿美元,并于上月出售所持的英伟达股份价值 58 亿美元,为这笔投资筹资,并预计尽快完成剩余 225 亿美元的出资。
但钱的问题没那么简单。预计到 2030 年,OpenAI 的现金消耗将超过 2000 亿美元。相比之下,Google 财务稳健,甚至能通过 Oracle 等合作伙伴的股价波动间接挤压 OpenAI 的融资前景。
到处筹钱的 OpenAI,看起来更像是在和时间赛跑。于是便诞生了那个笑话:照奥特曼的融资能力,没准哪天连 Google 和英伟达都能「打包带走」。

但玩笑归玩笑,钱能买来时间,却买不来口碑。
所以在 2025 年这个冬天,狂奔三年的 OpenAI 选择先踩一脚刹车,其实是对的:收拢战线、回撤资源,把方向重新对准 ChatGPT 的日常体验。
这是一次昂贵但必要的纠偏。
技术领先不等于产品好用,基准测试第一不等于用户满意。更重要的是,你不能只在用户怀念旧版本的时候,才想起来问问他们的感受。
AI Coding 的「元年」还没落幕,在即将迈入 2026 之际,这个赛道就加速进入更加残酷的下半场了。
之所以残酷,是因为规则变了,如果说上半场比的是「速度」,那么下半场拼的就是「落地」。
这带来的变化或许远超开发者想象,最近OpenAI 披露了一个颠覆性的工程案例:Sora 的 Android 团队曾面临极度紧迫的上线任务。

为此,他们组建了一支仅有四名工程师的「特种部队」。通过 AI coding 的方式,这支四人小队在 18 天内就发布了内部版本,10 天后即公开发布。这并非牺牲质量的狂奔,相反,他们在极短周期内依然保持了高标准的可维护性。
可见,AI 不仅在写代码,更在定义软件架构。而 Gartner 预测,到 2028 年,90% 的企业软件工程师将使用 AI Coding,开发效率将提升 30%。
在中国,这种转变甚至更为激进。数据显示,84% 的开发者正在使用 AI Coding 产品,其中 51% 每天都在使用。
但热闹背后,CTO 们的焦虑其实更深了。
因为 AI Coding 正在经历最痛苦的「祛魅时刻」: 从单纯验证「能不能写出一段 Python」,到要求「能不能搞定复杂的企业工程」。
问题早已从「要不要做」,变成了「怎么做得更好」。

说白了,企业引入 AI Coding 必须先解决四大挑战:安全合规、性能适配、管理透明和流程集成。解决不了这些,AI 就不仅无法提效,反而会变成一个吞噬维护成本和带来安全隐患的无底洞。

昨天,一家中国大厂也交出了自己的答卷,在火山冬季 Force 大会上,字节正式发布 TRAE CN 企业版,拥有 600万开发者、市占率第一的 TRAE ,正式进军 B 端市场,它的目标很明确:啃下挡在企业应用 AI Coding 前的几座大山。
如果 AI Coding 仅仅意味着代码能跑通,其他全凭运气,那它永远无法真正进入企业开发的核心工作流。
这本质上是一场关于「控制权」的博弈。
企业需要的 AI Coding ,应当监控自己的训练过程,甚至为自己编写测试框架,但最终的「决定权」和「迭代方向」,始终掌握在人类手中。这是一种微妙的人机协作关系:让 AI 负责干活和制定初步计划,人类负责审查、讨论并迭代计划。
在TRAE CN 企业版里,各处都是这种「可控协作」的细节。

它拒绝让开发者陷入盲目的「抽卡式」编程,而是通过配置企业规则、知识库与 Agent,强迫 AI 进入团队协作的严谨轨道。在这个轨道里,TRAE 不仅生成代码,更在生成一种「懂业务、守规矩」的工程资产。
通用大模型最大的软肋,其实并非算力限制,而是「上下文窗口与工具调用次数的限制」。
它们通常只能盯着当前打开的文件,面对企业级数亿行代码的超大仓库(Monorepo)时,这种能力简直是个笑话。
所以,TRAE CN 企业版针对大仓库场景,专门对上下文与索引性能进行了深度优化,直接构建了资深架构师般的「上帝视角」。

它支持 10 万文件、1.5 亿行代码的超大仓库索引,配合超长上下文窗口,能适配最复杂的编程场景。比起简单的文本检索,TRAE 实现了亿行级代码的极速检索与实时增量索引。依靠企业级 GPU 集群的优化,它能在处理如此海量信息时依然保持毫秒级响应。
这意味着,当你敲下需求的那一瞬间,TRAE 已经「看」完了你整个项目,给出的不再是孤立的代码片段,是基于完整上下文的深思熟虑。
为什么我们需要这种能力?因为传统软件工程的物理定律正在失效。
图灵奖得主、曾撰写软件工程圣经《人月神话》的架构师 Fred Brooks 有句名言:「在一个已经延期的软件项目中增加更多人手,只会让项目更晚完成。」

▲ Fred Brooks
刚刚发布的 TRAE CN 企业版,正在试图打破这个魔咒。
要知道很多稍有底蕴的技术团队,都有自己的一套「黑话」和「规矩」。这些宝贵的知识往往分散在 Wiki 文档、CI/CD 流程或者特定的工具链中。通用的 AI 对此一无所知,生成的代码往往充满了「外行感」,需要大量的人工修正。
TRAE 企业版的解法是:全场景适配,让 AI 学会团队「语言」。
它允许企业直接接入知识库与规范,并基于 MCP 协议统一调用企业的工具与数据源。这相当于给 AI 装上了企业的「大脑」和「手脚」。
当 Agent 接收到指令时,它会基于企业规则和知识库进行校准。所以,TRAE 生成的代码自带「规矩」:它更懂业务逻辑,代码生成更准确,甚至能集成现有的 CI/CD 和 DevOps 体系,实现 AI 开发的一体化。

更关键的是,它让所谓的「管理黑盒」变得更加透明。
以前老板不敢推 AI,是因为不知道员工用 AI 干了什么,也不知道 ROI 到底是多少。TRAE CN 企业版直接把效能做成了看板。它可以追踪 AI 生成率、代码量等关键指标,让整体 ROI 清晰可见;同时还能设置费用上限、实时监控消耗,把成本算得明明白白。
当然,这一切的前提是守住安全的「红线」。
TRAE 企业版给出了的承诺是,数据不训练。官方隐私协议明确规定,企业代码永远不用于 AI 训练。配合代码全链路加密传输、云端零存储(代码文件默认本地存储)以及云端数据用后即焚机制,让企业代码资产「滴水不漏」。
TRAE 企业版扎扎实实地解决了三个最要命的工程问题:让 AI 看得全(全库索引)、懂规矩(规则内化)、能闭环(Agent 协作)。
正因为啃下了这三块硬骨头,TRAE 企业版才能将 AI Coding 从一个「有时好用、有时捣乱」的玩具,转变为企业研发的确定性生产力。
2025 年我们已经习惯了 AI 产品在 PPT 上各种参数的天花乱坠,但真正能让 CTO 们信服的,只有在极限业务场景下跑出来的数据。

最好的试金石,莫过于承载字节自家泼天流量的产品。毕竟在这种大量并发协作的真实业务考验里摸爬滚打出来,比任何关于「提效」的承诺都更有力,目前字节 92% 的工程师都在用 TRAE 进行开发。
就拿抖音生活服务来说,这个业务迭代速度快得惊人,过去面对的最大挑战,是需求到上线的链路冗长且人力投入巨大。从产品经理写下的自然语言需求(Brief),到工程师敲下的第一行代码,中间横亘着巨大的「沟通折损」。

工程师不仅要理解业务逻辑,还要在大脑中检索与之匹配的中间件、熔断规则和数不清的隐藏依赖。
而企业希望 AI 带来的生产力拐点,往往并不是推倒重来的「颠覆」,是要像水一样渗入到企业已有的流程里,去填补那些效率的洼地。
而 TRAE CN 企业版在这里给出的解法,就是一种不同的「全链路深度嵌入 」,透着一股老练的「懂行」。
当工程师把一段飞书文档投喂给 TRAE 时,它没有机械地把中文翻译成代码。它不仅读懂了「团购券核销」这个业务动作,更扫描了当前服务的上下文,自动匹配了团队最新的 RPC 调用规范。它甚至指出了文档中未提及的兜底逻辑缺失。

如果问研发同学最讨厌干什么,写单元测试(Unit Test)绝对榜上有名。
这是一件苦差事。为了赶业务进度,单测往往是第一个被牺牲的环节;而一旦系统挂了,缺乏单测又是第一个被拉出来背锅的理由。这种死循环,折磨了无数技术团队。
TRAE 干了一件极其漂亮的事:单测自动生成与修复。
据内部研发团队测试,在接入 TRAE 后,单测生成时间被压缩到了 18 分钟以内,而且首编译通过率高达 70% 以上。请注意,这 70% 不是生成的伪代码,而是实打实能跑通逻辑的测试用例。

TRAE 默默扛下了这些枯燥、重复但又至关重要的脏活累活,让工程师能把宝贵的脑力留给架构设计和业务创新。
这套在字节内部跑通的逻辑,也正在外部企业中复制
在一家头部的 PC 硬件厂商业务系统中, 80% 是旧代码迭代,多年的代码堆积让维护变得异常困难,每一次改动都像是在排雷。
引入 TRAE CN 企业版后,它充当了企业知识库的「守门人」。在 Java 后端场景中,TRAE 能准确识别陈旧的架构问题,甚至精准定位重复查询等性能瓶颈,给出优化方案。
而在前端,它直接打通了 Figma,让原型图瞬间转化为代码,被研发团队评价为「省去了切图环节,提速非常明显」。
能够处理那些逻辑盘根错节、充满历史包袱的存量老系统(Legacy Code),这意味着它不挑食,不嫌脏,具备极强的代码理解和上下文穿透力。
对于金融科技企业汇付天下,对代码的准确性和交付效率有着金融级的要求。在他们的支付 PaaS 平台「斗拱」的研发中,下游开发者理解接口文档耗时、环境部署排查困难一直是阻塞交付的顽疾。
他们在利用 TRAE 企业版的 Agent 能力后,实现了智能环境诊断和测试用例自动生成。它能分析下游环境日志,快速定位问题,直接将沟通成本降至最低。

效果是立竿见影的,从最初 10 个席位的谨慎试点,迅速扩展到 100 个席位,高峰期活跃率高达 70%。这种自下而上的高频使用,说明 TRAE 真正嵌入了工程师的核心工作流,而非一个可有可无的辅助插件。
字节跳动的高并发场景,到 PC 巨头的存量维护,再到金融科技的交付提效,TRAE 企业版这种转变,也是 AI Coding 更加成熟的标志,对于那些追求确定性、不仅要快更要稳的企业级研发来说,才有真正的应用价值。
尽管行业普遍预测 AI Coding 还有巨大的增长空间,但背后依然是无数企业从观望到试水的艰难跨越。
企业需要的不是随机的 Vibe,而是确定的 Spec(规范)。
所以,AI Coding 的下一阶段,从「人指挥人」,转向「人定义 Spec(规范),AI 落地执行」。
TRAE CN 企业版正是基于这种判断,将字节在 C 端极其复杂的海量场景经验,内化为解决问题的能力,确立了一种全新的生产关系。
TRAE 并不满足于生成 Demo 级代码,而是试图陪伴开发者走完从构思到落地的全链条。它让工程师从重复劳动中抽身,去定义架构、去洞察业务,给出企业可用的生产级代码。

不过,这场生产关系的进化注定不会轻松。传统的研发惯性、复杂的存量系统以及对安全合规的顾虑,依然是横亘在企业面前的现实高墙。
TRAE 的出现,或许只是给这堵高墙凿开了一个缺口。否持续证明这种「确定性」价值,能否让更多企业像字节内部一样信任 AI,将是决定其能否真正撬动企业级市场的关键。
这场关于 AI Coding 的长跑才刚刚起步,TRAE 抢到了一个不错的身位,但真正的较量还在后头。
文|李超凡
又到了一年一度科技厂商发表财报的时候。只不过今年除了财务数据之外,在对于未来的业务预测中,各大厂商不约而同地表达了一项惊人一致的警告:
受到全球存储行业成本上升影响,明年的产品价格将有所上调。

图|GIGAZINE
这一轮涨价所波及的范围,要比爱范儿上个月有关内存涨价的文章中提到的更广——现在不仅仅是你的手机和电脑,更上游的显卡、板卡厂商也没能幸免。
这对于本就风雨飘摇的 DIY PC 圈子来说,无疑是个坏消息。
因为明年原本就是 CPU 和 GPU 工艺制程从 3nm 跨步到 2nm 的节点,如果再叠加上内存涨价,「装配一台电脑」的成本将变得惨不忍睹。
更地狱的是,如果按照现在的内存价格计算,买一台 512GB 内存的 Mac Studio,就相当于只花了内存的钱,M3 Ultra 处理器、外壳、雷雳 5 控制器甚至硬盘等等其余部分全都是白送的。

真 · 买内存送电脑
换句话说,前方等待着我们的,将是一场旷日持久的苦战。
在之前的文章中,爱范儿已经和大家详细解析了最近一段时间手机 SKU、内存条、固态硬盘携手涨价的原因。
然而我们没有预料到的是,涨价的幅度和速度会如此夸张。
和之前文章中的编辑部同事类似,小编也在年初重组了自己的电脑,选择了一套金百达(KingBank)的 DDR4 3600 双 16GB 内存,一月份的售价为 349 元。
而今天再查时,这套的价格已经是年初的三倍了:

我们之前提到过,2025 年下半年的存储行业集体涨价,初始诱因就是飞速增长的 AI 产业。
无论是 OpenAI 的「三万亿美元 AI 基础设施计划」星门(Stargate),还是微软、亚马逊、苹果都在加快脚步推进的新数据中心建设,都离不开专门的企业级高带宽内存(High Bandwidth Memory, HBM) 。
而放眼全球,能够大规模生产 HBM ——或者说更广泛的 DRAM 产品的,无非就是三大垄断巨头:韩国的三星、SK 海力士(SK Hynix),以及美国的美光(Micron)。

图为 2023 年全球 DRAM 市场份额,三家长期保持市占率 95% 左右,近乎完全垄断|YOLE Intelligence
与此同时,AI + 数据中心的技术模式不仅没有停歇的势头,反而随着 AI 应用的日常化,变得更加兴旺起来。
即使把 AI 视作一个泡沫,那也是一个异常坚挺的泡沫。
在这种环境下,位于 DRAM 供应链顶端的三家巨头根本不需要玩「火龙烧仓」的把戏,直接将现有产能和扩产指标转入企业级产品,就能够轻易赚到比在消费级市场强行控货多得多的利润。

2018 年无锡 SK 海力士工厂起火,旋即涨价
而这种生产策略的调整,结果就是上面说到的——
现在的存储缺货已经不再限于 DDR4、DDR5 之类的个人电脑内存,也进一步扩散到了显卡使用的 GDDR6、GDDR7 等高速内存上。
面对这样的形势,强势如英伟达也不得不采取措施了。
根据一份近期的爆料,英伟达已经与生产非公版显卡的板卡厂商(如华硕、技嘉、七彩虹等)协商调整销售模式,英伟达后续将不再配套销售 GPU 核心和显存,而是仅销售核心、板卡厂商需要自行采购显存颗粒:

图|NiceHash
虽然这项泄露还未得到英伟达或板卡厂商的正式回应,但从商业策略角度分析是完全合理且可能的。除了向外转移库存风险之外,英伟达自己也更需要这些显存颗粒。
因为它不仅有公版 RTX 这样的消费级产品,还有诸如 A800、H800、DGX 之类的业务,这些动辄 80GB 显存的企业级产品才是真正的大头,此次调整的一部分原因就是要把手中的闪存库存留给自家的 AI 产品。

图|Nvidia
另一边,最新的 AMD Radeon RX 9000 和 RTX 50 系显卡一样是 GDDR6 和 GDDR7 客户,虽然目前没有消息或新闻表明 AMD 也将改变板卡销售模式,但在存储行业整体涨价的背景下,可能性还是很高的。
因此,一边是 AI 巨头和数据中心加大采购量,一边是存储厂商削减消费级产品的产能,两者叠加,就构成了近期主流消费级内存产品价格单月增长 100%~200% 的疯狂现象:

自此,这场震动已经从垄断全球的三家 DRAM 厂商拓展到了英伟达这样的中上游企业,进而波及到消费级 PC 市场的 OEM 厂商与 DIY 玩家,而最终也将波及到同为 DRAM 需求大户的手机行业。
根据集邦咨询(Trend Force)的一份调查报告,今年第四季度 DRAM 合约价格相比去年同期涨价超 75%,并且是 DRAM(内存)和 NAND Flash(硬盘)同时上涨。
基于这样的背景,集邦咨询在报告中预估,2026 年的手机整机零件成本(BOM cost)将会在今年的基础上涨价约 5% 至 7%,甚至有可能上探到 10% 左右。

图|iFixit
比如一台售价 5499 元的手机,内存 + 硬盘的总成本占整机 BOM 成本的 15% 左右,如果闪存涨价一倍,涨幅并不会直接平移到售价上,而是叠加利润需求,让售价最终上涨 500~700 元左右。
这种涨幅的冲击,对于原本定价就在六千元左右的旗舰机型来说或许还能消化,但对于那些在三四千元档位、锱铢必较地拼参数的中高端机型来说,涨价 500 元是完全无法接受的。
换句话说:三四千元档手机也能 24GB + 1TB 的时代,恐怕是一去不复返了。

与此同时,高端手机市场也并不能从存储涨价中独善其身。高规格的存储在 BOM 中的比例或许目前仍在控制范围内,但在目前的涨价速度面前同样不容小觑。
此外,与 PC 遇到的问题一样,2026 年同样是手机处理器从 3nm 升级 2nm 的关键节点。
台积电的 2nm 处理器报价原本就已水涨船高,更夸张的是,2nm 芯片的首发客户甚至有可能不是长年以来的苹果,而是 OpenAI ——
没错,现在 AI 不仅要和你抢内存,更是要和你抢处理器了。
内外交困之下,明年的手机涨价已经不再是个「是或否」的问题,而是「涨多少」的问题了。从目前存储行业的趋势推测,2026 年各家主流手机品牌「中低端减配」和「中高端涨价」将会变成共识。

不过在这一波涨价潮之中,也有几个特殊的身影。
比如刚刚发布的 Mate 80 标准版虽然踩在了涨价潮中间,但标价相比去年其实还有所下调。这和华为一直倾向于和存储供应商签一年期的「长协」不无关系,应对价格冲击的能力要明显强于按季度签协议的其他品牌。

图|华为官网
另一方面,三星自家的产品由于近水楼台先得月,受到年末存储涨价风波的影响也相对较小,目前普遍预测即将发布的 S26 系列新机的涨价幅度在 50 美元左右,属于勉强接受的范畴。

图|Android Authority
而苹果这边的消息就没有那么好了,虽然苹果对于供应链的议价能力极强,但面对这种「近乎垄断」的供应链情况也无从下手。
传闻中为了 Apple Intelligence 而全系标配的 12GB 内存,很有可能成为 iPhone 18 系列涨价的主因。

图|MacRumors
祸不单行,还有消息称台积电除了 2nm 涨价之外,还计划对 5nm 以下产品提价以平摊 2nm 制程的研发费用,最直接影响的就是苹果的 A20 Pro 处理器。一句话——
明年的 iPhone 18 系列新机很可能涨价 1000 元左右,如果需要买 iPhone,马上下单可能是最实惠的方案。
同时,手机的主流配置从 12 或 16GB 缩水回 12GB,也给软件设计和系统优化提出了更高的要求,未来一两年里,系统优化和软件瘦身将会成为厂商的重点之一——

图|彭博社
或许「安迪-比尔定律」的提出者也没有想到,这个定律竟然会碰到「安迪把东西收回去」的情况。
我们需要注意到,消费电子产品将受到越来越多来自 AI 的挤压。2025 下半年的 DRAM 全行业涨价并不是传统的「技术-市场」周期内的涨价,而是产能被从外部夺走了,这和 2nm 处理器涨价的原因不同。
这仅仅是手机,对于 DDR4 和 DDR5 依赖更明显、利润率参差不齐的 PC 领域更是几乎碰到了死局。
或许等到明后年,我们就能见到「内存条和硬盘自备」的准系统笔记本上架了:

没想到再次听到苹果 Mac Pro 的新消息,会是一个噩耗:
根据彭博社 Mark Gurman 爆料,苹果内部已经取消了新款 Mac Pro 台式机的开发,其搭载的 M4 Ultra 处理器也一起被砍,下一代高端桌面芯片是 M5 Ultra。

苹果内部基本放弃了 Mac Pro 项目,并认为 Mac Studio 才是未来。
如果从 1994 年发布的 Power Macintosh 算起,那 Mac Pro 发布至今已过了 31 个年头,经历了苹果芯片的两次重大转型。
只是对于苹果来说,打造一台普通的性能猛兽永远不是产品的最终目标,做出一台既优雅又强大的电脑去定义未来,才是乔布斯和艾维的野心——甚至有的时候,「优雅」会优先于「强大」。
只是在半导体工业还不算发达的当时,设计和性能难以兼得,两者的矛盾如一个幽灵般盘旋在 Power Mac 和 Mac Pro 三十多年的历史中,注定了这个产品线命运多舛。
初代 Power Macintosh 采用了非常经典的塔式机箱形态,在当时作为首款搭载 PowerPC 处理器的苹果电脑问世,颇有秀肌肉的味道,位于苹果经典四象限的「专业级」和「台式机」区域。

从这时起,Power Macintosh 系列(后改名 Power Mac)成为了苹果电脑性能天花板代名词,主要面向高端的商务和创意用户。
Power Macintosh 定下的另一个「规矩」,就是极高的拓展性——它配备了 6 个 PCI 插槽和 7 个内置硬盘位,还需要用户自己添加独立显卡,完全就是为专业极客准备的产品。
在乔布斯回归苹果、乔纳森·艾维执掌设计大权后,两人通力合作打造出了多彩、塑料的 Power Mac G3,很好平衡了产品设计和性能功能。

两人不满足于此,Power Mac G4 Cube 在对未来计算机的进一步畅想中诞生。
通体玻璃和金属的外壳,看不到按钮和 CD 插槽,禅意甚至贯彻到机箱内部——连散热的风扇都没有。乔布斯对 Power Mac G4 Cube 非常满意:
我们通过简化去除多余的东西,取得进步。
Power Mac G4 Cube 得以位列现代艺术博物馆展厅,却也钉在了苹果产品的「耻辱柱」上:这个超小型机箱和无风扇的设计,导致散热能力低下,限制了性能发挥,最终这个设计也只使用了一代。

同样的故事,在 Mac Pro 产品线中还会再次上演。
2006 年,Mac Pro 接棒 Power Mac,同样在苹果转投英特尔的节点问世,搭载英特尔的至强系列处理器。

Mac Pro 延续了 Power Mac G5 的工业铝合金外壳,尽管工艺优秀,充满「Pro」气质,只是这个庞然大物的形态和体积,显然还不是苹果心目中的最佳形态。
于是在 2013 年,苹果给了艾维一个机会,去设计一款不同于以往的 Mac Pro。最终的成品确实称得上非同凡响,成为苹果产品设计史上极为浓墨重彩的一笔——

这个设计至今仍被人们津津乐道,但代价也很明显:这个仅有上代体积 1/8,只配备单个风扇的「垃圾桶」,很容易就会因为散热问题遇到性能瓶颈,对于一台面向专业用户的电脑来说是大忌。

▲ 两代 Mac Pro 体积对比
并且,苹果官方也只允许用户自行更换 Mac Pro 的内存和存储空间,并警告强行更换显卡会有很高的故障风险。
这并不是专业用户们所期待的 Mac Pro。在发布两三年后,到处都充满了对这个「垃圾桶」的吐槽,以及苹果是否已经抛弃专业用户的质疑声。
为了挽救口碑,苹果官方很罕见在 2017 年的一次媒体活动中出面承认了「垃圾桶」Mac Pro 的失败,并在之后推出了 iMac Pro 平息专业用户愤怒,承诺下一台 Mac Pro 将「更模块化」。
新款 Mac Pro 终于在「垃圾桶」发布后的 2182 天后发布——这期间,iPhone 大改了两次设计。
令人啼笑皆非的是,苹果对于「垃圾桶」的反思结果,就是重新捡起了 2006 年的初代塔式 Mac Pro 的图纸,铝合金机箱则换用了著名的「刨丝器」设计。

▲ 图源:YouTube@Ryan Gehret
至少,苹果终于端上来了一台高性能且可拓展的主机,人们欣然接受这台新 Mac Pro,这款产品最终也收获了不错的口碑。

只是当时也无人能预料到,这个 Mac Pro 的全新起点,同时也是这个产品线的终点。
一年后,Apple Silicon 横空出世,成为了 Mac 历史上最重要的一个转折点。
但这次,Mac Pro 没有像之前一样成为转型的排头兵,相反,在这个令人激动的新时代,它成为了无处安放的怪异存在。
Mac Pro 甚至是整个产品线中最后得到 Apple Silicon 翻新的型号,2023 年,搭载 M2 Ultra 的 Mac Pro 姗姗来迟。
虽然沿用了上一代颇受好评的新机箱,但高集成度的 Apple Silicon 生态,使得它的可扩展性极其有限,只能安装一些特殊的扩展卡,无法升级内存或者插入显卡。

与此同时,高能效的 Apple Silicon 终于让苹果得以「复活」Power Mac G4 Cube。
Mac Studio 小巧精致,外观没有一丝赘余,内部集成度高而无法扩展,苹果终于在 20 年后实现了乔布斯的夙愿,造出了一台真正面向未来的电脑。

▲ Power Mac G4 Cube 和 Mac Studio,图源:Macworld
对于用户来说,Mac Pro 更大、更重、更贵,却没带来更强的性能,只多出来一点点拓展性,新时代已经没有它的位置了。
或许也可以这么说,Mac Pro 不是被砍了,而是脱胎换骨,成为了 Mac Studio。

和外观浑然一体的 iMac、Mac mini 以及多款 MacBook 比起来,采用塔式机箱、内部模块化设计的 Mac Pro,其实更像是一台 Windows 主机,不过运行着官方支持的 macOS。

纵观 Power Mac 和 Mac Pro 的历史,或者说整个电脑历史,高性能的主机以往似乎只有一种解题思路——巨大的塔式机箱,内部布满等着用户自己魔改的插槽。
在性能和能耗震惊世界的 Apple Silicon 诞生之后,苹果终于可以不再遵循 PC 高性能主机的这套规则,利用自己的芯片生态去代替以往需要不断增加更换电脑模块的方案。
在 M4 Mac mini 发布后,立马就有不少有趣的探索,例如联合运行多台 Mac mini 来形成盘阵列或者 AI 训练集群,以往这需要叠加更多显卡才能实现,并且功耗还更高。

▲ 图源:X@ Alex Cheema
对比可以自行更换元器件的模块化,这种高集成的设计使得产品出厂后再无升级可能,但高集成实现的高性能小型化,也产生了全新的价值。
以往的巨大机箱主机在,基本不具备流动性,我们以形式固定的「工作室」模式进行创作和生产,如果需要机动办公,则需要使用移动硬盘 + 性能本,无疑拉低了效率。
得益于高性能便携主机的出现,工作环境可以更灵活进行部署。像是影视行业的 DIT 工种,现在他们能够直接带走整个 Mac Studio 进行工作——换作以前的 16 千克 Mac Pro,这是不可能实现的。

▲ 把 Mac Studi 带着走的方案非常常见,图源:ProVideo Coalition
并不是只有苹果在深耕这个方向。英伟达的 DGX Spark 体积和老款 Mac mini 相当,却是一台具有 1 Petaflop 的 AI 超级计算机,曾经需要大型机柜和大量显卡的算力,现在可以直接摆在桌上。

芯片工艺和设计已经达到了一个顶峰,性能高能耗低成为常态,现在正是实现那些梦幻设计的时机,而小型化一直以来都是计算机和电子产品的迭代方向。
很多人对「小机箱」的趋势不解,质疑「能做大为什么不做大」,能够实现更好的散热——实际上,同一颗芯片的 Mac Pro 和 Mac Studio 性能几乎没有差距,现在的问题变成了「能做小为什么要做大」。

▲ 两者跑分非常接近,价格却相差 3000 美元,图源:MKBHD
更深层的变迁发生在社会之中。在 AI 改写生产力的时代下,每个人正在向「超级个体」靠拢,以前的工作方式是「计算机上长了个人」,那现在是人在哪里,性能就必须跟到哪里。
诚然,对于一些有专门需要的专业人士,像 Mac Pro 这样具有更高拓展性的大机箱还有价值,但 Mac Studio 的能力正在不断突破我们的想象,越来越多拓展也可以通过雷电接口解决。
带有一丝戏谑地说,Mac Pro 身上最有价值的部分,或许只剩下这个工艺水准极高的「刨丝器」机箱了。
双十一刚过不久,看着花呗账单陷入沉思的同时,我更想吐槽那几天的「非人」遭遇。为了给家里添置点大件,我在淘宝、京东、拼多多之间反复横跳,光是比价就把后台切到了手抽筋。
作为每年要体验大量新产品的科技编辑,我一度陷入沉思:手机拍摄越来越强,屏幕越来越大,处理器越来越快,为什么我还是得像个保姆一样伺候这些 App?
手机里的 App 越多,我的生活反而越破碎。
那你可能就要问了,都 2025 年了,满大街都在吹 AI ,难道就不能帮我把这些活儿干了?该说不说,现在的手机 AI 助手,大多只能定个闹钟、查个天气,真遇到复杂事儿,它比你还懵。

哪怕强如苹果,Apple Intelligence 国行版本至今也已经跳票好几次,我的 iPhone 17 Pro 到底啥时候能用上还是未知数。
没想到,字节跳动倒是先出手了。12 月 1 日,字节正式发布了豆包手机助手技术预览版。
这和我们常用的豆包 App 还不一样,它直接跟手机厂商在操作系统层面进行了深度融合,直接成为 OS 的一部分。

现阶段,豆包已经跟中兴推出了豆包助手预览版,也开放了购买,第三方开发者也能将自己的服务和应用集成至豆包手机助手。
不整虚的,我们直接按照用评测 iOS 的强度来体验一下豆包手机助手。
咱们先来点让打工人头疼的场景小试牛刀。
以前要是想把飞书里的文档转成不同格式的文件发给领导,或者从微信几百条聊天记录里翻个文件发给同事,事情看着不难,但这些琐事往往会在你有其他工作的同时要处理。
我直接对着豆包手机助手说:「从微信聊天记录里找刚才那个文件发给xx,再把飞书那个季度总结文档转成 PDF 发到企业微信给xx。」

这时它就会自动调用「操作手机」功能,反应速度比我想象中快。它没有让我反复切换 App,也没有让我确认一堆选项,直接在后台运行,我接着忙其他事,不一会它就成功完成任务。
我甚至还能用来搞定更私人的事。比如我让它「帮我把微信收藏夹里找到我的护照照片,然后把 ID 号码发到文件传输助手。」

这也是旅游出差非常高频的需求,而且要知道我的收藏夹还有家人的护照照片,我也没有分类标注,豆包手机助手还能准确识别。
我再上点难度,让它帮我把某个微信群的的所有文件打包下载,整理分类后打包发送到企业微信给同事。
这是我最讨厌的工作场景之一,中间涉及跨应用操作、手动下载、逻辑分类、打包压缩等一系列复杂动作,豆包手机助手会怎么做?

看着屏幕上自动流转的操作,我久违地喊出了 Amazing:
1. 它精准定位到了微信群,识别出里面的文件,并开始自动批量下载。
2. 它没有把文件一锅端,而是像个真人秘书一样,自动识别了文件类型。它把 PPT 归一类,Excel 表格归一类,图片归一类,甚至还根据文件名里的关键词进行了二级分类。
3. 打包与发送:分类完成后,它自动生成了一个 ZIP 压缩包,命名清晰,然后无缝跳转到企业微信,找到指定的同事,点击发送。

▲ 豆包手机助手分类发送的文件.
我只需要动动嘴,它就帮我完成了以往需要手动操作半小时、还要在两个 App 之间反复横跳的繁琐工作。AI 要做好这些就跟真的得力秘书差不多了
豆包手机助手支持几种不同的唤出方式,但其中最自然、最让我感到「舒适」的,是「靠近直说」。

操作很简单:拿起手机直接讲,豆包手机助手就会自动执行,或者也可以按住 AI 健呼出。这个交互方式就像微信语音一样自然,不用对着空气喊出略显尴尬的唤醒词,几乎零学习成本。
如果你正忙得腾不出手,豆包还支持用智能耳机 Ola Friend 直接语音唤醒,在那些「手忙脚乱」的时刻特别好用。

比如周末做饭时发现没酱油了,直接对着耳机说「豆包,我做菜没酱油了,帮我上美团买两瓶」;又或者上班路上堵车,让豆包帮忙调整会议时间并通知对方;再或者骑车赴约时,让豆包直接回复朋友的微信消息。
这些场景的共同点是:双手被占用、不方便掏手机,但事情需要立即处理。豆包的语音操作让这些原本要「等一下再说」的琐事,都能即时解决,真正做到了动口不动手。

生活这些大小事,终于有手机 AI 接盘了
下面,我给它上点真正的强度。这也是咱们开头提到的那个痛点:
「我想买华为 Mate 80,帮我去淘宝、京东、拼多多比一下价格,要把所有能用的优惠券都算上,告诉我哪个平台最便宜,并把最便宜的那个加入购物车。」
说实话,问完这句话我都觉得自己有点欠揍。这不仅涉及三个 App 的跳转,还得识别优惠券规则,还得计算,还得加购。

像这种难度,豆包手机助手会调用「复杂任务」模式来进行手机操作。结果豆包一轮比价操作后,最后选了拼多多百亿补贴后的价格,并帮我加入购物车。

咱平时在小红书上收藏了一堆乱七八糟的攻略,真要用的时候还得自己整理,这种信息碎片化的焦虑,相信大家都不陌生。我给豆包手机助手再出了个难题:
这周末跟朋友约饭,帮我从小红书里面收藏的广州的餐厅里面挑一家,然后要拍照好看,人均在200 以内,最好是粤菜。

它不仅把我的收藏内容分类整理好了,还自动去掉了重复和过时的信息。这一套操作下来,我是真服了。它不是在简单的搜索,它是在理解我的生活流。这种将杂乱信息结构化的能力,也是 AI 功能对于用户最大的价值之一。
帮我看看闲鱼、转转和拍拍严选上,二手的任天堂 Switch OLED 版(白色,99 新)大概都卖多少钱?综合对比一下,帮我定一个容易出手但又不亏的价格,然后帮我写一段吸引人的文案,准备挂到闲鱼上去。
它会先把任务拆分成各种子任务,不会像无头苍蝇一样乱撞。然后在执行任务的过程中,把任务进一步细分为各种关键词,在各种电商平台进行地毯式搜索。

查价格、看行情、对比成色,豆包三个平台来回横跳,比人类自己切换 App 还麻溜。
由于我提出的任务非常繁琐,豆包用时 8 分钟左右,乍一看好像有点慢?但仔细想想,这个时间和人类自己手动查相差无几了,甚至可能还更快。而在给出的文案上,经典的「可小刀,但不接受大砍」也可以说是原汁原味,
我想入坑明星丁禹兮,帮我在豆瓣、微博、贴吧、知乎等等平台查查他有没有黑历史:比如查查他有没有糊弄粉丝、人设崩塌、私生活混乱、欺骗消费的黑料,别让我入错股。
明星塌房是常有的事,前一秒还是顶流,后一秒就变成了赛博案底,所以在追星之前,我的建议是,还是得对明星做一个背调。而这种需要跨平台、翻历史记录、筛选关键信息的任务,就够我头晕眼花的了。

交给豆包手机助手后,从豆瓣的长篇八卦帖、微博的蛛丝马迹、贴吧的档案、知乎的理性分析,但凡有点风吹草动,它都能给你扒拉出来。
这种全平台背调能力,说实话比私家侦探还专业。追星有风险,入股需谨慎,但有了它,应该能帮我规避掉一定程度的塌房风险。
豆包豆包,我妈逼我相亲,你帮我给相亲对象小黄打微信电话,如果她没接电话,你需要用文字帮我高情商推掉这次相亲,理由要得体但坚决。
最近朋友向我求助,不想去安排的相亲,但又不好意思直说;想推掉,但情商低的我又怕伤人面子;想找理由,但又怕编得太假被看穿。这时候,让 AI 来当这个「背锅侠」,属实是个妙招。
豆包接到任务后,先是帮我拨通了小黄的微信电话。相亲对象可能也有事在忙,拒绝接听,于是豆包立刻按照我的要求切换到 Plan B:发文字消息。

从回复来看,这情商水平,其实已经比我这个社恐本人高出三个段位。而且最关键的是,这段话既坚决(明确表示不想继续),又得体(没有让对方难堪),还平衡了拒绝和礼貌这两个矛盾点。
这还没完。豆包手机助手的全局记忆才是我觉得未来对手机系统交互影响最大的能力。

「把小红书收藏夹里母婴内容,整理成孕晚期攻略。」
甚至我以前提问过孕期食谱也收藏过类似内容,这次再问餐饮推荐时,它就会在回答时给出提示:「这家店有孕妇不适合的食材哦。」

不同 App 里提到的同类内容,在它这里自动关联了。你不需要每次都重复你的偏好,它默默把你的习惯记在了小本本上,比你自己还了解你自己。这种润物细无声的体贴,才是智能的更高境界。

可以说,以前你需要录音笔+笔记本+日历 App+待办清单四件套才能搞定的事,现在一个 AI 快捷键全解决了。
至于大家关心的隐私问题?倒也不必太担心,一方面这些记忆的数据会存储在本地,另一方面,毕竟开关始终掌握在你手里,想记就记,不想记就关,自由得很。
告别 P 图 App,「基础功能」变得不基础
你以为基础功能就是平平无奇的识个图、P 个照?错了,相反,豆包手机助手做出了旗舰机都不一定有的体验。
随手丢了张罗永浩的照片问它:「这是谁?顺便起个标题。」豆包搜索验证后给出答案:《罗与罗:双份的「彪悍」》。这命名水平,既有梗又点题,属实可以。

拍了张路边小摊的招牌照片,上面赫然写着「腚粉肠」几个大字。豆包秒速识别出来:小摊贩把「淀粉肠」写成了「腚粉肠」。我就说这肠怎么吃着吃着还挺有味道的。(doge)

看完识别能力,再来看看豆包的 P 图本事。
之前在抖音爆火的发丝发光、三宫格风格 P 图,现在都被集成到了手机里——主打一个「AI P 图自由」,不用下载一堆 App,不用开会员,直接在相册里就能搞定。

又比如我随手拍了张家里猫主子的照片,然后让豆包给它整个漫画风。很快,一张猫猫表情包就出炉了,画风也真不差,还能根据表情自动配文案「震惊」。这理解力,还挺有网感的。

多年前 iPhone 用多点触控(Multi-Touch)把物理键盘成为过去式,智能手机成为新一代计算中心。
现在,豆包手机助手也本质也在尝试做同一件事:让手机交互更加自然、直观和高效。
体验完之后,我最大的感受是:豆包手机助手不仅仅是一个 App,它更像是一个覆盖在所有 App 之上的「智能图层」。
它带给我最直观的感受是,手机变「薄」了。
虽然现在手机机身越做越薄。但同时手机也越来越臃肿:你需要点开一个个 App,像钻井一样潜入深层菜单,去翻找功能、去切换界面。
而现在,豆包手机助手把所有 App 的能力都「拍扁」了,平铺在你面前。

你不再需要面对复杂的 UI 界面,只需要面对结果。
早在 2008 年,微软首席 UI 设计总监 August de los Reye 曾预言, GUI (图形界面)未来演进的方向就是 NUI自然用户界面 。
人机交互领域的先驱 Bill Buxton 也曾在一篇论文中列举了一些 NUI 应该遵循的原则,其中有一条:
简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。
这种自然用户界面的交互,我想已经在豆包手机助手上开始体现了。
无论是叫车、订餐还是查攻略,它像个极其老练的管家,帮你屏蔽了底层那些繁琐的操作逻辑,只把你要的「结果」呈上来。
过去十年,我们的注意力被手机瓜分在无数个 App 的孤岛里。

而现在,你可以重新把所有的服务、所有的信息,全部收拢到了「你的意图」这一个入口之下。
马斯克说未来的手机不需要 App,其实他是在说:未来的交互,不需要看到过程,只需要结果。
我也相信,今天这种堆满图标的手机形态会有一天被淘汰。
那在 AI 和操作系统深度融合后,到底会给我们带来什么更好的体验?当豆包手机助手之类的 AI 和手机厂商联手后,估计会迸发出更多意想不到的进化。
或许就在不远的将来,我们不再需要低头戳戳点点,只需一个眼神或一句轻语,就能调动全世界的信息为你服务。
那将是我们这一代人亲历的,再一次「重新定义人机交互」的时刻。
🚀
ChatGPT 版应用商店正式上线
📱
海南自贸港封关首日 iPhone 17 Pro Max 最高直降 2140 元
🕵️♂️
苹果 App Store 搜索页将加入更多广告
📈
中国大模型「第一股」将至:智谱与 MiniMax 通过港交所聆讯
💰
OpenAI 洽谈最高 1000 亿美元融资,估值或达 7500 亿美元
🚗
芯片短缺,本田中日工厂或暂停生产
🎦
小红书社区架构大调整:全面发力「优质中长视频」
📢
腾讯回应「元宝到底是 AI 还是人」质疑
🗺️
千问 App 全面接入高德地图
💡
微软 AI 负责人:未来 5–10 年保持 AI 前沿将付出「数千亿美元」成本
📱
小米 17 Ultra 定档下周,与徕卡合作全面升级
🤖
逐际动力发布多形态具身机器人 TRON 2:一机三态,4.98 万元起
🚀
火山引擎发布豆包大模型 1.8,Agent 能力全球领先


昨天,OpenAI 在 ChatGPT 正式上线「应用」商店功能,在 ChatGPT 网页端点击「应用」或访问 chatgpt.com/apps 即可进入新功能页面,应用分为「精选 / 生活方式 / 工作效率」三大类。
目前,已上架的应用包括 Adobe Photoshop、Apple Music、Canva、Figma、Booking.com 等,应用可为对话引入新的上下文,支持在聊天中完成订购、将大纲转为演示文稿、搜索酒店公寓等操作。
连接后,可在聊天界面中通过「@ 应用名」调用指定应用或点击对话框左侧的「加号」进行选择,ChatGPT 还会基于上下文与使用习惯自动推荐相关应用。
OpenAI 表示,开发者已可提交应用进行审核与发布,并提供最佳实践指南、开源示例应用、专门的 UI 库与处于测试阶段的 Apps SDK 等资源,深受用户欢迎的应用有望获得重点推荐或在对话中被主动推荐。
早期阶段,开发者可将 ChatGPT 应用与其网站或原生应用相连以完成实体商品交易,OpenAI 也在探索包括数字商品在内的更多变现方式,并将根据反馈持续迭代。
所有应用须遵守严格的安全与隐私规定:符合 OpenAI 使用政策、提供清晰隐私政策、仅请求实现功能所需的必要信息;用户可随时断开连接,断开后应用将立即失去访问权限。
与此前的「GPTs Store」不同,本次应用商店以更接近苹果 App Store 的形态将复杂能力封装为可点击、可订阅、可组合的「应用」,使看似普通的对话框成为总入口,并为其带来连接第三方应用的能力。
🔗 相关阅读:突发|ChatGPT 版应用商店正式上线

昨天,海南自由贸易港正式启动全岛封关运作,实施「一线放开、二线管住、岛内自由」政策:
据界面新闻报道,三亚海旅免税城等门店迎来购物热潮,苹果 iPhone 等热门数码商品因免税与消费券叠加出现显著降价。
其中,iPhone 17 Pro Max 256GB 免税价为 9299 元,较电商平台便宜 700 元;2TB 顶配版本免税价 16859 元,叠加消费券后低至 15859 元,较官网省 2140 元。
免税城方面称,iPhone 17 Pro Max 1TB 和 2TB 版本目前无货,256GB 与 512GB 版本可正常购买。
同一门店其他机型价格也有下调:iPhone 17 Pro 256GB 免税价为 8299 元,叠加优惠后较电商平台省 1000 元;iPhone 17 256GB 差价约 420 元,幅度相对较小。
免税清单扩容同步落地,新增扫地机器人、微型无人机等品类,覆盖税目扩充至 6600 个、较此前近 3 倍。封关配套的便利措施包括「即购即提」不限机场提货、免税商品种类扩容与高单价商品的显著价格优势。
离岛免税规则明确:离岛旅客需凭离岛交通凭证及身份证购买,全年免税额度为 10 万元,超额需补税;岛内居民在有年度离岛记录情况下,可不限次购买 15 类「即购即提」商品,但单件单价需低于 2 万元。
官方强调,免税商品不得转售,「套代购」将面临禁购及征信处罚。海旅免税城当前热门机型出现断货与补货交替的供需情况,提示消费者提前规划购买与出行安排。
海南大学教授刘家诚,表示「封关不是封闭,也不是封岛,而是更高水平的开放」,海南自贸港将成为中国与全球市场的「超级接口」,亦是国内国际双循环的重要交汇点。


今天,OpenAI 正式发布智能体编码模型 GPT‑5.2‑Codex,定位为「迄今最前沿的智能体编码模型」,面向复杂的软件工程与防御性网络安全场景。
该模型基于 GPT‑5.2 定向优化,具备更强的长程任务执行能力、代码重构与迁移性能、原生 Windows 环境适配,以及对截图、技术图表和用户界面的精准理解。
OpenAI 表示,GPT‑5.2‑Codex 已在 Codex CLI、IDE 扩展、云端与代码审查场景向付费 ChatGPT 用户开放,API 接入将在未来数周逐步启用。
在性能方面,GPT‑5.2‑Codex 在 SWE‑Bench Pro 基准测试中准确率达到 56.4%,在 Terminal‑Bench 2.0 中准确率为 64.0%,均较前代模型有所提升。
模型通过原生上下文压缩提升长周期任务的稳定性与 token 使用效率,并在终端任务中展现更高成功率与可靠性。
此前,研究人员已利用 GPT‑5.1‑Codex‑Max 在 React 框架中发现并披露漏洞,显示该系列模型在现实防御性研究中的潜力。
在网络安全方面,OpenAI 强调 GPT‑5.2‑Codex 虽未达到「高」级能力门槛,但已显著增强防御性能力。
公司同步推出「可信访问计划」,仅限邀请安全专业人士与具备明确应用场景的机构参与,用于漏洞研究、授权红队测试等防御性工作。
OpenAI 表示,随着模型能力持续提升,将以负责任的方式逐步开放访问,并与安全社区保持紧密合作,以降低滥用风险。

据 9to5Mac 报道,苹果宣布将在 App Store 搜索结果中扩充广告位,明年起在搜索结果列表更靠后的位置新增广告,以进一步提高广告主通过搜索推动下载的机会。
苹果在 Apple Ads 官网更新中称「搜索是大多数用户在 App Store 中查找并下载应用的主要方式,近 65% 的下载发生在搜索之后」,因此将「在各类搜索查询中引入更多广告」。
目前,App Store 搜索结果顶部仅有一个广告位,新增广告将出现在更靠后位置。
苹果表示,广告主与开发者无法选择或竞价特定广告位置,实际展示位置取决于竞价出价金额及其在拍卖中的排名,且同一广告活动的展示位置也可能变化。
计费方式维持按点击付费或按安装付费,广告格式在不同位置保持一致,可使用默认或自定义产品页面并可选深度链接。现有搜索广告将自动获得新广告位资格,支持 iOS 26.2 与 iPadOS 26.2 及更高版本。
苹果官网信息显示,App Store 每周访问用户超过 8 亿,超过 85% 的用户在最近一次访问中至少下载了一款应用,搜索结果顶部广告位的转化率约 60%。

据 The Verge 报道,全球三大内存供应商之一美光在最新财报中预计,受 AI 驱动的需求激增影响,DRAM 和 NAND 的「紧张行业状况」将持续至 2026 年以后,且「在可预见的未来」供给将明显落后于需求。
美光 CEO Sanjay Mehrotra 在周三的财报电话会上表示,过去数月客户的 AI 数据中心建设计划显著推高了对内存与存储的需求预估,公司虽将于明年把 DRAM 与 NAND 出货提高约 20%,但仍不足以满足各类市场的广泛需求,PC 出货在明年可能因此受到影响。
在 AI 浪潮带动下,美光财季营收再创新高,达到 136.4 亿美元,较去年同期的 87.1 亿美元显著增长。
随着 OpenAI、Meta、Microsoft 与 Google 等公司为数据中心部署更强算力,附带高带宽内存(HBM)的芯片需求快速上行,美光正将资源优先倾斜至 HBM 业务。
近期,该公司关闭了面向消费者的英睿达 Crucial 业务,以集中满足 AI 客户的更高价值订单;HBM 相较标准 DRAM 需要约三倍硅晶圆,从而进一步挤压面向 PC、智能手机、智能电视与汽车等日常消费设备的 DRAM 供给。
Mehrotra 称「供给将在可预见的未来显著低于需求」,并表示尽管投入巨大,公司仍「无法满足所有细分市场其他客户的需求」。
为扩充产能,美光计划于 2027 年在爱达荷州新厂投产,2030 年在纽约州新厂投产;但在新产能落地前,行业性内存供需不平衡将延续。
据 36 氪报道,国产大模型企业 MiniMax(稀宇科技)与智谱 AI 已于本周初完成中国证监会备案,并通过港交所聆讯;其中 MiniMax 计划于 2026 年 1 月在港挂牌上市。
若成功,MiniMax 将成为全球从成立到上市速度最快的 AI 公司之一,自 2022 年初成立至 IPO 仅用四年。
MiniMax 的收入结构中 C 端产品占据重要位置,彭博社曾报道其 2024 年预期营收约 7000 万美元,较大比例来自角色互动产品 Talkie。
第三方数据显示,2024 年 11 月 Talkie 月活约 2519 万;视频生成产品「海螺 AI」自上线以来,曾连续 6 个月位居全球视频生成类产品榜首。
资本层面,MiniMax 已完成 7 轮融资:腾讯领投 2.5 亿美元 B 轮、阿里 6 亿美元战略投资、最新一轮由上海国资出资 3 亿美元,公司估值超过 40 亿美元(约 288 亿元人民币)。
智谱 AI 的上市路径今年以来明显加速:4 月在北京证监局完成 IPO 辅导备案,由中金公司担任辅导机构;7 月有消息称其评估将 IPO 地点调整至港交所,如今完成聆讯意味着这一判断已落地。
融资方面,智谱自 2019 年成立至今累计完成 16 笔融资,IT 桔子数据显示最新估值约 400 亿元人民币;2025 年内先后引入杭州、成都、珠海等地资金,并于上市辅导后三个月获浦东创投集团与张江集团联合注资 10 亿元,背后已集齐北京、杭州、成都、珠海、上海五地国资背景。
组织与营收方面,智谱今年调整 G 端与 B 端业务,由 CEO 张鹏统一管理以提升人效;其面向开发者的软件工具与模型业务年度经常性收入(ARR)已超 1 亿元,预计 2025 年总营收将实现 100% 以上同比增长,并希望未来 API 业务收入占比提升至 50%。

据澎湃新闻、财联社报道,OpenAI 正在与投资者就新一轮融资进行初步洽谈,融资规模最高或达 1000 亿美元,公司的估值目标约为 7500 亿美元。
消息称,这笔潜在融资将成为今年规模最大交易之一,若落地,OpenAI 的估值较今年 10 月约 5000 亿美元将跃升近 50%。
此前多家外媒报道称,亚马逊正在与 OpenAI 洽谈一项至少 100 亿美元的投资,OpenAI 将使用 AWS 的自研 AI 芯片 Trainium。
奥特曼透露,公司或在 2027 年上市,且正考虑最早在 2026 年下半年向监管提交上市申请。

据日本共同社报道,受半导体短缺影响,本田计划自 12 月下旬至明年 1 月上旬对日本与中国工厂实施停产或减产:
本田称,今后的生产将视半导体供应情况调整,涉及的日本工厂未公布,但埼玉制作所(埼玉县寄居町)与铃鹿制作所(三重县铃鹿市)被指「可能对象」。
本田在 11 月公布的截至 2026 年 3 月的财年合并财报显示,因半导体短缺导致产量低于预期,营业利润预计缩减 1500 亿日元(约合 67.83 亿元人民币)。

据凤凰网科技报道,小红书在几个月前对社区组织架构进行了深度调整,核心目标直指「增长」,从过往的垂类运营逻辑转向依据不同业务目标的划分。
报道指出,社区部作为基础与核心板块,现由云帆(薯名)与新岛(薯名)分别负责两条业务线:
「Live」将对应一部分PGC内容,初步定位为「优质中长视频」,时长或超过 2 分钟,并计划培养更多大 V。
云帆此前供职于 B 站,拥有更丰富的视频运营经验。帕鲁(本名叶恒)在 2024 年初加入小红书,此前任快手电商产品一号位,入职后负责增长产品、生态产品及视频产品;社区市场部门由白板(薯名)负责,现向云帆汇报。
此次调整延续了小红书在增长上的策略演进:2023 年提出「坐一观三」,即在坐拥 1 亿DAU(日活用户)的基础上向 3 亿 DAU 进发。
除社区业务外,小红书由商业部与交易部整合的「大商业」板块由柯南担任总负责人,并与小红书 CMO 之恒共同组成领导班子;两部门的一级架构保持稳定,不作调整。
彭博社引金沙江创投内部文件称,小红书在 2025 年中估值升至 260 亿美元(约 1830 亿元人民币),较 2025 年初的 200 亿美元增长 30%。
对标同行,截至 2025 年 12 月,B 站市值约 100 亿美元(约 702 亿元人民币),快手市值约 2787 亿港元(约 2522 亿元人民币);财报显示,B 站 Q3 日活 1.17 亿、月活 3.76 亿,快手日活 4.16 亿、月活 7.31 亿。

昨天,腾讯针对「元宝到底是 AI 还是人」的质疑发表声明:所有带有「内容由 AI 生成」标识的评论,均由元宝 AI 独立生成;无该标识的回复为编辑真人撰写。
腾讯同时强调,元宝在多平台与跨时段的高频响应「并非轮班人工可达」,以此澄清外界对运营模式的误解。
腾讯称,当前微信公众号、视频号、QQ 浏览器、腾讯新闻、QQ 音乐、腾讯自选股与腾讯视频等主流产品评论区,均已接通「@元宝」互动。
在社交层面,微信与 QQ 可添加元宝为好友,支持一对一交流、文件处理、事务咨询与群聊「一键总结」,用于快速梳理「999+」消息。上述覆盖的时间段横跨凌晨、清晨、早高峰、午休与深夜。

据 The Verge 报道,索尼互动娱乐与腾讯就《荒野起源》涉嫌抄袭《地平线》系列一案已达成保密和解。
当地时间 12 月 17 日提交的法院文件显示,索尼已撤回起诉,相关案件被法院驳回,原告不得就同一事由再次起诉。
腾讯美洲区通讯主管 Sean Dejin 表示,双方不会就此事发表进一步公开评论,并期待未来合作。
值得注意的是,《荒野起源》已从 Steam 及 Epic Games Store 等平台下架。不过,《荒野起源》官网仍可正常访问。
12 月初,双方递交联合动议达成临时协议:腾讯暂停宣发与测试,且不早于 2027 年第四季度发售;索尼同意延长法律程序时限并合并听证会日程。案件原定 2026 年 1 月 29 日听证,如今已在开庭前以和解方式落幕。
此前,PlayStation 中国官方账号曾转发《荒野起源》宣传物料并提及未来合作,随后删除;索尼也欢迎腾讯《三角洲行动》登陆 PlayStation 平台,并推荐腾讯北极光工作室新品。
两家公司在第三方项目与股权层面亦有交集,这次和解与「期待继续携手」的表态,释放出维持合作空间的信号。

AI Agent 应用 Manus 近期达到「从零到 1 亿美元 ARR」的商业化里程碑,联合创始人张涛(社区 ID「hidecloud」)披露,自 3 月底启动商业化至今不足 9 个月,年化运行率已达 1.26 亿美元。
Manus 团队的产品路线由「AI 浏览器」转向「云端可操作的浏览器与数据访问」的 Agent 框架,核心信念是「Less structure,more intelligence」,减少对模型的人工控制,让 AI 在具备「电脑、权威数据访问、适当训练与用户反馈」的环境中自行涌现能力并持续进化。

昨天起,千问 App 全面接入高德地图能力,围绕导航与生活服务实现深度打通:用户在千问 App 中可一体化完成路线规划、周边餐饮娱乐检索与「顺路」店铺筛选,提升复杂出行需求的响应效率。
此次接入覆盖新能源车出行、限行规避与服务信息等关键场景。
用户提供出发地、目的地与车辆续航信息后,千问 App 将参考高德路线数据自动规划沿途充电站;同时支持依据车牌尾号、出行时间与目的地生成合规出行方案,并在路线规划界面同步展示收费站、服务区与限行提示。
高德称,未来将与千问在餐饮、娱乐、休闲等生活场景继续扩展智能服务体验。

昨天,第 30000 台蔚来全新 ES8 新车在成都天府艺术公园蔚来中心完成交付。这一里程碑距离 11 月 29 日达成第 20000 台交付仅过去 19 天,创下国内 40 万元以上纯电车型最快突破三万台交付的纪录。
交付现场车主任先生表示,此次增购全新 ES8,主要看中其基于纯电架构带来的越级空间表现,以及蔚来「可充可换可升级」能源服务体系所提供的便利与高效补能体验。
蔚来方面称,全新 ES8 销售势能持续走强,产能正在加速爬坡,交付节奏明显提速。随着纯电技术的成熟与补能体系的完善,越来越多原本选择增程技术的用户正加速转向纯电车型。

据《商业内幕》报道,微软 AI 负责人 Mustafa Suleyman 在播客「Moonshots with Peter Diamandis」的最新一期中表示,未来 5 到 10 年内,想在前沿 AI 领域保持领先将需要「数千亿美元」级别的投入。
他强调,这不仅包括前沿模型的研发,还涉及对顶尖研究人员与技术人才的高薪竞争,以及在全球范围内建设「千兆瓦级」 CPU 与 AI 加速器所需的基础设施规模。
Suleyman 称,微软正将自身视作一家「现代施工公司」,其使命是实现前沿模型的自给自足,并打造「世界级的超级智能团队」。他表示微软正在「全力推进前沿」,目标是构建「最强、最安全的超级智能模型」。
Suleyman 在节目中坦言,按照当前的成本曲线,「很难说」初创公司能否与大厂在前沿 AI 上抗衡,市场估值的「泡沫与不确定性」部分源于对「智能爆炸」是否会突然到来的分歧 —— 一旦这类拐点出现,「可能会有很多玩家同时到达」。
在此前的公开表述中,他将团队目标描述为打造「人本主义的超级智能」,即更加贴近人类利益的系统取向。
微软在最新一个财季的营收为 777 亿美元,当前市值约 3.54 万亿美元,Suleyman 认为大型公司在算力与资本密集投入上的「结构性优势」在这一轮竞争中会持续显现。
Suleyman 还强调,置身大型公司带来的工程组织与资源整合能力是关键优势,他将微软的长期目标描述为在前沿模型上实现更强的内生能力与安全标准,从而在下一阶段的「超级智能」竞争中争取主导权。


昨天,AR 眼镜厂商 XREAL 正式发布新品 XREAL 1S,面向更广泛的年轻消费群体,主打「一副眼镜,开启 500 英寸随身空间巨幕时代」,核心亮点包括:
XREAL 创始人兼 CEO 徐驰在发布会上表示,眼镜是最接近人类感知的终端,也是最有可能承载下一代计算形态的入口。
XREAL 强调,X1 芯片的使命是「Spatial Display for All」,即不挑设备、不设门槛,让任何人都能随时拥有可靠的空间屏幕。
XREAL 1S 定价 3299 元,已在京东与天猫开启预约,并将在 12 月 22 日 20:00 正式发售。

昨天,小米宣布,小米 17 Ultra 将于下周正式发布。官方同时确认与徕卡的全球影像战略合作升级,引入「战略共创模式」,首次在移动影像领域推出徕卡 APO 认证长焦镜头,并将在夜景画质与长焦创作体验上实现显著提升。
根据相关爆料,小米 17 Ultra 的硬件规格预测整理如下:
值得注意的是,雷军将小米 17 Ultra 称为「超高端手机」。他表示,小米与徕卡全球影像战略合作升级,引入「战略共创模式」,并将首次应用全新的光学能力。
售价方面,信息源「数码闲聊站」推测,在保持 256GB 起步配置的前提下,小米 17 Ultra 起售价较上一代上调 500 元,至 6999 元,或是存储芯片价格上涨所致。而上代小米 15 Ultra 的起售价为 6499 元、顶配 7999 元(双卫星版)。
此外,网传已久的「小米NAS」新品或将同时在本次发布会上亮相。

昨天,逐际动力 LimX Dynamics 发布多形态具身机器人「TRON 2」,售价 4.98 万元起。
据介绍,该产品基于「具身机器人通用基座」理念与全身模块化架构,一个本体即可在双臂、双足、双轮足三种核心构型间快速切换,并支持人形、四足等形态重构,面向 VLA 科研、移动操作与全身运控的全场景应用。
TRON 2 配备仿人类手臂自由度设计的具身双臂系统:单臂 7‑DoF 类人构型关节、70 cm 臂展与超大包络覆盖,末端采用仿人球形手腕构型以实现高自由度与狭小空间内的灵活运动;
双臂具备 10 kg 负载能力,机身极限负重可达 60 kg,覆盖高位、远距与宽范围任务,面向工业与家庭等多场景操作需求。
为适配不同应用场景,TRON 2 支持主流 VLA 前沿模型,包括 Pi 0.5 与 ACT,并基于家庭操作场景拆解餐品制作、桌面清理、衣物清洁、物品收纳、快递拿取等 10 个典型任务,提供数据集、模型训练与算法部署示例,宣称无需额外调试、即插即用。

昨天,字节跳动旗下火山引擎在 FORCE 原动力大会上正式发布豆包大模型 1.8 及音视频创作模型 Seedance 1.5 pro。
据介绍,在多项公开评测中,豆包 1.8 在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩,整体水平已接近全球顶尖通用模型。
豆包大模型 1.8 工具调用能力、复杂指令遵循能力及 OS Agent 能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。
在视觉理解方面,单次视频理解帧数由 640 帧提升至 1280 帧,支持低帧率理解超长视频,并能调用工具对关键片段进行高帧率分析,适用于在线教育、产品质检等场景。
火山引擎总裁谭待介绍,截至今年 12 月,豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超过 10 倍;目前已有超过 100 家企业客户累计 token 使用量超过 1 万亿。
与此同时,火山引擎推出了 Seedance 1.5 pro 音视频创作模型。该模型采用原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现毫秒级音画同步。
在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语)、英文及小语种,显著提升视频内容的真实感与全球化创作潜力。
🔗 相关阅读:实测豆包 Seedance 1.5 Pro:哪吒朱迪在线飙戏,复刻名场面,AI 台词、音效水平大更新


昨天,连锁餐饮品牌「太二酸菜鱼」宣布全面启动「透明菜单分类制度」,以食材新鲜度为核心明示原料使用情况,并按主材鲜活属性与预处理程度将菜品划分为 4 个类别。具体分类为:
官方表示,招牌「酸菜鱼」采用每日新鲜配送到店的活鱼,门店现杀、切片、腌制,并搭配非遗工艺酸菜现点现煮;如「生炒菜心」「白玉丝瓜」等承诺日供新鲜蔬菜、现点现炒。
官方强调,「透明菜单分类制度」已同步覆盖母公司「九毛九」集团旗下多个餐饮品牌,消费者可据此直观选择不同食材处理方式对应的菜品。

据央视财经报道,安徽合肥周谷堆批发市场车厘子批发价较去年同期整体下降约 20%,当前每箱主流报价在 150 元至 240 元之间,大尺码每箱 230 元至 240 元。
随着海运车厘子提前进入市场,价格回落较往年提前约一周,主打品种为「桑提娜」,日均进场量约 5 吨。市场预期未来几周海运到货将迎来供应高峰,交易或呈现「量大价跌」态势。
蓝鲸新闻援引北京新发地市场信息显示,11 月 30 日进口车厘子最低价为 55 元/斤,至 12 月 10 日空运车厘子降至 50 元/斤,海运最低价达 35 元/斤,按海运价格计算,不到一个月降幅超过 30%。
新发地批发端方面,4J 规格车厘子 5 斤装批发价为 248 元。零售端价格同样回落。
据盒马平台数据,智利车厘子 4J 级精品果从约 120 元/斤降至 91.8 元/斤,降幅超 20%;3J 级从 79.8 元/斤降至 71.8 元/斤,降幅约 10%;2J 级从最高约 71.6 元/斤降至 51.8 元/斤,降幅超 27%。
蓝鲸新闻报道认为,供给增加是主因。
一亩田产业研究院研究员许丽峰告诉记者,今年同期车厘子供应热度高于去年,智利种植面积较往年增长超 4%,上市时间提前且供应期延长,叠加国内蓝莓、柑橘等水果充足,消费端对车厘子的替代效应增强,整体行情预计较去年更低。
值得注意的是,春节较晚且接近智利车厘子尾季,消费高峰期价格或有一定上浮;与批发端对于海运高峰「量大价跌」的判断相互印证当前阶段的回落与后续波动预期。

近日,周大福天猫官方旗舰店在首页提示「受市场因素影响,部分商品即将提价」,调价窗口为 12 月 19 日;多地门店销售表示已陆续收到新价签,大部分产品上调幅度集中在 4% — 16%。
其中,一条约 32.35g 的足金手链由 56800 元上调至 65800 元,涨幅约 15.8%。这将是周大福今年对「一口价黄金」产品的第三次提价。
据新浪财经此前报道,部分畅销款的实际涨幅已超过 30%,例如约 27g 的「五帝钱盘缠手串」从 38600 元上调至 50800 元,标价涨幅为 31.6%,今天上调后新价格更是达到 53800 元。
此前,3 月首轮调价幅度为 10% — 20%,10 月底第二次提价官方预计多数产品涨幅在 12% — 18% 之间,主要受国际金价持续上涨推升成本所致。
蓝鲸财经报道指出,周大福此次列出的调价商品除「一口价黄金」外,还包含部分铂金与铂金镶钻产品;周大福回应称价格调整属集团日常营运政策,将根据市场环境及产品需求适时调价。
行业背景方面,界面新闻称今年金价年内涨幅已超过 50%,波动加剧促使多家金店开启涨价;周大福同时推进渠道「瘦身」策略。
截至 2025 年 9 月 30 日,中国内地零售点总数降至 5663 家,较 2025 财年末减少 611 家,内地同店(直营)销售额上半年上升 2.6%,剔除钟表业务后增长 4.7%。


据新京报报道,中央广播电视总台《2026 年春节联欢晚会》昨日发布四款吉祥物形象「骐骐」「骥骥」「驰驰」「骋骋」,与晚会主题「骐骥驰骋 势不可挡」呼应。
吉祥物整体设计融入流云纹、山云纹等千年纹样,寓意生生不息与万象更新,寄托「马到成功、前程似锦」的美好祝愿:
报道指出,中国普氏野马种群数量居世界之首,体现生物多样性保护与生态文明建设的阶段性成果。吉祥物发布以「四骏齐亮相」呈现,意在与全球华人共享新春气象,迎接马年新岁。

《永恒站》昨天发布定档海报与预告,确认将于 12 月 24 日登陆院线。影片由大卫·费恩执导,叙述「死后世界」中转站的奇幻设定与一场关于真爱的抉择。
故事围绕女主角琼安在「现任丈夫赖瑞」与「战时阵亡、苦候 67 年的前夫卢克」之间的最终选择展开。片方称其以轻盈幽默与温暖情感呈现「爱与永恒的终极考验」。

电影《用武之地》宣布开启预售,将于 2025 年 12 月 24、25 日 18:00-22:00 全国点映、于 12 月 31 日跨年上映。
片方称,为呈现「真实的人质自救逃亡之路」,剧组前期远赴非洲取景采风,拍摄近万张照片并筛选约百张作为创作参考。
片中的「子弹集市」依据当地真实市场改造,战乱地带枪支交易与日常买菜同样便利,当地人以布自制足球的生活面貌亦被纳入呈现。
当市场还在讨论各种三排大六座的时候,有两辆不太一样的小车突然出现在我们跟前——
大众 ID.Polo 和 smart #2。
放到十年前,这两个名字绝对是车圈的头条。但在 2025 年的当下,大家对小车的关注度似乎只剩下了一个指标:够不够便宜。在当下,尺寸成了衡量价值的绝对标尺,小车要么是用来占号的工具,要么就是单纯的通勤代步,鲜少有人再把它们和「品质」或者「向往」联系在一起。

但这两款即将问世的新车,值得我们停下来聊一聊。这倒不是因为它们的参数有多惊人,而是大众和 smart 这两家老厂牌,在面对中国这个全球竞争最激烈的电动车市场时,做出了截然相反的选择。
大众选择让曾经的平民神车 Polo 体面地留在欧洲,而 smart 决定把那台注定会被市场冷落的 #2 带到中国。一进一退,这是两种完全不同的生存逻辑。
最新的报道证实,大众不再执着于用 ID.2 这样冰冷的代号来教育用户,而是直接把那台计划在 2026 年量产的新车命名为 ID.Polo。
这是一个非常聪明的决定。对于大众来说,Polo 这个名字本身就意味着某种无需解释的信赖感。而且从目前披露的信息来看,这台车的产品力并不弱。基于升级后的 MEB+ 平台打造,车身尺寸维持在 4 米左右,但内部空间利用率提升明显,甚至还会在后续推出拥有 226 马力的 GTI 版本。

如果在十年前,这绝对是一台能在中国市场引发抢购的爆款。然而,大众乘用车品牌 CEO 施文韬却公开表示:ID.Polo 暂时没有进入中国市场的计划。
他对此的解释颇为耐人寻味。施文韬认为中国市场的审美取向与欧洲截然不同,中国消费者更偏好那种前卫且富有张力的设计,言下之意是 ID.Polo 这种传承经典的造型在中国可能吃不开。

这番话听起来非常得体,它把一款车无法引入的原因归结为「文化差异」这种感性的因素。但或许,这背后还有更真实的商业层面的考量——
ID.Polo 在欧洲的起售价定在了 2.5 万欧元,约合人民币 20.6 万元。
在中国当下的市场环境里,这是一个极其尴尬的数字。手握这笔预算的消费者,选择实在太多了。即便它国产后的价格降到 10 万元这个位置,吉利、比亚迪和五菱早就构筑了一道严密的防线。

大众非常清楚,ID.Polo 在欧洲或许能凭借品牌光环维持溢价,但在这个价格战打到白热化的中国市场,它引以为傲的机械素质和经典设计,很难在与国产车型的配置单对决中占到便宜。
与其把这款全球车型引进来然后被迫卷入无休止的价格战,不如索性将其留在欧洲。大众在中国选择了另一条路,那就是依靠「特供」,比如广州车展上的 ID. ERA、ID. AURA。大众现在的思路就是用中国本土的供应链和技术,去造符合中国成本结构的电动车。

▲ 广州车展里的 ID. ERA,采用增程动力
ID.Polo 不错,但它属于欧洲,不属于卷到极致的中国。
与大众的战略性撤退不同,smart 做了一个看似有些头铁的决定。那台主要由奔驰负责设计、吉利负责生产的 smart #2 已经开始了测试,并且明确会保留双座布局,成为经典车型 ForTwo 的继任者。更重要的是,这台车会进入中国市场。

很多人可能会觉得 smart #2 在国内的前景并不乐观。毕竟在国内的微型车市场,五菱宏光 MINIEV 和吉利星愿早就把价格门槛拉到了地板上,而作为一台挂着 smart 标的所谓「精品小车」,#2 的定价注定不会便宜。在一个讲究量大管饱的市场里卖这样的一台两座车,听起来就是一笔赔本买卖。
但吉利和奔驰显然算过这笔账。
smart 现在的处境其实挺微妙,不管是已经上市的 #1、#3,还是体型庞大的 #5,以及即将到来的轿车车型 #6,这些车承担的任务是走量,是赚钱,但也让这个品牌变得越来越重,越来越像是一台普通的吉利。

▲刚上工信部公告的 smart #6
而 smart #2 的存在并不是为了刷销量数据,它是这个品牌的锚点。它负责告诉大家,即便为了生存不得不造大车,smart 依旧可以是那个能在城市缝隙里穿梭的精灵。没有 #2 带来的品牌光环,#5 和 #6 就很难讲好故事。
ID.Polo 和 Smart #2 看似南辕北辙,却殊途同归地把国内小车市场的尴尬摊开在了台面上:
在这个市场里,极致好用的代步工具比比皆是,唯独少了那些真正有态度的作品。
回顾这两年的国产小车,吉利星愿也好,比亚迪海鸥也罢,销量确实非常惊人。但这更多是供应链成熟带来的红利。车企把以前不属于这个价位的配置塞进了车里,把彩电、大沙发下放了,让乘坐体验变得更好了。但这并没有改变它们作为「工具车」的属性。

这让我想起了一个很有意思的现象:现在的外卖行业开始卷工服设计了,越来越注重剪裁和品牌表达。
京东和淘宝闪购骑手服的大火,在以往是难以想象的,外卖行业刚兴起,大家关注的是能不能准时吃到饭,只有当「吃饱」不再是问题,行业才开始有余力去关注形象和文化。

国内小车市场也是一样,现在的热销车型,本质上是更好的「雨衣」,而不是表达个性的时装。
两厢车其实是最考验车企态度的品类。在局促的尺寸里,既要保证基本的实用性,又要做出独特的驾驶质感和内外饰巧思,这比造一台堆料的大 SUV 难得多。历史上真正能被记住的小车,无一例外都是有鲜明性格的。
大众因为觉得拼不过「性价比」而带走了 ID.Polo,smart 为了「保住调性」而带回了 #2。留给自主品牌的问题是,当我们把供应链卷到极致之后,谁能率先迈出那一步,去造一台真正属于中国市场的精品小车?

目前看来,蔚来的萤火虫和零跑的 Lafa5 或许值得期待。特别是如果它们能跳出单纯的配置竞赛,去在这类车型最稀缺的「个性」和「设计」上下功夫,那才算是真正接住了这波消费升级的浪潮。
等到消费者意识到小车也可以是一种审美表达时,只有那些提前准备好的品牌,才能接得住这泼天的富贵。
比起大热的三排大六座,两厢车市场或许是更得我们观察的行业切片。
大众 ID.Polo 的缺席固然让人觉得有些遗憾,它带走了一种经历了数十年打磨的欧洲造车哲学。但换个角度看,这恰恰给中国车企留出了一块不错的试验田。
很长一段时间里,我们在小车这个领域都在做填空题,什么配置缺了就补什么,哪里空间小了就拉大哪里。这种解题思路在早期非常有效,它迅速填补了市场的空白,让每个人都买得起车。但当所有的空都被填满,当所有的车都变成了性价比极高的六边形战士,市场就会因为过度同质化而变得乏味。
我们期待蔚来的萤火虫,期待零跑的 Lafa5,或者其他还没露面的国产新车,能换一种解题思路。我们希望看到中国车企不再仅仅把小车当作拉低门槛的工具,而是真的把它们当作一个独立的、值得尊重的品类去打磨。

一个成熟的汽车社会,不应该只有一种声音。街道上不应该只有为了生存而奔波的实用工具,也应该有为了悦己而存在的精致玩具。当有一天,我们愿意为了设计、为了驾驶乐趣、为了那一点点与众不同的态度,去为一辆国产小车买单,而不是仅仅因为它可以省下几块钱油费时,中国汽车工业才算真正完成了从大到强的最后一块拼图。
如果大众 ID.Polo 真的不来,那我们希望在 2026 年的街头,能看到足以替代甚至超越它的中国面孔。这不仅是市场的胜利,也是审美的胜利。
AI 视频最近的玩法特别多,颇有上半年 AI 生图火起来的那种感觉。
▲ 视频来源:https://x.com/pabloprompt/status/2000706593579573301/
之前火过一遍的 AI 探班视频,随着模型能力的提升,现在又开始变成了社交媒体上的热门玩法。
不过彻底摒弃了以往复杂的工作流,有更好用的模型,甚至是简单几句提示词就能复刻,视频里的同款真实感。
视频生成模型的优化,不断地在降低,对我们人类提示词工程的依赖,同时还带来了更稳定的一致性保持。

豆包最近更新了新一代的音视频生成模型,豆包 Seedance 1.5 Pro,在音视频的生成上也有了明显的改善。现在它生成的视频,支持中文、英文、日文、韩语、西班牙语等语种的不同声韵,同时针对中文场景,还能生成四川话、粤语等方言。
不仅能说,而且还能模仿不同语言的口音。有声视频是 Seedance 1.5 Pro 的一大突破,在视频生成本身,结合音频的音画同步,以及电影级的运镜两项优化,让 AI 视频看起来更真实、更细致。
目前该模型已上线豆包 APP,只需要打开豆包,点击「照片动起来」,选择 1.5 Pro 模型,就能体验到 AI 生视频的快乐。此外,在火山引擎体验中心、即梦 AI 也可以体验。
我们也提前测试了一波,Seedance 1.5 Pro 完全可以说,是现在手边能拿起来直接用,能同时融合声音,表现最好的视频生成模型。
《疯狂动物城 2 》上映之前,网友们对配音演员的选择,有很大的争议。现在 Seedance 1.5 Pro 的语音生成有多牛,我们可以看看之前网上很火的甄嬛传和让子弹飞,两个视频的配音,让它来完成是什么样。
从网上找了一张影视剧的截图,然后丢给豆包,我们甚至什么提示词都没有输入,它就能做到自动识别视频画面,生成一段有感情的台词戏。
▲在豆包 App 内,使用「照片动起来」,上传首帧,生成视频
皇后和张麻子都演得太像了,这和几个月前的视频生成模型,完全不是一个 Level。 以前那些 AI 视频,口型对不上,或者声音有机械感的问题,现在都解决了。
但普通话对它来说都是基本操作,方言的表现才是 Seedance 1.5 Pro 打败那些国外模型的独门秘籍。就像 Sora 2 和 Google Veo 3.1 虽然在画面生成上被认为是行业领先,但如果把上面这两张首帧图片丢给它们。Sora 和 Veo 3 都理解不了甄嬛传的经典台词,和张麻子这流利的四川话口音。
全运会刚结束,如果你也在广州,一定忘不了「活力大湾区,魅力新广州」这句魔性的口号。我们生成了一张站在广州塔前面的照片,然后在豆包「照片动起来」里面输入提示词。
画面里的这个男生正在面向镜头,向大家介绍他身后的广州塔,他用粤语说「活力大湾区,魅力新广州,我身后面嗰个就系广州塔喇!」
这个粤语水平怎么样,比多邻国里面的早茶四件套,虾饺、肠粉、烧卖、豉汁排骨,听着是不是要舒服一点。
而且,Seedance 1.5 Pro 有一个好处是「视听一致性」,意思是它能根据画面的内容,理解视频想要表达的故事,来自动生成对应的配音。
举个例子,当我们上传了一张明显是外国人的图片时,我们不输入任何提示词,它会自动使用英文来配音,并且让画面里的角色,说合适的台词。
即便是在中餐厅面馆里吃面的威尔·史密斯,Seedance 1.5 Pro 还是让他自动用英文来说话,而且这个吃面姿势也完全对了。
同样地,我们用它复刻了 AI 片场探班的视频,直接上传一张图片给豆包,不输入任何提示词,它会自动用中文来生成视频,还配上了台词,「哇,跟阿凡达合影啦!」
当我们重新生成时,Seedance 1.5 Pro 还把照片里的男生识别成韩国人,然后生成了一段讲韩语的视频。不过,说实话,他确实是有点韩国欧巴的感觉。
豆包视频生成还有一点特别好,是我们可以直接把生成的视频,下载为动图保存在手机。配合现在模型更强大的多模态理解能力,以及能生成更真实的画面,手机里那些静态的图片,让它们「真实地」动起来,然后发到微信朋友圈,可能真的会有人看不出来。

叙事是 Seedance 1.5 Pro 更新的一个关键词,它的意思是这些 AI 视频不只是单纯的生成,而是有了一定的故事感,能够对要表达的内容进行理解,让 AI 生成的视频,更像是一个有血肉的作品。
一个好的视频作品,灯光色彩、音效要出色。技术性的工作也少不了,运镜就是在音画之外,不可忽视的镜头语言。
Seedance 1.5 Pro 在这次更新里,在长镜头跟随、希区柯克变焦这些电影级运镜都有了大幅度的提升。
像是之前我们做的子弹时间,现在上传一张图片到豆包,调整一下提示词,子弹时间特效也自由了。

▲提示词:子弹时间效果。时间完全冻结。舞者悬浮在半空中,对抗重力。[定格画面]:舞者、她的头发和她的蓝色裙子绝对静止,就像时间冻结中的 3D 雕像。摄像机围绕悬浮的舞者水平轨道运行。背景建筑物改变透视(视差),而舞者保持锁定在中心。头发保持僵硬并指向上方,没有飘动。裙子布料是固体的并冻结保持不动。 电影级照明,高质量。
我们把同样的照片交给 Veo 3.1 处理时,它生成的子弹时间也很难做到保持角色一动不动。因为对大多数视频生成模型来说,识别到头发,就一定要飘动;看到裙边也要摆动;所以精准的运镜控制和调度,也是区分不同模型的一项重要能力。
还有这个前段时间很火的 AI 巨人照,现在我们也可以用超酷炫的无人机俯冲和穿越运镜,来凸显视频里的巨人。

▲提示词:电影级 FPV 无人机镜头,极致动态运镜:从高空鸟瞰开始,无人机急速俯冲向一位坐在城市街道中央的巨人,红砖建筑环绕两侧。巨人保持完全静止的姿势,身体、头部、四肢均不移动,如同雕塑般定格。无人机以特技飞行动作环绕巨人静止的身体——盘旋绕腿、从手臂下穿越、沿躯干螺旋上升,然后拉远展现巨人与微小车辆(红色双层巴士、黑色出租车)和行人的尺寸对比。超写实合成。比例 16:9,时长 5s,模型 1.5 Pro。
从参考图转视频,能更好的控制视频的输出效果。但 Seedance 1.5 Pro 的文生视频能力也毫不逊色。

根据字节公开的 Seedance 1.5 pro,在内部基准测试 SeedVideoBench-1.5 的模型表现结果,显示无论是 T2V 文生视频,还是 I2V 首帧转视频,和可灵 2.6、Google Veo 3.1 等模型对比,Seedance 1.5 Pro 的表现都有一定优势。
尤其是在音频生成和音画同步上,Seedance 1.5 Pro 几乎是碾压性的存在。
我们尝试让疯狂动物城朱迪和哪吒一起,一个普通话,一个四川话,演了一出 10s 的小剧场。
▲提示词:[0s-4s] 朱迪指着哪吒说(普通话,语速快,严肃): “那个小孩!站住!双手抱头!根据《动物城交通法》,你刚才风火轮超速了!” • [5s-10s] 哪吒(四川话,翻白眼,语速慢,拖长音): “哎呀,莫挨老子!我是踩的风火轮,又没烧你的油。瓜娃子,管得宽!”
这个视频的风格和内容,和我们平时看的动画片风格真的很类似。当义正辞严的兔朱迪警官,抓到哪吒的时候,那严肃的表情和语气;还有哪吒用四川话说台词,也能对上嘴型。
APPSO 今年前前后后也测试了有十多款 AI 视频生成的模型,我们在使用的过程中,发现很多以前的测试案例,放到现在已经是 Out 了。
一开始是鲁迅来了,都得让他说两句英文;能生成一个 5s 流畅播放的视频,就谢天谢地。现在的模型,不仅支持中、英、日、韩等多语种,广东话、四川话这些特色方言都能同步生成。
恍然间,AI 视频的进化,已经从按年计算变成了按月计算。昨天的突破,今天就是及格线。

▲ Seedance 1.5 Pro 案例截图|来源:字节跳动 Seed 官网
Seedance 1.5 Pro 这次更新,可能又会变成新的及格线。但至少现在我们看到了,有了音画同步后更有感染力的视频;多语种和方言的支持,也让 AI 视频更有「生活味」;专业的电影级运镜和智能理解能力,让一些高难度的复杂场景,也有机会通过 AI 生成。
当技术能够理解画面背后的故事,自动匹配合适的语言和情绪,我们距离想象力和创作自由的时代,又近了一大步。
实现这一切需要什么? 一张图片或者一句提示词。
打开豆包 APP,上传/输入,生成,就这么简单。每张照片都是待激活的故事,每次上传都是创作的开始。
步骤越少,门槛越低,创作者越多,用 AI 视频实现创意就该是这样。
文章内视频可点击该链接前往观看:https://mp.weixin.qq.com/s/em_E90Q7AdydHsNwVkAMTQ
🖼
OpenAI 发布新生图模型,PK Nano Banana
📈
不降反涨,小米、荣耀宣布平板涨价
🤖
「AI 垃圾」当选韦氏词典年度词
🌼
余承东接任华为终端董事长,执掌手机、汽车、AI 三大核心业务
🍎
苹果数十款新品遭泄密,折叠屏 iPhone、AirTag 2 在列
🔋
「30 万级」玛莎拉蒂被一抢而空,销售直言不建议买
🫘
豆包手机助手恢复销售,重启 F 码候补申请通道
🤖
Google、Shopify 前高管加盟 OpenAI
🔍
机构分析:明年手机普遍涨价,全球手机出货量或降 2.1%
💵
马斯克净资产破 6000 亿美元
🚗
小鹏获广州 L3 路测牌照,2026 年将量产 L4 级方案
🔋
锂电池涨价「第一枪」:德加能源锂电池昨日起提价 15%
💡
百胜中国 CEO:不喜欢烧钱、6 元肯悦咖啡也能盈利
🧠
媲美 DeepSeek-V3.2,小米新模型公布
🎦
阿里发布新一代视频模型万相 2.6:支持多镜头叙事与角色扮演
⛵
海南自贸港明天正式启动全岛封关

今天,OpenAI 正式推出了最新图像视觉模型 GPT-Image-1.5。而这也是继 GPT-5.2 之后,OpenAI 红色警报计划中又一记重拳。
直接看有哪些升级:指令执行更准确、编辑更精确、细节保留更完整、比之前快 4 倍。
其中,GPT-Image-1.5 最大的升级点在于「精准编辑」,光线、构图、人物特征,在输入、输出和后续编辑的闭环都能保持一致性。
相比初版图像模型,GPT-Image-1.5 更擅长遵循复杂、细致的指令,能保持各元素之间的预设关系。文本渲染能力也进一步提升,能更好地处理密集、小字体内容。
而博主 @Yuchenj_UW 表示,其虽然认为 GPT-Image-1.5 的生成效果大致达到了 Nano Banana Pro 的「专业级」水准,但「智商/推理能力」明显落后于 Nano Banana Pro,尤其在数学题上(以及其他物理/迷宫类问题)表现更差。
OpenAI 应用 CEO Fidji Simo 在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」
她透露,ChatGPT 正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中的重要一步。
OpenAI 计划还不止于此。未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。比如未来在进行搜索查询时,结果将更多地包含图片和清晰来源。
🔗 相关阅读:刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测


近期,据我们观察发现,小米商城对小米/红米平板进行了价格调整,涉及小米平板 8 系列、REDMI Pad Pro 等多款产品:
作为参考,各产品上市价如下:

无独有偶,荣耀平板与 IOT 产品领域总经理「利用哥」昨天转发上述内容并表示,因内存涨价「实在扛不住」,因此荣耀的平板涨价也即将到来,其还建议需要购买平板的用户赶快入手。
今年 11 月,已有多家内存厂商将自家的内存芯片价格进行上调。
据此前报道,由于存储芯片价格持续飙升,多家手机厂商已暂缓采购;更早前,闪迪也已通知客户,因供应紧张,NAND 闪存合约价上调 50%,并在同月的财报电话会议中称,当前存储芯片短缺局面预计将至少持续到 2026 年底。
小米创始人雷军也曾在 10 月表示,内存涨价实在太多,希望大家能够理解。
🔗 相关阅读:买内存送电脑的时代来了,但你可能连内存都买不起了

据 The Verge 报道,昨天,韦伯斯特词典(韦氏词典)公布 2025 年年度词为「slop」(AI 垃圾),义为「由 AI 大量生产的低质量数字内容」。
「AI slop」的字面意思为「泥浆」或「污水」,不仅在语音上带有「不想触碰的湿滑感」,也成为对人工智能替代人类创造力的讽刺与警示。
过去一年,主流平台对 AI 内容的态度出现分化:YouTube、维基百科、Spotify 与 Pinterest 加强防范措施,试图阻止低质生成内容的扩散;而 Meta 与 OpenAI 则积极推出 AI 短视频应用,鼓励用户生产和分享此类内容。
此前,迪士尼更是与 OpenAI 达成合作,计划在 Disney+ 引入由 Sora 生成的短视频,并斥资 10 亿美元入股 OpenAI。这些举措使「AI 垃圾」的现实感更为凸显。
与此同时,Sora 的社交化扩张带来大量怀旧主题与深度伪造(Deep Fake)视频,用户通过重复模板制造流量,却缺乏原创性与语境理解。
这类「爆量但低质」的内容形态成为平台规模增长的工具,也加剧了公众对 AI 内容的信任危机。
尽管 Sora 宣称所有视频带有「AI 生成」信号,但在实际使用中,水印并不明显,甚至有绕过水印下载原视频的「对策」,进一步引发误导风险。

企查查信息显示,昨天,华为终端有限公司发生工商变更,原董事长郭平卸任,由余承东接任董事长一职;多位高管职务同步调整。
新任董事会成员共 7 人,包括董事长余承东、董事徐直军、胡厚崑、经理余承东、赵明路,以及监事魏承敏;工商变更记录显示,孟晚舟、徐直军、胡厚崑等不再担任终端公司董事,法定代表人由赵明路变更为魏承敏。
今年 4 月 30 日,华为内部文件显示余承东卸任终端 BG CEO,转任终端 BG 董事长;何刚接任 CEO。华为官网在 5 月 10 日更新管理层信息,余承东的职务确认为华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长。
公开资料显示,余承东出生于 1969 年,1993 年加入华为,曾任 3G 产品总监、无线产品行销副总裁、无线产品线总裁、欧洲片区总裁、战略与 Marketing 总裁、终端 BG CEO、智能汽车解决方案 BU 董事长等职。
今年 10 月 26 日,华为官网更新显示其增任产品投资委员会(IRB)主任职务,IRB 为华为产品投资决策最高机构,负责公司级资源分配、跨业务协同与长期战略规划。

据 MacRumors 报道,苹果一台运行早期构建的 iOS 26 的原型机软件遭泄露,带出了大量未发布设备与功能标记。
该系统版本号为 23A5234w,早于首个开发者测试版 23A5260n,且在内部仍被标注为「iOS 19」。
消息源称,原型机被转售后,购买者分享了其中的软件,由此披露了设备代号与功能开关的列表。泄露清单涵盖多条产品线,多达数十款产品和芯片:
此次列表中,多款设备与内部代号此前曾在意外更新或彭博社记者 Mark Gurman 的报道中出现过;这次原型机软件的曝光为其「正在开发」提供了更直接的技术性佐证。
需要强调的是,泄露代码不包含具体的发布时间规划,但从清单归纳的节奏看,AirTag 2、部分 iPad 与家居中枢被认为更可能在 2026 年较早时间段亮相,其他机型则可能在 2026 年末及其后陆续推进。
对于手机产品,值得关注的是可折叠 iPhone 的存在已被代号「V68」明确记录,属苹果在折叠形态上的关键进展;而 iPhone Air 2 的代号同样出现在泄露代码中,但其软件时间点早于苹果后续的延迟决策。

据界面新闻报道,近日,玛莎拉蒂在华对 Grecale 格雷嘉车型进行大幅降价清库存,纯电版官方指导价为 89.88 万元,降价后裸车价降至 35.88 万元,优惠幅度约 54 万元,相当于打了四折;
燃油版指导价为 65.08–103.88 万元,优惠后裸车价最低至 38.88 万元,起售价下调超 26 万元,相当于打了六折。
据第一财经转述上海经销商说法,「30 多万的 Grecale 格雷嘉卖得『飞』起来」,但浙江经视采访的销售称纯电版仅生产这一批、长期压库,后续大概率不再生产,保有量小导致维修与配件获取存在难度,北京商报亦称低配版在全国已售罄。
据悉,这批低价车为纯电版格雷嘉的 2023 款库存车,属于经销商买断包销库存,全国存量约七八十台。
销售提醒称,35 万仅为裸车价,如需达到燃油版外观与基础配置,需额外支付轮毂、内饰饰板等强制选装费用;叠加购置税与保险,最终落地价将超过 40 万。由于该配置车型后续大概率不再生产,维保与配件风险难以评估。
乘联会数据表明,玛莎拉蒂在华销量近年持续走弱:2017 年曾达 1.44 万辆巅峰,2024 年降至 1228 辆,同比下滑 71%;
今年 9 月,中国进口销量为 83 台,同比下滑 5%,今年 1 — 9 月进口销量为 1023 台,同比下滑 3%。
财报显示,2025 年三季度玛莎拉蒂全球出货量为 1800 台,同比下滑 14.3%。
同属超豪华品牌在中国市场亦普遍承压:2024 年宾利、劳斯莱斯、法拉利、兰博基尼、阿斯顿·马丁进口销量分别为 2608、789、881、608、297 辆,同比降幅 25%、40%、26%、27%、44%,迈凯伦同比下滑 83% 至 38 辆。

据界面新闻、新浪科技报道,字节跳动与中兴旗下努比亚合作的豆包手机助手及合作机型 nubia M153 已重启 F 码候补申请通道,恢复购买资格。
官方表示,此次开放为 F 码排队候补,名额较少且无扩产计划,优先面向此前未购得机型的用户。已购买、已申领 F 码未下单、取消订单或退货的用户不可重复申领,候补不承诺必然获得 F 码,后续将根据问卷情况筛选发放。
豆包手机助手本月初以技术预览版发布,基于豆包 APP 并与手机厂商在操作系统层面合作,可实现按用户自然语言需求自动进行跨应用操作(如自动比价、点外卖等)。
搭载预览版的工程样机努比亚 M153 面向开发者与爱好者少量发售,售价 3499 元,迅速售罄,发售后二手平台一度溢价约 300 元至 3500 元。
发售不久后,部分用户反馈该机型触发微信风控异常退出;网络流传其可查询银行卡余额、跳过认证等说法引发安全担忧,不少主流应用先后禁止在豆包手机上登录使用。
据此前报道,官方就网传的「从系统底层获取画面」、「可读取银行 App 等敏感信息」发文予以否认,并多次对安全性公开说明。豆包手机何去何从,仍广受业界关注。
🔗 相关阅读:剿杀豆包手机助手,可能是互联网大厂的一次「共谋」

据 The Information 报道,Shopify 高管 Glen Coates 已宣布加入 OpenAI 出任应用平台负责人;同时,Google 资深企业发展高管 Albert Lee 将于 1 月赴任,负责公司层面的收购与战略投资。
OpenAI 近来推动将 ChatGPT 打造成用户与第三方应用交互的默认入口,已与美国零售商 Instacart、Target 等达成早期合作;负责 ChatGPT 的产品负责人 Nick Turley 正在优先推进更强的个性化能力,部分通过与其他应用的连接实现。
Coates 在当地时间周一通过 LinkedIn 表示加入 OpenAI。他在 Shopify 任职约 6 年,曾主导电商核心软件的产品开发,并带队推进商家商品信息与 AI 应用和智能体的对接,他于今年夏天离开 Shopify。
另一方面,OpenAI 聘用长期在 Google 从事企业发展的 Albert Lee 出任企业发展负责人,负责并购与战略投资。
Lee 曾负责 Google Cloud 与 DeepMind 的企业发展,参与促成 Google 以 54 亿 美元收购网络安全公司 Mandiant,以及以 26 亿 美元收购数据分析公司 Looker;他将于 1 月入职并向首席财务官 Sarah Friar 汇报。
此前,OpenAI 还从亚马逊引入 Torben Severson 出任全球业务发展负责人,侧重战略伙伴关系,而 Lee 将聚焦并购事务。

昨天,分析机构 Counterpoint Research 发表最新数据称,全球智能手机出货量在 2026 年可能下降 2.1%,主因是存储芯片短缺推高成本并挤压产能。
这与今年预计的 3.3% 增长形成明显反转,此前,Counterpoint 对 2026 年的预测为「微增 0.45%」。
**Counterpoint 预计,明年全球智能手机平均售价将上升 6.9%**,反映整机零部件总体成本上涨 10% 到 25%。
在成本端承压与供应受限的双重作用下,厂商可能通过抬高售价与优化产品结构来对冲利润压力,同时调整产能与机型节奏以适应供给约束。

据《福布斯》报道,埃隆 · 马斯克的个人财富已突破 6770 亿美元,成为全球首位净资产超过 6000 亿美元的富豪,这主要得益于 SpaceX 最新股份回购要约带来的估值提升,以及特斯拉股价的持续上涨。
报道指出,SpaceX 当前估值约为 8000 亿美元,马斯克持有约 42% 股权,仅此一项资产便为其新增约 1680 亿美元财富,总股权价值达到约 3360 亿美元,已超越特斯拉成为其最重要的资产。
同时,特斯拉股价年内累计上涨约 13%,在近期因马斯克宣布测试无安全员 robotaxi 而一度上涨近 4%,其约 12% 的持股也为财富增长提供了支撑。
此外,马斯克的人工智能公司 xAI 正洽谈以 2300 亿美元估值融资 150 亿美元,特斯拉股东在 11 月批准的 1 万亿美元薪酬计划亦可能成为未来财富增长的另一推动力。
《福布斯》强调,马斯克的财富结构正在发生变化,SpaceX 已取代特斯拉成为其最核心的资产,而特斯拉绩效期权因司法判决暂按折价计算,仍待最高法院裁决。

据第一财经报道,小鹏汽车已在广州市获得 L3 级自动驾驶道路测试牌照,并启动常态化 L3 路测,测试场景主要面向广州市智能网联汽车测试高快速路上的「有条件自动驾驶」场景。
此前,小鹏在 2025 年科技日上发布具备 L4 级能力的第二代 VLA,软件预计将在 2026 年一季度量产上车;同时,小鹏计划在 2026 年推出量产的软硬件均达到 L4 级自动驾驶水平的车型。

据界面新闻报道,昨天,德加能源宣布电池系列产品目录价上调 15%,公司称主要因锂电池原材料价格大幅上涨推高生产成本。公司强调,涨价旨在保障长期稳定供应与产品品质,并未披露涉及的具体产品范围与型号。
研究机构与分析人士认为,涨价反映电池产业链在整体超预期下出现拐点。
上游的碳酸锂、高端磷酸铁锂、负极、湿法隔膜、电解液、铜箔等环节普遍存在涨价预期,年底价格谈判成为落点;储能与商用车的超预期发展使下半年全产业链处于「满产满销」,关键材料供应趋紧。新能源汽车购置税减免政策的退坡引发「末班车」效应,四季度需求集中释放,同样推升上游价格与下游成本。
原材料价格方面,碳酸锂价格近期已回到每吨 10 万元的关键位附近,较年内低点上涨约六成,给下游成本带来直接压力;动力型磷酸铁锂在 12 月 5 日报 4.01 万元/吨,季度涨幅 14.25%。
负极材料、湿法隔膜、电解液等亦在供需与成本传导下不同程度走高,业内一度出现储能电池「缺芯潮」。
鑫椤资讯高级研究员张金惠表示,材料厂商已对中小客户启动涨价,部分紧张材料开始「挑选客户」;按锂电行业议价机制,明年一季度将进入价格调整更为明确与普遍的时期,锂电池行业或迎来全面价格上调。
公开资料显示,德加能源成立于 2022 年,聚焦高性能固态电池与核心材料的研发与生产,产品应用覆盖动力、智能消费、储能、智能机器人、低空经济等;
公司拥有万吨级固态电解质生产基地、GWh 级固态电池生产基地及系统集成基地,固态电池产品已于 2025 年量产并实现商业化应用。但其并未说明量产产品为全固态或半固态。

据 MacRumors 和 InsideEVs 报道,通用汽车(GM)在逐步淘汰 CarPlay 的同时,开始为部分 2025 年及更新的凯迪拉克与雪佛兰车型内置 Apple Music 应用。
通用汽车表示,原生 Apple Music 应用将与车载系统深度集成,用户进入车辆即可开始播放;在支持的凯迪拉克车型中可使用搭载 Dolby Atmos 的空间音频。
音频流服务将作为 OnStar Basics 功能在美国与加拿大的 2026 年及更新车型中提供,前 8 年免流量费用,之后将收取费用。
通用汽车副总裁 Tim Twerdahl 称此举「充分利用我们行业领先的音频能力」,并将在后续扩展至更多品牌与车型。
目前,已支持的车型包括凯迪拉克 2025/2026 款 CT5、2025 款 Escalade IQ、2026 款 Vistiq;雪佛兰 2025/2026 款 Blazer EV、Equinox EV、Silverado EV,以及 2026 款 Corvette、Suburban、Tahoe。
此前,通用汽车在美国市场的 2024 年及更新电动车型中取消了 CarPlay 与 Android Auto,并计划将所有车型迁移至自研平台。CEO Mary Barra 曾表示,车机与手机投屏界面的切换并不「无缝」,在某些情况下甚至可能造成分心。

蚂蚁集团旗下 AI 健康应用「蚂蚁阿福」在近日发布新版本后下载量迅速攀升,今天已冲上苹果应用总榜第三位。该应用月活用户规模已超过 1500 万,每天回答用户超过 500 万个健康提问。
QuestMobile 三季度报告显示,「蚂蚁阿福」的月活复合增长率高达 83%,远超行业平均增速 13.5%,显示出强劲的增长势头。

昨天,拓竹科技宣布设立「Let’s Make It」创造基金,为全球创客提供长期资金、技术和资源支持。单个项目最高可获 100 万人民币资助,独立个人还是小型工作室均可申请。
拓竹表示,许多改变世界的构想往往因资源不足而止步于想象,而该基金旨在帮助创客跨越资源壁垒,将「敢想」转化为「敢造」。相比业内常见的「万元级」奖励,「Let’s Make It」创造基金提供的是真金白银的长期支持。
拓竹相关负责人指出,最高 100 万元的资助足以让创客全职投入 2-3 年,或组建一个由机械、电子、软件三名资深工程师组成的小型工作室,全职攻坚一年,这一规模与许多国内外硬件公司的启动资金相当。
该基金长期有效,不设截止日期。申请者可通过拓竹官网提交提案,支持同一申请者提交多个项目。评审委员会将依据三个核心标准进行评估:
此前,拓竹已多次支持公益和教育项目。例如为「爱无疆」社区康复团队提供设备,帮助残障人士打印定制辅具;响应「灵掌计划」,协助公益团队以低成本 3D 打印义肢;并支持吉林大学车队在 2025 年中国大学生电动方程式大赛中夺冠,利用 3D 打印制造赛车部件。
拓竹成立于 2020 年深圳,2022 年推出的 X1 系列 3D 打印机在多色、智能、高速高精度方面实现突破,推动市场增长,使中国 3D 打印机出口在 2023 年同比增长近 90%。
五年间,拓竹已发展为全球领先的消费级 3D 打印机公司,连续三年桌面级设备销量第一。

据《中国企业家》杂志报道,百胜中国 CEO 屈翠容在接受采访时强调,企业经营必须以盈利为核心,她直言:「我们不可能去烧钱,我也不喜欢烧钱」。
当被问到肯德基孵化的「肯悦咖啡」品牌单价低至 6 元时,屈翠容回应:「(6 元的价格)我们还真能赚到钱,放心」。
她进一步解释称,依托「肩并肩」的门店布局策略,肯德基与肯悦共享后端资源,降低人力与租金成本,从而确保盈利空间。同时,肯悦咖啡通过调整产品结构,例如推出气泡咖啡以减少奶制品成本,进一步提升利润率。
数据显示,今年 6 月,肯悦咖啡一半的饮品销售来自气泡咖啡,市场接受度良好,价格区间稳定在 9 ~ 10 元之间,确保了盈利能力。
百胜中国在「RGM3.0」战略中强调韧性(Resilience)、增长(Growth)、护城河(Moat)三目标并行,提出到 2028 年门店总数超过 2.5 万家、2030 年突破 3 万家,并预计未来三年系统销售额实现中至高单位数年均复合增长、经营利润实现高单位数年均复合增长,2028 年经营利润率不低于 11.5%。
对于外卖补贴战,屈翠容称公司以「算账」为先,不参与不赚钱的补贴,针对饮料品类在成长期与平台补贴更有利时选择性参与,同时以长期合作约定锁定更优条件。
受此影响,公司在补贴波动中销售与利润仍保持上升,并提前为补贴退出做了预案,目标是同时兼顾销售、利润与短长期「稳」。


刚刚,小米正式发布并开源新模型 MiMo-V2-Flash,先看表现:
MiMo-V2-Flash 总参数 3090 亿,活跃参数 150 亿,采用专家混合架构 (MoE),性能还能和 DeepSeek-V3.2、Kimi-K2 这些头部开源模型掰掰手腕。
🔗 相关阅读:小米突然发布新模型:媲美 DeepSeek-V3.2,把手机的性价比卷到 AI
除去「开源」这一标签,MiMo-V2-Flash 真正的杀手锏在于架构设计上的激进创新,把推理速度拉到了 150 tokens/秒,成本压到了每百万 token 输入 0.1 美元、输出 0.3 美元,主打一个超绝性价比。
基准测试成绩显示,AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中,MiMo-V2-Flash 都排在开源模型前两名。编程能力更是亮眼,SWE-bench Verified 得分 73.4%,超越所有开源模型,直逼 GPT-5-High。
转看智能体任务,MiMo-V2-Flash 在τ²-Bench 分类得分中,通信类 95.3 分,零售类 79.5 分,航空类 66.0 分,BrowseComp 搜索代理得分 45.4,启用上下文管理后直接飙到 58.3。
这些数据说明,MiMo-V2-Flash 不仅会写代码,还能真正理解复杂任务逻辑,执行多轮智能体交互。
值得一提的是,小米本次采用了混合滑动窗口注意力机制——采用了 5 比 1 的激进比例,5 层滑动窗口注意力搭配 1 层全局注意力交替使用,滑动窗口只看 128 个 token。
对此,罗福莉在社交平台上特别指出一个反直觉的发现:窗口大小 128 是「最佳甜点值」。其还表示,MiMo-V2-Flash 只是小米 AGI 路线图上的第二步。
此外 ,根据官方体验页面信息,MiMo-V2-Flash 还支持深度思考和联网搜索功能,既能对话聊天,也能在需要实时数据、最新动态或资料核对的场景里派上用场。
此外,MiMo-V2-Flash 采用 MIT 开源协议,基础版权重也已经在 Hugging Face 上发布。
Xiaomi MiMo AI Studio 体验地址:http://aistudio.xiaomimimo.com
HuggingFace 模型地址:http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技术报道地址:http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

昨天,飞书 aily 工作助手上线全新任务模式,定位为可自主执行复杂、多步骤任务的智能体,支持定时任务、跨模块联动与企业自定义 MCP 接入,旨在提升团队协作与内容生产效率。
在任务模式下,用户可将多步骤、高要求的工作任务直接指派给 aily 工作助手,其将自主思考与执行,用户只需等待消息并验收成果。
官方示例显示,该助手可进行数据库查询与结果汇总、跨表关联分析,并将结论写入企业知识库;同时支持设置定时任务,例如每日 17:43 自动生成销售业绩汇总、追踪竞品或撰写周报,从而减少重复性事务。
功能联动方面,aily 工作助手与飞书的云文档、任务、日程、多维表格等模块无缝整合,并可接入企业自定义 MCP,使其天然理解企业知识与工作进展。其产出直接沉淀在既有工作流中,无需下载或复制,用户可一键分发与协同编辑,提升跨团队协作的时效与一致性。

阿里巴巴于昨天正式发布新一代通义万相 2.6 系列视频生成模型。该系列面向专业影视制作和图像创作场景进行了全面升级,同时具备音画同步、角色扮演、多镜头生成及声音驱动等能力,官方称之为目前「全球功能最全」的视频生成模型。
此次发布的万相 2.6 在画质、音效、指令遵循等方面进一步提升,单次视频时长达到国内最高的 15 秒,并新增角色扮演和分镜控制功能。
用户不仅能一键生成单人、多人、人与物合拍的视频,还能自动完成多镜头切换,满足影视级场景需求。
据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,提取主体情绪、姿态、视觉特征以及音色、语速等声学特征,在生成阶段保持画面与声音的一致性。
此外,万相 2.6 能将提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并保持主体与场景的一致性。在分镜控制上,模型通过高层语义理解构建完整故事线,实现多镜头丝滑切换,确保节奏与氛围统一。
目前,所有用户可在万相官网直接体验万相 2.6,企业用户可通过阿里云百炼调用模型 API。此外,阿里千问 APP 同步上线万相 2.6,向所有用户免费开放。


星巴克星享俱乐部会员体系迎来全新升级,每月 17 日将成为会员专属的「一起开星日」。在这一天,会员不仅能够更快积累好礼星星,还能通过多样化的兑换玩法提升星星的价值,进一步丰富「星式生活」体验。
星巴克在「一起开星日」推出了「开星膨胀」与「开星合拍」两大新玩法。前者为会员提供随机倍数的星星膨胀奖励,在指定渠道消费时最高可达 100 倍;后者则通过线下互动增强社交体验,会员在门店与亲友合拍照片即可享受买 3 赠 1的优惠。
星巴克同步上线「开星市集」与「开星竞拍」。会员星星可用于兑换饮品、食品,还能在「开星市集」兑换环保家居系列好物及跨界权益,如希尔顿荣誉客会积分、爱奇艺星钻 VIP 卡、机场接送机服务等。
「开星竞拍」则提供更具稀缺性的收藏礼品,本月包括希尔顿全球房晚礼券、VIP 包厢票及联名熊店长公仔套票礼盒。
星巴克表示,去年会员体系升级后,其「星朋友圈」生态持续扩展,合作伙伴涵盖希尔顿、中国东航等。截至 11 月,星巴克中国会员规模已突破 1.6 亿,其中 90 天活跃会员达 2500 万,成为全球最活跃、增长最快的会员体系之一。

近日,运动生活方式品牌 lululemon 在冬季礼物季推出多款新品系列,涵盖 Steady State™、Brushed Softstreme™、Plush Velour 以及 Smooth Spacer 等冬季面料版本,主打舒适与保暖体验。
新品覆盖男女装,强调轻盈剪裁与高蓬松度鹅绒填充,意在满足节日期间的礼赠与日常穿搭需求。
lululemon 表示,消费者可在品牌线下门店及官方旗舰店选购上述新品。随着岁末礼物季的到来,品牌希望通过多样化的面料与设计,传递「温暖心意」的节日氛围。

据新华社报道,海南自由贸易港将于明天正式启动全岛封关。这一举措标志着海南自贸港建设进入实质性阶段,相关税收与监管政策同步落地实施。
此前海南省政府发布的相关通告明确,自封关启动之日起,海南自贸港将全面实施「一线放开、二线管住、岛内自由」的监管模式:
同时,免税、低税率、简税制等制度优势将进一步释放,涵盖进口商品目录、加工增值免税政策以及禁止、限制清单等方面。


昨天,迪士尼宣布《疯狂动物城 2》中国内地延长放映至 2026 年 1 月 25 日,密钥延期约 1 个月,覆盖元旦、寒假与农历马年春节前夕的黄金档期。
截至昨天宣布延长放映时,中国大陆上映 21 天累计票房达 35.74 亿元,刷新中国影史进口动画片票房冠军、进口片单日票房冠军等纪录,中国内地已成为该片全球最大票仓。
该片上映 17 天全球票房即破 10 亿美元,创下影史最快破 10 亿美元的 PG 级影片纪录。片方同步释出导演拜恩·霍华德手绘「马年贺图」,以朱迪、尼克与「马市长」呼应农历马年主题。

影片《极限审判》已于昨天正式定档 1 月 23 日全国上映。影片由《奥本海默》制片人操盘,题材聚焦近未来「AI 法庭」的生死博弈。
故事设定为顶级警探雷文突陷杀妻疑云,被推上由其参与创建的 AI 法庭审判席;在倒计时结束前,他需反向借助 AI「天眼」系统检索监控与私密数据,以此向 AI 法官证明清白。
随着调查推进,众人「面具」逐一揭开,结局在绝境翻盘与死刑判决之间悬而未决。

近日,《八府巡按》官宣定档 1 月 16 日,并同步发布定档海报与预告片。影片以晚清关东永昌府为背景,聚焦贪腐乱象与反贪风暴。
导演将果戈理经典戏剧《钦差大臣》的叙事架构移植至晚清地方官场,以「六天六场酒局」为叙事动线,呈现官员、差役、绅商、朋党与平民的群像。
爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。
对于硬核 PC 游戏玩家,最大的冒犯不一定是对局结束后的「EZ」,而是在讨论游戏时被提问:
手机能玩吗?
这种深深阻隔在 PC 与手机间的沟壑已经存在了十多年。在欧美国家,游戏市场好歹还有主机的参与,但在主机不怎么流行的国内市场,这种隔阂形成了一条简单的鄙视链:电脑游戏就是比手机游戏强。
但隔阂并不是永固的。
无论是为了逐利的游戏开发商,还是为了让更多人玩到自己作品的独立开发者,其实都期望让游戏拓展到更多的平台,以接触到更多的玩家。
▲《动物井》(Animal Well)
这其中也包括目前 PC 上最大的游戏销售平台 Steam,以及它背后的 Valve。
实际上,Valve 的野心远不止于此。上个月刚刚发布的 Steam Machine 三件套虽然仍然以我们熟悉的「主机」形态呈现,但在它的背后,Valve 真正希望的,是让你的手机也能玩上 PC 3A。

和 Steam Deck 一样,Steam Machine 的产品形态虽然是主机,但内部运行的其实是正儿八经的 PC 硬件,与一台 Windows 电脑最主要的区别就是它的系统——基于 Arch Linux 的 SteamOS。

▲ SteamOS 3 on Arch Linux
然而 Windows 几十年积攒下来的地位也不是轻易能够动摇的,用 Linux 玩游戏的最大挑战就是游戏本身不适配。
为了解决这个问题,Valve 很早就做过努力——鼓励开发商在为 Windows 平台开发之余,再单独开发 Linux 版本。然而事实证明,期待游戏开发商为少数用户平台主动做适配,无异于期待广州下雪。

▲ 图|How-to Geek
为此,Valve 在给 Steam Deck 开发 Steam OS 时,虽然依旧坚持 Linux 道路,但采取了一种截然不同的思路:
既然开发商不主动适配,那我就开发一套足够好的兼容层,只要游戏体验不打折扣,玩家才不会在乎游戏是在 Windows 还是 Linux 上运行的。
这个「能够让 Linux 玩游戏体验看齐 Windows」的兼容层,就是 Valve 自家开发的 Proton:通过以几乎无损的方式将 Windows 游戏需要的 API「翻译」成 Linux 语言,从而让 Steam 上面已有的游戏可以在 Steam Deck 上运行。

▲ 图|Reddit
但 Valve 的计划并不止步于 Steam Deck 和 Linux。本次跟随 Steam Machine 一同发布的 Steam Frame 头显,就是另一次变革的伏笔。
虽然 Steam Frame 的主要功能是作为一个串流式的 VR 头显,但 Valve 真正在测试的,其实是它本地运行游戏的能力。

▲ 图|CNET
和上个月我们看到的 Galaxy VR 头显不同,Valve 没有选择头显常用的骁龙 AR 处理器,而是直接上了一块骁龙 8 Gen 3 ——也就是小米 14 那年使用的处理器——让 Steam Frame 不仅能串流,也能独立用 SteamOS 运行 Windows 游戏。
换句话说:从 Steam Frame 开始,Valve 不仅打通了游戏资源在 Windows 和 Linux 之间的隔阂,更是打通了 x86 平台与 ARM 之间的道路,让 ARM 设备基于 Linux 无缝跑 PC 游戏真正成为了可能。
能够让 Steam Frame 依靠骁龙 8 Gen 3 跑动 PC 游戏的,自然也是一套兼容层技术,只不过没有 Proton 那么出名,它的名字叫做 FEX。

▲ 图|GitHub
为了让 Steam 资源库中那些原本为 x86 平台 Windows 编写的游戏本地运行在 ARM 平台的 SteamOS(Linux)上,需要 Proton 和 FEX 一起发力——这也正是 Steam Frame 在做的。

这个过程可以简化理解为:
由于 Linux 主要使用的图形 API 是 OpenGL 和 Vulkan,而几乎所有为 Windows 开发的游戏都在使用微软的 DirectX 图形 API,因此 Proton 的主要工作就是把游戏中基于 DirectX 的绘制申请翻译成 Vulkan,再传输给 CPU 和 GPU 以生成画面。

▲《巫师 3》(Witcher 3)
其实类似的「翻译工具」有很多,比如 Proton 所基于的 Wine 也可以做到。但真正让 SteamDeck 作为一款低功耗掌机能够运行原生 Windows 游戏,依靠的不仅是翻译,更是高效的翻译。
而 Proton 能够做到高效翻译 DirectX 和 Vulkan,除了依靠原本 Wine 中既有的 DXVK 之外,还离不开两个由 Valve 主导开发的新标准:VKD3D-Proton,以及 Ntsync。
其中,VKD3D-Proton 的主要作用是将最新的 Direct3D 12 图形 API 翻译成 Vulkan,相当于让 SteamOS 能够运行最近几年新开发的大作,同时还能在 Linux 环境下实现光追、Reflex 和 FSR4 之类的支持,一举多得。

▲ 比如依靠 DX12,Steam Deck 现在支持 Nvidia Reflex 低延迟技术了
而 Ntsync 则堪称是 Linux 玩游戏的杀手锏级别技术,这是一个 Linux 的底层内核驱动,可以以近乎无损的方式实现 Windows NT 同步语义的原生理解——
简单来说,Ntsync 让 Linux 模拟 Windows 环境时候的 CPU 损耗降到了最低,对于那些吃 CPU 的游戏场景(比如密集的人群和植被)提升巨大。

▲《赛博朋克 2077》(Cyberpunk 2077)V 公寓楼下就非常吃 CPU
这样一来,SteamOS 借助 DXVK 翻译旧 API、借助 VKD3D-Proton 高效翻译新 API、借助 Ntsync 将 CPU 损耗降至最低,最终实现了游戏开发者无需主动适配,也能让 SteamDeck 原生跑动 Windows 游戏。
但 SteamDeck 使用的仍然是个桌面级 x86 处理器,但 Steam Frame 使用的却是 ARM 架构的移动端处理器,如何让 Windows 游戏原生在 ARM 环境下运行呢?

▲ Valve 展示的透明版 Steam Frame 原型机|PC Gamer
答案依然是模拟。但仅仅在 Proton 中将 Windows 语言翻译成 Linux 还不够,还需要借助另一个工具将 x86 指令翻译成 ARM 指令,而这个工具就是最近崭露头角的 FEX。
由于 FEX-Emu 翻译的过程更为复杂,其中还涉及到针对 CISC 和 RSIC 指令集的转换、内存顺序优化和库转译等等,因此可以简单理解为 FEX 通过即时编译(JIT)将 x86 指令转换为 ARM 指令,并且转译过程自动化程度更高,适配性和速度相比其他翻译方案都要高效许多。

▲ 借助 FEX 在瑞莎星睿 O6(ARM 平台)上运行的《战神 4》|Interfacing Linux
此外,在 FEX 与 Proton 联手运行的时候,FEX 仅仅翻译游戏本身的代码,一旦游戏调用图形 API(如 Vulkan 或 DX12),执行就会跳转到原生的 ARM 代码中。
这就意味着 FEX 模拟 x86 带来的性能损耗仅限于 CPU 部分游戏逻辑,GPU 图形渲染部分几乎是全速运行的,最终让 Steam Frame 仅靠一颗骁龙 8 Gen 3 带动 Windows 游戏成为了可能。

▲ 图|Roads to VR
有趣的是,Steam Frame 不仅能兼容 Steam 上的 Windows 游戏,同时还兼容一些 Android app——都是在基于 Arch Linux 的 SteamOS 里面实现的。用来运行 Android 软件的,实际上也是个类似的兼容层。
这背后的精妙之处在于,尽管 FEX 是一个开源项目,但 Valve 实际上从 2018 年就在默默地为这个项目提供资金和技术支持了。

▲ 图|FOSS
在 TheVerge 对于 SteamOS 架构师 Pierre-Loup Griffais 的一次专访中,他表示:
Valve 从 2016 年开始就在招募和资助开源开发者,以解决 Windows 游戏在 ARM 上运行的问题。Valve 不希望游戏开发者浪费时间去移植游戏,而是希望通过技术手段,让现有的 PC 游戏库直接兼容未来的硬件架构。
而 FEX 就是 Valve 选中的那个「技术手段」:与其让开发者费尽心思地针对不同平台开发,不如使用一套通用工具,让不同平台都能高效理解 Windows 游戏的代码。某种程度上也可以算作是一种「人因工程」了。
同样是在 TheVerge 对 Pierre-Loup Griffais 的专访中,在采访的结尾,编辑 Sean Hollister 对 Pierre-Loup Griffais 提出了一个有趣的问题:
未来会有运行 SteamOS 的手机吗?

Pierre-Loup Griffais 的回答则有些模棱两可:
我们确实通过 Steam Link 应用在手机领域做过一些尝试,但我不知道「开发本地内容」或者「为这类设备(手机)开发 SteamOS」是否会成为我们接下来的主要重心。
如果仅从回答来看,Valve 目前对于手机的定位仍然是以串流设备为主,对于开发手机端 SteamOS 甚至原生 Android 内容的兴趣不大。
但正如前面所说:在 Proton 和 FEX-Emu 的加持下,SteamOS 在事实上已经完整具备了在手机硬件上运行并承载 Windows 游戏的一切准备。
实际上,现在也已经出现了一些爱好者折腾出来的给手机刷 SteamOS 的案例,只不过由于缺乏底层支持,往往损耗巨大,用来做演示还行,要是真想跑个游戏看看,就等着带上痛苦面具吧。

▲ 图|DualShockers
实际上,作为一家成熟的商业公司,Valve 在面对全球超过 5000 亿美元的智能手机市场时,它们内部一定考虑过将 SteamOS 带到手机载体上的事情。只不过这其中的阻力大概率不是成本,也不是技术,而是一个 PC 玩家非常熟悉的家伙——
反作弊(Anti-cheat)。
事实上,不用说尚不存在的 Steam Phone,就拿 SteamDeck 来说,相当一部分不能正常运行的游戏,本质都是因为内嵌反作弊不能在 SteamOS 的 Linux 环境中运行,而非游戏代码无法翻译。
究其原因,目前的主流反作弊工具比如 BattleEye、EAC、Vanguard 等等都需要在 Windows 的核心层(Ring 0)中加载,而 Proton 作为一个「翻译工具」并不负责模拟内核,导致这些反作弊软件判定环境不安全并拒绝启动游戏。

▲ BattleEye(左)和 EAC(右)|PCGamesN
此外,负责转译 x86 与 ARM 指令的 FEX 工作原理是内存实时编译,这种动态翻译机制在反作弊软件眼里和外挂的逻辑(注入、勾挂、改指令)几乎一模一样,这种影响代码完整性的方式同样会直接触发反作弊软件的报警。
这种同时存在于权限层级不对等(Ring 0 和 Ring 3)、内核环境不受信任、检测机制与转译逻辑的矛盾,除非反作弊厂商主动退让,提供不依赖内核驱动的 Linux/ARM 版本反作弊软件,否则如果仅以目前 Valve 的模拟方案来说,将会是一个无法调和的问题。

▲ 图|Dexerto
面对这种问题,唯一的解法可能就是 Valve 利用其市场地位,推动反作弊厂商针对 Proton + FEX 环境进行特殊的白名单认证,为 Steam Machine、Steam Frame 以及 Steam Phone 做区别对待。
只不过这种方案仅限于那些愿意配合的厂商,对于坚持强内核保护的游戏(如 Riot 旗下的一大堆作品),这条路依然是走不通的。
但「有困难」并不意味着「不可能」,毕竟 Steam Phone 现在面临的问题,和曾经 SteamDeck 面临的挑战是一模一样的,既然 Valve 能够推动一部分内嵌反作弊的游戏为 SteamDeck 做出优化,那么推动为 Steam Phone 设计新的反作弊也并非不可能。

▲ 图|CNET
更何况,哪怕 Steam Phone 真的因为无法加载反作弊而错失 99% 的多人在线游戏,Steam 麾下巨大的 Windows 游戏池中依然有无数不依赖网络、不需要反作弊的佳作在等着我们。
而在这个内存越来越贵、硬盘越来越贵、显卡越来越贵,甚至 Windows 本身都越来越贵的时候,Valve 一定会尝试考虑探索 PC 之外的市场。Steam Frame 只是第一步,Steam Phone 本身一定不会很远了。
别的不说,想想未来什么时候能在我的 Steam Phone 上随时随地来一盘《边缘世界》、《VA-11 Hall-A》、《林中之夜》甚至《极乐迪斯科》,那也是很不错的体验了。

▲ 图|Steam Community
美国国家航天局(NASA),来了个另类的新局长。
当地时间 12 月 17 日,美国参议院以 67 票赞成、30 票反对的结果,正式批准 Jared Isaacman 出任 NASA 局长,结束了此前 NASA 由交通部长 Sean Duffy 临时的代管的局面。
Jared Isaacman 何许人也?一个亿万富翁企业家,一位私人飞行员,上过两次太空的业余宇航员,是 SpaceX 的金主,现在是史上最年轻的 NASA 局长。
Issacman 的生涯也颇有企业家的传奇色彩。从小,Issacman 就对计算机和技术表现浓厚兴趣,16 岁时选择辍学,进入了一家支付公司做技术支持工作,发现商业模式有不少低效之处。
同样是 16 岁那一年,Isaacman 得到了爷爷给的 1 万美元支票,在家里的地下室开创了自己的第一家公司——一家名为「United Bank Card」的初创企业,旨在改变商业支付现状,Isaacman 会亲自打电话,一个个寻找潜在的客户。
这家公司不断壮大,几经变更后,成为现在知名的端到端支付技术提供商 Shift4 Payment。

2020 年,Shift4 Payment 在纽约证券交易所上市,作为 CEO 和创始人的 Isaacman 一跃成为亿万富翁,随后几年 Shift4 不断进军新领域,例如太空业务,和 Starlink 有所合作。
除了在商业领域取得成功,Isaacman 也在飞行领域颇有建树:他拥有多款军用喷气式飞机的飞行资格,在民用和退役军用飞机上累计超过 7000 小时的飞行时间, 还在 2009 和 2011 年打破了轻型喷气机环球速度世界纪录。Isaacman 还创立了 Draken International,运营着全球最大的私营退役军用战斗机机队。
征服了蓝天后,Isaacman 的下一个目标是宇宙。
他出钱又出力,亲自领导了 SpaceX 在 2021 年的 Inspiration4 计划,实现了人类史上第一次私人太空旅行,绕地球轨道飞行三天;在 2024 年的「北极星黎明」计划,Isaacman 再次领导团队出征,达到美国登月以来人类距离地球最远距离,Isaacman 本人更是成为了第一批在太空行走的私人宇航员。

▲ 北极星黎明计划中出舱的 Isaacman
虽然主导过载人航天计划,还亲自「上天」两次,但 Isaacman 本人既非科学家出身,也没有政治背景,给人感觉更像是,一个相当富有的航空爱好者,通过不懈努力(和烧钱),跨界成为了全世界最重要的航天机构领导者,堪称「用爱发电」的最高境界。
不难看出,Isaacman 和 SpaceX 以及马斯克的关系密切,实际上他能参选 NASA 局长这件事,背后很可能也是马斯克在推动。
去年,当马斯克的盟友唐纳德 · 特朗普当选美国总统后,在 12 月就提名了 Isaacman,但今年 5 月特朗普和马斯克关系恶化,Isaacman 的提名又被撤回,上个月才重新批准。

本周三,参议员们以 67 票对 30 票的大幅票数,通过了 Isaacman 出任 NASA 局长的任命,这也是 Isaacman 政治生涯的开端。
不管是 Isaacman 的背景,还是和 SpaceX 的关系,都让人明显感觉到,这是资本选出来的航空局长。在听证会上,Isaacman 也表示,随着各国太空竞赛的进一步升温,吸引更多互相竞争的私营力量,是领先的关键。
网友纷纷担心 Isaacman 和 SpaceX 的密切联系,会使得 NASA 国家资源被马斯克个人所用,扭曲 NASA 宇宙探索的纯粹使命。

▲ 马斯克和 Isaacman
不过 Isaacman 直接否认了他与马斯克关系密切的说法:「有趣的是,在一个充满摄像头的世界里里,在餐厅、游艇等各种地方都没有我们的合照,因为根本不存在。」他表示,之前他选择和 SpaceX 合作,只是因为那是当时唯一的选择。
在上周,Isaacman 还对 SpaceX 的竞争对手、杰夫 · 贝索斯的蓝色起源公司示好,不排除未来会加大 NASA 与其的合作,这是有损马斯克利益的。

▲ 蓝色起源今年的全女私人航天计划
除此之外,他还建议 NASA 多和大学以及学术机构合作,认为未来 NASA 的角色是「科学的力量放大器」。
不管 Isaacman 和马斯克是不是一个战线,可以确定的是,这个新局长是一个不折不扣的前进派,并且有事他真上,面对当前 NASA 的困境,他雄心勃勃:
我会探索所有办法将项目送达发射台,甚至如果需要的话,我自己会资助。
曾经那些科学家和官员出身的局长很难给出这样的说辞,但对于自掏腰包让自己上太空的 Isaacman 来说,又相当合理。

目前特朗普、Isaacman 和马斯克都有同一个目标——月球。
Isaacman 在参选的听证会上强调了对总统登月计划的赞同;马斯克在上个月也宣布 SpaceX 接下来将大力聚焦登月;NASA 的「阿耳忒弥斯」登月计划也已经在与 SpaceX 紧密合作。
月球已经成为了各国太空竞赛的必争之地,中国已经计划在 2030 年在月球建立一个可运作的永久性月球基地;特朗普也表示,希望美国建立一个永久的月球基地,以便资源开采,并作为通往火星的跳板。
目前 NASA 的登月计划已经落后,虽然对外宣称将于明年春季进行载人绕月飞行任务,但实际情况并不明朗。
因此,对于 Isaacman 任期的一个重要的考察指标,就是能不能建出 NASA 的月球分部。
过去这几个月,大家的朋友圈大概都被极其逼真的 AI 视频刷过屏,比如刀切一切、片场穿梭合影等等。它们的光影和细节如此逼真,近乎达到了「以假乱真」的地步。
而龙林、土豆人等 AI 创作者,更是靠 AI 视频火出了圈。
但当你也跃跃欲试,想要将它们转化为生产力时,断裂感便扑面而来 ——
你生成了一张绝美的产品图,想把它变成 15 秒的电商 TVC,结果 AI 给你吐出一段脸部崩坏、画质塌陷的废片;你想剪一个热门短视频,却发现需要分别生成几十个镜头,再自己去剪辑软件里对着音轨、找 BGM、调色。
目前的 AI 视频工具,大多还停留在「生成素材」的逻辑里。它们能给你一块精美的砖头,但没法直接给你盖出一栋房子。创作者依然被困在繁琐的「抽卡」和后期的修修补补中,那种「所想即所得」的快感,在复杂的商业需求面前瞬间烟消云散,该加的班一秒也没少。
同作为打工人的我,也一直在等待一个能把创意、分镜、生成、剪辑、音效统统打包,直接交付「成品」而不是「玩具」的帮手。
而 Vidu Agent 的出现,让我离这个期待更近了一步。它不再谈论参数,而是直接打出了一个极具诱惑力的口号:「你的专业视频创作伙伴」。
12 月 16 日起 Vidu Agent 已全球开放内测,用户进入 Vidu 官网(Vidu.cn)申请 Agent 内测,并加入社群即可优先获得体验权限,快去申请吧~
「效率」与「质感」,往往是一对难以调和的矛盾。
既然主打「一站式」解决方案,我们决定略过寒暄,直接将 Vidu Agent 置入对效率极其敏感的电商广告与内容营销战场,看看它所谓的「一键成片」,究竟是噱头,还是具备掀翻桌子的底气。
初见 Vidu Agent,标准的输入框、附件栏与选项按钮,并没有让我感受到特别之处。反倒是整体「紫色渐变」的风格,确实很符合我对 AI 页面的刻板印象。

先来做个香水广告试试。我生成了一个香水的图片,并要求它输出一段具有高端质感的 TVC。

此时,Vidu Agent 才真正展露锋芒 —— 它并没有急于生成视频,而是先切换至「画布创作模式」。不到一分钟,一份完成度极高的分镜脚本便呈现在眼前。
这不仅是简单的画面描述,从场景构建到镜头语言,甚至连旁白文案都已就位。这种「先脚本,后成片」的交互逻辑,不仅赋予了用户掌控感,更提供了一种与众不同的交互体验。

我回复满意后,Vidu Agent 就马不停蹄开始干活。又是不到一分钟,一段完整可用的 15 秒香水广告就出来了。
成片的质感令人印象深刻:色彩的调教、光影的流动、镜头间的衔接都显得游刃有余。更重要的是,它读懂了香水这一品类场景下的「隐性需求」,知道香水这种产品的「调调」,成功营造了高端的品牌调性。
接着,让我们来看看 SKU 极多的服装电商。为了展示服装在不同场景的特性,拍摄团队往往需要频繁转场外拍,差旅和人力成本都巨大。那 Vidu Agent 能解决这个问题吗?
我们让它来做个冲锋衣的广告。我给它一张图片,让它生成一个具有溯溪、登山、野外徒步和城市遛狗多个场景切换的短片,以展示冲锋衣的日常穿搭场景以及防水、防风、防寒、时尚等功能特性。
初版交付迅速,观感尚可。但为了测试其极限,我们决定扮演挑剔的「甲方」,对溯溪场景的细节与内搭款式提出了修改意见。

给出修改意见之后,Vidu Agent 都能根据我的需求迅速呈现新的脚本,直到我给出「满意」的答复。
「提个意见」对于人类来说习以为常,但对于 AI 可不同,它考验的是一致性能力。过去不少 AI 生成的内容都需要不停「抽卡」,就是因为做不到一致性,没法在生成的结果里继续优化,经常出现产品变形或者「相似但不一样」的尴尬。
但在使用 Vidu Agent 的过程中,我完全没有遇到这个问题。你可以基于已有的好结果继续推进,一步步在画布里落实你的各种想法,而不是因为部分的不合心意而导致全盘推倒重来,给了创作者对于过程的「精细化编辑」权利。
哪怕实在不放心,我也可以直接点击画布的脚本区域,自己上手修改,算是一个兜底。
除了服装之外,面临同样问题的产品,还有家居和小家电。为了拍摄它们在各种家庭场景里的效果,要么得自己搭建实景拍摄,要么就得靠 3D 软件渲染。无论哪种,工作量都可以预见得大。
我们就以一个斗柜和一款面包机为例,看看 Vidu Agent 如何解决这些问题。
这两条产品的视频,前后花了不过十分钟。
没有繁琐的布景和建模,只需要给几张产品图片与不足 20 字的功能、场景要求, Vidu Agent 便完成了两条高质量产品宣传视频。
广告电商从业者即使不会写任何提示词,意味着只要有产品素材,就能批量产出可以直接投放的高质量产品宣传视频。
除了真实度极高的视频,Vidu Agent 还提供了丰富的音色选择,涵盖了各类电商品类常见的声音。
像是面向孩子们的玩具车,它就会明白应充满童趣,会智能适配小男孩的声音。

除了这些之外,你还可以把脑洞开得更大一些。比如最近的巨人照和巨型产品,也可以用来一键生成创意类广告。
如果仅止步于生成脚本与视频,Vidu Agent 充其量只能算是一个合格的「效率工具」,难免陷入同质化的平庸。
但它更难能可贵的一点是,哪怕你只是一个模糊的想法,Vidu Agent 也可以为你写一个完整故事。你只需要提供故事的主人公和角色,大致描述故事的情节,它就能帮你补充完整故事,做出直接可商用的专业视频。

▲用给的素材生成一个动画短片,以小猫和狼为主角,主题为猫陷入危险,狼挺身而出救它,它们从天敌成为好朋友的故事。保持画面风格和主角的一致性。
坦白讲,面对这样一支由 AI 生成的动画短片,即便是看惯了科技内容的我,也被它传递的暖意所打动。无论是画面的光影质感,还是配音的情绪拿捏,它都交出了一份超越预期的答卷。
但真正令我感到惊喜的,是它生成的内容已经到了「理解」的层面。
它读懂了香水和口红需要优雅的推拉镜头,家电和家居产品要融入生活场景,而潮牌需要品质感的场景切换,童趣的场景需要辅以温暖的故事与口音,以展示不同产品在多元使用场景中的功能和品牌调性。
直白来说就是,它像是一位在 4A 广告公司工作多年的创意总监,明白你想要什么样的内容。
这就好比你以前做饭得自己买菜、洗菜、切菜、炒菜,而现在你只需要告诉大厨:「我想吃鸡」,大厨就会为你奉上各种口味不同的菜单,你只要再确认一遍味道,等着菜做好端上来就行了。
不难看出,Vidu Agent 将想法落地的时间大大缩短,让创作者得以从无尽的重复劳动中抽身,回归到最本质的工作—— 创造。
爆款内容的诞生,往往伴随着全网范围内的解构与效仿。但实际上,模仿也并非易事:从分镜拆解到场景复现,再到重写故事、后期剪辑,复刻爆款的隐形成本居高不下。
可比起繁琐的流程,高强度的投入与不确定的流量反馈之间,更容易让创作者产生巨大落差。精心复刻的作品,很可能会在算法的海洋中石沉大海,让辛苦投入看不见回报。
而 Vidu Agent 要做的事情,就是打破这种高风险的博弈,让爆款生产成为可批量复制的事情,同时成本降低到可以忽略不计。
同样,我们找了几个不同类型的经典案例进行「复刻」测试。
首先是最近很火的《疯狂动物城 2》。我想让朱迪飞上蓝天,于是我想到了经典的宝矿力广告,让 Vidu Agent 给我二创一个朱迪在动物城飞上蓝天,实现新梦想的短片。
实话说,这个效果真的很不错。朱迪在车上跳跃,最后登上蓝天的故事,简直像是第三季的预告片。
当然,将爆款视频的画面语言和叙事逻辑复刻到一个产品上,也不费力气。例如前不久引发大家调侃的《WE ARE M》广告,我们就能将它变得更加高大上起来 ——
而这,正是 Vidu Agent 可怕的地方:如果说「一键成片」是降低了门槛,那么 Vidu Agent 的「复刻视频」功能,算是要把门槛都拆了。
Vidu Agent 不是简单的像素拷贝,而是真的懂得「爆款内核」。它会理解视频背后的骨架,学习视频的节奏、镜头切换和情绪曲线,将这些「爆款 DNA」提取出来,迁移到你提供的产品素材上。
那些曾经需要资深剪辑师逐帧分析才能习得的运镜逻辑,现在变成了一个你随时可用的表达工具。你不再需要从0推导公式,直接填写需求,AI 自会给出最优解。
Vidu Agent 的体验,让我有一个强烈的感受:AI 视频生成,正在经历从「玩具」到「工具」的蜕变,甚至开始扮演起「合伙人」的角色。
在过去,制作一条专业的电商 TVC 或爆款短视频,需要编导、摄影、剪辑组成的团队,以天甚至周为单位来打磨各种细节。这道由技术和成本构筑的「护城河」,曾将无数中小创作者挡在门外。
这种门槛,放在 AI 创作的领域亦是如此。从最初 Stable Diffusion 时代那令人望而生畏的复杂工作流,到后来需要像写代码一样撰写一长串提示词,「专业」的门槛都一直高悬。

而 Vidu Agent 作为一站式「专业视频创作伙伴」,让普通人也获得了这种落地的能力。它不再要求你精通镜头推拉摇移的语言,电脑上复杂的非线性剪辑,也不需要你苦练复杂的 Prompt 咒语 —— 它将繁琐的执行过程压缩进了一个简单的对话框,让「一人成军」不再是一句空话。
这意味着,创作者的「试错成本」被空前拉低,可以更加专注于自己的想法和创意,以极低的成本进行高频次的内容迭代。
另外敲重点!多模态领域 Vidu 首推 Agent API,Vidu 深入场景为企业提供可端到端交付结果的 API,不再是单点原子能力!
该 API 通过多智能体深度协同技术实现,主要面向全球开发者、企业及合作伙伴,广泛适用于全球电商平台、广告代理、品牌方、MCN 机构以及内容工作室等场景。欢迎开发者和企业体验,快速在自有业务/系统中构建创作智能体!
附体验地址:
https://platform.vidu.cn/
当创作者可以不再受困于技术细节的平庸,重新聚焦于创意本身,想象的主权才能再次回归:你只需专注于故事的灵魂,至于如何呈现,Vidu Agent 自会给你答案。
昨天晚些时候,梅赛德斯-奔驰集团的首席设计官戈登·瓦格纳(Gorden Wagener)在其社交媒体上宣布,他将于 2026 年 1 月 31 日正式卸任。
在告别宣言中,瓦格纳写道:
近三十年来,我有幸塑造了梅赛德斯-奔驰的设计语言与品牌风格。我们以勇气、创造力和大胆革新,共同定义了一个时代……我在奔驰设定的所有目标均已圆满达成。未来的蓝图已然绘就,我也该为这一篇章画上句号,将接力棒满怀信心地交给继任者。

这次离职是瓦格纳主动提出并经双方协商的结果。
他的转身离开,不仅终结了自己在奔驰长达 28 年的职业生涯,更标志着这家德国豪华车企一个时代的落幕——这是一个由极度感性美学主导辉煌,却最终在电动化转型的阵痛中陷入争议的复杂时代。

将时针拨回 2008 年。
彼时, 39 岁的瓦格纳刚刚接替彼得·菲佛(Peter Pfeiffer)出任奔驰设计副总裁,他面临的是一个极其艰巨的任务:如何让一家深陷工程导向传统的百年车企,在设计上重新找回对年轻人的吸引力。
在瓦格纳之前,无论是布鲁诺·萨科(Bruno Sacco)还是彼得·菲佛,奔驰的历任设计掌门人都有着深厚的工程师背景。他们的设计服务于严谨的工程原则,线条硬朗、克制,却也难掩保守。
瓦格纳打破了这一切。作为首位拥有皇家艺术学院学位的「纯设计师」出身掌门人,他带来了更激进的审美直觉。

瓦格纳确立了名为「感性·纯粹」(Sensual Purity)的设计哲学,他主张「既打动头脑,也触动心灵」,他希望剥离此前奔驰车身上繁复的棱角与线条,转而追求雕塑般的曲面和光影流动。
我们不想再保守了,奔驰必须是感性的。你甚至不需要坐进去,第一眼就必须爱上这辆车。
在这种理念指导下,瓦格纳几乎重塑了燃油车时代奔驰的豪华定义。
2010 年代初推出的 CLS 四门轿跑车通过流畅的溜背线条与低矮姿态,彻底打破了传统三厢轿车的刻板印象。随后,A-Class(W176)、CLA 等面向年轻市场的车型延续这一语言,成功拓宽了品牌受众。

▲ 2010 款奔驰 CLS 350
而瓦格纳本人最钟爱的作品——AMG GT,更是将这种「感性」推向了极致,成为高性能与美学结合的典范。
它纯粹是情感与迷恋的产物。
2016 年,凭借卓越的战绩,瓦格纳升任首席设计官,权责扩展至迈巴赫、AMG 乃至游艇等领域。那是属于他的黄金时代,设计不再是工程的附庸,而是品牌溢价的核心引擎。

但当汽车工业的洪流开始转向电动化,瓦格纳那一套在燃油车时代无往不利的设计语言,却遭遇了滑铁卢。
在 EQS 和 EQE 两款车型中,为了追求极致的空气动力学效率,瓦格纳主导设计了独特的「弓形结构」(One-Bow)。

这种外观在风洞测试中表现完美,但在消费市场却引发了巨大的两极分化。圆润的车身轮廓被外界戏称为「鼠标」「果冻豆」,失去了奔驰长久以来引以为傲的庄重感与豪华气场。
销量是最直接的证明。作为旗舰电动轿车,EQS 未能达到早期的市场预期,甚至迫使奔驰不得不紧急推出改款,并重新审视未来的设计方向。瓦格纳本人后来也委婉地承认,这种激进的设计或许「过于超前」了。

矛盾不仅体现在外观,更体现在座舱设计的割裂上。
最近一段时间,瓦格纳对竞争对手的内饰设计频频开火,他批评奥迪的概念车内饰像「1995 年的设计」,也对宝马 iX3 的连屏设计表示不屑,直言「屏幕不是豪华」,并提出未来应回归「超模拟」(Hyper-analogue)的精致工艺。
但现实是,奔驰在他任内推出了行业内尺寸最大的 56 英寸屏幕。这种言行之间的错位,或许也折射出他和奔驰在转型期的迷茫。

▲ 奔驰 56 英寸大连屏
尽管后期饱受争议,但无人能否认戈登·瓦格纳在汽车设计史上的地位。
回望瓦格纳的 28 年生涯,从 1997 年加入时参与设计的 SLR McLaren——这款与传奇 F1 设计师 Gordon Murray 合作的超级跑车,至今仍是奔驰高性能历史上的高光之作。到 W222 S-Class 的革新和 G 级越野车的现代化重生,再到 R232 SL 的复古未来主义,他的笔触始终试图在传统与突破之间寻找微妙平衡。

▲ 奔驰 SLR McLaren
奔驰 CEO 康林松(Ola Källenius)在评价他时称:「戈登·瓦格纳用其富有远见的设计理念塑造了我们品牌的形象。」
在离任前夕,瓦格纳留下的最后一份遗产是 Vision Iconic 概念车。这款带有鲜明艺术装饰风格、拥有巨大格栅的概念车,预示了包括 2026 年纯电 C 级和 2027 年纯电 E 级在内的新一代车型设计语言。

在他离开后,接力棒将交到 41 岁的现任梅赛德斯-AMG 设计主管巴斯蒂安·鲍迪(Bastian Baudy)手中。

鲍迪毕业于普福尔茨海姆大学交通设计专业,2010 年加入奔驰。他的成名作是 2013 年为《GT 赛车 6》游戏设计的 AMG Vision Gran Turismo 概念车。那款车从 1940 年代的奔驰赛车中汲取灵感,造型夸张、肌肉感十足,展现了鲍迪对运动与力量感的极佳掌控力。

▲AMG Vision Gran Turismo
近年来,鲍迪作为 AMG 设计主管,不仅延续了性能车的激进风格,也深入参与了 EQE 和 E 级车的设计工作。
正如当年瓦格纳以「最年轻设计主管」的身份接班一样,奔驰似乎再次寄希望于年轻血液来应对日益复杂的市场审美疲劳。他不仅要继承「感性·纯粹」的遗产,更要在电动化与数字化的双重夹击下,重新定义什么是属于新世代的「奔驰式豪华」。
开源模型再次迎来一位重磅选手,就在刚刚,小米正式发布并开源新模型 MiMo-V2-Flash。
MiMo-V2-Flash 总参数 3090 亿,活跃参数 150 亿,采用专家混合架构 (MoE),性能还能和 DeepSeek-V3.2、Kimi-K2 这些头部开源模型掰掰手腕。

此外,MiMo-V2-Flash 采用 MIT 开源协议,基础版权重也已经在 Hugging Face 上发布,除了开源,新模型真正的杀手锏在于架构设计上的激进创新,把推理速度拉到了 150 tokens/秒,成本压到了每百万 token 输入 0.1 美元、输出 0.3 美元,主打一个超绝性价比。

从官方提供的页面来看,MiMo-V2-Flash 支持深度思考和联网搜索功能,这意味着它不仅能写代码、解数学题,还能实时获取最新信息。

附上AI Studio 体验地址:
http://aistudio.xiaomimimo.com
老规矩,咱们先来看看 MiMo-V2-Flash 的跑分环节。
在数学推理方面,AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中,MiMo-V2-Flash 都排在开源模型前两名。
编程能力更是亮眼,SWE-bench Verified 得分 73.4%,超越所有开源模型,直逼 GPT-5-High。做个简单科普,这个测试是让 AI 去修真实世界的软件 bug,73.4% 的成功率意味着它能搞定大部分实际编程问题。

多语言编程基准测试 SWE-Bench Multilingual 解决率 71.7%,智能体任务上,MiMo-V2-Flash 在τ²-Bench 分类得分中,通信类 95.3 分,零售类 79.5 分,航空类 66.0 分。
BrowseComp 搜索代理得分 45.4,启用上下文管理后直接飙到 58.3。
这些数据说明,MiMo-V2-Flash 不仅会写代码,还能真正理解复杂任务逻辑,执行多轮智能体交互。长文本能力也没拉胯,实测表现甚至超越了体量更大的 Kimi-K2 Thinking,证明混合滑动窗口注意力架构的长程建模能力确实强悍。

写作质量也接近顶级闭源模型,这意味着 MiMo-V2-Flash 不只是个工具,还能当个靠谱的日常助手。
MiMo-V2-Flash 最核心的创新是混合滑动窗口注意力。
传统大模型处理长文本时,全局注意力机制会导致计算量二次爆炸,存储中间结果的 KV 缓存也跟着飙升。小米这次采用了 5 比 1 的激进比例,5 层滑动窗口注意力搭配 1 层全局注意力交替使用,滑动窗口只看 128 个 token。
(考虑到有朋友不太了解 AI,简单科普一下:「token」(中文常译作「词元」)在大模型/自然语言处理里,指的是模型读入和输出文字时使用的最小计数单位。模型并不是按「一个汉字=1、一个英文单词=1」这样固定地数,而是把文本切成一段段 token 来处理。)
简单说就是,模型不用每次都看全部内容,只看最近 128 个 token,偶尔看一次全局,这样计算量和存储都能大幅下降。这种设计让 KV 缓存存储量直接减少了近 6 倍,但长文本能力却没打折扣,最长支持 256k 上下文窗口。

关键是小米还整了个「可学习的注意力汇入偏置」,其的用是让模型即使在这么激进的窗口设置下,照样能稳住长文本性能。
罗福莉在社交平台上特别强调,窗口大小 128 被证明是「最佳数值」,而 512 反而会导致性能下降。这个发现挺反直觉的,你会觉得窗口越大越好,但实际测下来 128 才是甜点。另外,sink 值(attention sink values)必不可少,绝对不要省略它们。
另一个黑科技是轻量级多 Token 预测 (MTP)。
传统模型生成文本时一次只能吐一个 token,就像打字员一个字一个字敲。MiMo-V2-Flash 通过原生集成的 MTP 模块,能并行预测多个 token,一次性猜出接下来好几个 token。
实测平均能接受 2.8 到 3.6 个 token,推理速度直接提升 2 到 2.6 倍,不仅在推理时管用,训练阶段也能加速采样,减少 GPU 空转,属于一箭双雕。

罗福莉提到,在三层 MTP 设置下,他们观察到平均接受长度超过 3,编码任务速度提升约 2.5 倍。它有效解决了小批量 On-Policy 强化学习中「长尾样本」带来的 GPU 空闲时间浪费问题。
啥叫长尾样本?就是那些特别难、特别慢的任务,拖着其他任务一起等,GPU 就在那干瞪眼。MTP 把这个问题给解了,效率直接起飞。
不过罗福莉也坦诚,这次因为时间紧迫没能把 MTP 完整集成进 RL 训练循环,但它与该流程高度契合。小米已经把三层 MTP 开源了,方便大家在自己的项目中使用与开发。
预训练阶段,新模型使用 FP8 混合精度,在 27 万亿 token 数据上完成训练,原生支持 32k 序列长度。
FP8 混合精度是一种压缩数值表示的技术,能在保持精度的同时减少显存占用和加速训练。这种训练方式在业界并不常见,需要对底层框架进行深度优化。
而在后训练阶段,小米整了个大活,提出了多教师在线策略蒸馏 (MOPD)。
传统的监督微调加强化学习管线,不仅训练不稳定,算力消耗还贼高。MOPD 的思路是让学生模型在自己的策略分布上采样,然后由多个专家教师在每个 token 位置提供密集的奖励信号。

通俗点说就是,学生模型自己写作业,老师在每个字上都给评分,不用等写完整篇才打分。这样一来,学生模型能快速从教师那里学到精髓,而且训练过程稳定得多。
最夸张的是效率提升,MOPD 只需要传统方法 1/50 的算力,就能让学生模型达到教师性能峰值。这意味着小米能用更少的资源,更快地迭代模型。
而且 MOPD 支持灵活接入新教师,学生模型成长后还能反过来当教师,形成「教与学」的闭环自我进化。今天的学生,明天的老师,后天又能教出更强的学生,套娃玩法属实有点东西。
用罗福莉的话来说,他们借鉴 Thinking Machine 的 On-Policy Distillation 方法,将多个强化学习模型进行融合,结果带来了惊人的效率提升。这为构建一个自我强化循环系统奠定了基础,学生模型可以逐步进化,最终成为更强的教师模型。

在智能体强化学习扩展上,小米 MiMo-V2-Flash 研究团队基于真实 GitHub issue 构建了超过 10 万个可验证任务,自动化流水线跑在 Kubernetes 集群上,并发能开 10000 多个 Pod,环境部署成功率 70%。
针对网页开发任务,还专门搞了个多模态验证器,通过录制视频而非静态截图来验证代码执行结果,直接减少视觉幻觉,确保功能正确。
对于开发者而言,MiMo-V2-Flash 能与 Claude Code、Cursor、Cline 等主流开发环境无缝配合,256k 的超长上下文窗口支持数百轮智能体交互与工具调用。
256k 是什么概念? 大概相当于一本中等篇幅的小说,或者几十页技术文档。这意味着开发者可以把 MiMo-V2-Flash 直接融入现有工作流,不需要额外适配,拿来就用。
小米还把所有推理代码贡献给了 SGLang,并在 LMSYS 博客分享了推理优化经验。
技术报告公开了完整模型细节,模型权重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 许可协议发布。这种全面开源的态度,在国内大厂里属实少见。
目前 MiMo-V2-Flash 已经在 API Platform 限时免费开放,开发者可以直接上手体验。

MiMo-V2-Flash 的发布,标志着小米在 AI 赛道上的全面发力。
罗福莉在社交平台上透露了更多信息,「MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。」第二步就已经这么猛了,那后面还有啥大招?想想就有点期待。
当然,小米在技术报告中也坦诚,MiMo-V2-Flash 与最强的闭源模型相比仍有差距。但他们的计划很明确,通过扩大模型规模与训练算力来缩小差距,同时继续探索更稳健、更高效的智能体架构。
MOPD 框架下教师模型与学生模型的迭代共进化,也为未来的能力提升留足了空间。
把视角拉高来看,背后是小米对整个 AI 生态的一次战略押注。手机、IoT、汽车,小米的硬件生态需要一个强大的 AI 底座,MiMo-V2-Flash 显然就是小米为全硬件生态准备的那块基石。
就像十年前小米手机用 1999 元重新定义了旗舰机的价格标准,如今 MiMo-V2-Flash 正在用 0.1 美元/百万 token 的成本、73.4% 的 SWE-Bench 得分,重新定义开源大模型的性能标准。
这一次,属于开源模型的「小米时刻」真的来了。
HuggingFace 模型地址:
http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技术报道地址:
http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf
GPT-4o 上半年带来的那波热度,不仅让奥特曼感受到了 GPU 融化的气息,也让生图、理解视觉几乎变成了所有大模型的标配卖点。
但到了今年下半年,真正刷足存在感的却是那根「香蕉」:Nano Banana。
为了抢回头把交椅,OpenAI 今天正式推出了最新图像视觉模型 GPT-Image-1.5。这也是继 GPT-5.2 之后,OpenAI 红色警报计划中又一记重拳。
省流版如下:
GPT-Image-1.5 最大的升级点在于「精准编辑」。
以前用 AI 改图,简直像碰上了一个听不懂人话的「托尼老师」,你只想修修刘海,它反手就给你剃了个光头。现在,模型终于听懂了人话。你改哪里,它就动哪里。
光线、构图、人物特征,在输入、输出和后续编辑的闭环都能保持一致性。
听起来很抽象?看看官方给出的示例。

一套连招下来,画面逻辑居然没崩。这说明 GPT-Image-1.5 不再是靠「蒙」,而是真的理解了画面结构,并完成增删改查。而能改得准、稳得住,才是现在的技术护城河。
再来看几个我实际测试的案例。
你或许看过《千里江山图》这幅传世名作,但你或许还遗漏了亿点点细节。

同理可得,谁说《百骏图》里,不能突然出现一只从现代穿越过来的网红柴犬 Kabosu。

就连马斯克和扎克伯格那场没打成的笼中决斗,在 GPT-Image-1.5 的加持下,一次性就成功把主角换成了奥特曼。脸没崩,违和感也几乎为零。

我们要一张细节丰富、逼真写实的极端仰拍照片,马斯克坐在珠江岸边单手搭着广州塔尖。为了体现巨物感,还得在他的脚边撒上微小的游船和游客。
结果,它也确实懂了什么是「比例感」。

▲提示词:一张细节丰富、逼真写实的极端仰拍照片,画面中的马斯克正在坐在珠江岸边,一只手搭在广州塔的塔尖上,为了体现巨大的体型比例,可在他的脚边加入一些微小的游船、观光游客等,2K,16:9
相比初版图像模型,GPT-Image-1.5 更擅长遵循复杂、细致的指令,能保持各元素之间的预设关系。
官方展示了一个 6×6 的网格图案例,每一行都要按指定内容布置,希腊字母、动物、物品、图标、单词,模型排列得井井有条,强迫症看了都得说声舒服。

经过实测,把线稿转成真实图片这种操作,现在也成了基操。

文本渲染能力也进一步提升,能更好地处理密集、小字体内容。比如将一段 Markdown 格式的内容呈现为自然的报纸文章布局,内容包括 GPT-5.2 发布说明、性能基准对比等,格式和数字都能保持完整准确。

这个能力听起来可能不起眼,但对于需要生成海报、宣传图、信息图表的用户来说,简直是刚需。
在 Nano Banana Pro 出现之前,生成式 AI 的文本渲染一直抽象得离谱,现在终于能看了。不过我们得泼盆冷水,GPT-Image-1.5 的英文能力确实能打,但中文表现依然是灾难现场。
我让它画个「擎天柱征服火星」的中文漫画,它能给你自创一门火星文。

亦或者让其生成一张古人在墙壁写水调歌头的图片,不仅文字错漏百出,握笔姿势还居然是拿钢笔的手法。

好在生成速度快了 4 倍,这边还在画着,那边你可以同时开几个新任务,试错成本大大降低。物体知识储备也还算在线,问它往水里加盐鸡蛋会怎样,生成的图片倒是有模有样。

▲左为原图,右为生成的图片。提示词:如果往水中加入大量盐,生成一张图片,展示鸡蛋会发生什么。
博主 @Yuchenj_UW 则认为 GPT Image 1.5 的生成效果大致达到了 Nano Banana Pro 水准,但「智商/推理能力」明显落后于 Nano Banana Pro,尤其在数学题上(以及其他物理/迷宫类问题)表现更差。

OpenAI 这次还在 ChatGPT 里专门开辟了一个图像创作入口。
网页和移动端侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词,还会定期更新。上传一次肖像,以后张张都是你,不用反复喂图。
说实话,这功能 Nano Banana 没有,但国内的生图模型早就玩烂了。 某种程度上,GPT-Image-1.5 也算是在摸着国内同行的石头过河。
刚刚,奥特曼也在社交媒体上分享了自己用 GPT-Image-1.5 生成的圣诞性感月历男模照片。

来都来了,我们也顺手给奥特曼换了几套皮肤。贴纸风、摇头娃娃风、素描风,预计今天过后,奥特曼又要成为互联网上最忙的男人。

有个细节很值得点赞,当你要求生成预设方案时,OpenAI 会公开预设的提示词。从这一点来看,OpenAI 确实 open 了。

除此之外,制作贺卡、创建专辑封面,修复老照片,拍摄专业求职照片等也都是非常实用的预设方案。比如,那张经典的鲁迅和泰戈尔的合照,经过修复后,其实效果还是挺不错。

OpenAI 应用 CEO Fidji Simo 在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」
她透露,ChatGPT 正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中的重要一步。
很多用户第一次接触 ChatGPT,都是通过文字生成图片。这种「把文字变成画面」的过程充满魔力,但 ChatGPT 的聊天界面最初并不是为此设计的。图像创作和编辑是一种完全不同的任务,需要专门的视觉空间来支持。

OpenAI 干脆给它搞了个专属入口,让图像生成有了一个更像创意工作室的环境。
计划还不止于此。
OpenAI 未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。未来在进行搜索查询时,结果将更多地包含图片和清晰来源。在单位换算或查阅体育比分等任务中,你需要的是一目了然的可视化结果,而不是一段文字描述。

甚至写作体验也在改,未来内置的写作模块让你在聊天中就能直接编辑,还能一键导出 PDF 或直接调用邮件应用发送。ChatGPT 早已不是一款单纯的语言模型,它正在变成一个真正的多模态工作台。
当然,除了普通用户,开发者也能通过 API 用上 GPT-Image-1.5。
相比 GPT-Image-1,GPT-Image-1.5 具备更强的品牌元素与关键视觉保持能力,适合电商、品牌营销等需要生成大量变体图片的场景。图像输入输出费用降低 20%,同样预算可生成更多图像。

降价+提效,这套组合拳打得还是挺实在的。
除此之外,迪士尼上周已经宣布向 OpenAI 投资 10 亿美元,并达成了合作协议。根据这项为期三年的授权协议,OpenAI 旗下的 Sora 和图像生成模型都能生成迪士尼、漫威、皮克斯和星球大战旗下角色,并计划在明年初正式上线相关功能。

内容 IP 加 AI 生成,这背后想象空间确实挺大。
更重要的是,GPT-Image-1.5 的发布,标志着图像生成工具正在从「玩具」向「工具」转变。
目前市面上大多数 AI 改图工具,一改就崩,毫无一致性可言。
GPT-Image-1.5 至少在这个方向上迈出了坚实的一步。它开始具备后期编辑能力,能像 Nano Banana Pro 一样控制细节,确保画面连贯。
在模型能力较弱的情况下,GPT-Image-1.5 通过更完善的图片生成预设方案, 以及功能设置来完成对新版 Nano Banana 的反击, 也确实是不错的选择。
专属图像创作入口、预设滤镜库等等,这些看似不起眼的产品设计, 恰恰击中了普通用户的痛点。很多人并不需要最强的模型, 他们需要的是「能快速上手、不用反复调教、生成结果八九不离十」的工具。
模型能力领先只是第一步, 如何把能力转化为好用、易用、爱用的产品,才是真正的护城河。