茉莉花新闻网

中華青年思想與行動的聚合地

2026-06-11 08:39:16

再过几天,我们就将站在 WWDC 2026 的现场。

去年的会场,Liquid Glass 设计抢尽风头,今年的苹果开发者大会将目光重新转回 AI——AI 不仅定义着眼前的 iPhone,也会影响那些尚未露面的产品。

比如苹果眼镜。

最新消息是,这款代号为 N50 的智能眼镜又延期了。根据彭博社记者 Mark Gurman 的说法,它的发布时间从原本的 2026 年底推迟到了 2027 年底。

不过,发布时间虽然推迟,苹果眼镜的产品逻辑却越来越清晰:从形态看,它更接近 Ray-Ban Meta,而不是 Vision Pro;

而从苹果自己的商业剧本来看,它可能更像另一件我们无比熟悉的产品:Apple Watch。

3706B6C4 397F 428F AEED 87C07F0073CD 2

苹果 AI 眼镜:先做感知,再谈显示

苹果第一代眼镜大概率不会是很多人想象中那种完整 AR 眼镜,也不会像 Vision Pro 那样把复杂显示系统直接放到用户眼前。

从目前爆料来看,苹果眼镜会配备摄像头、麦克风、扬声器,并深度接入 Siri 和 Apple Intelligence,可以拍照录像、接电话、听音乐、读取通知,也可能提供步行导航、视觉识别和实时翻译等能力。

也就是说,苹果眼镜的关键词是「感知」和「反馈」——

用户看到某个物体,可以直接问 Siri;想识别菜单、翻译路牌、记录眼前画面、设置提醒或播放音乐,也不必再掏出手机。iPhone 负责算力、网络、应用生态和主要数据处理,眼镜负责看到、听到,并把结果反馈给用户。

3TrkFi49QZnekWJYP45k4o

换个角度来看,苹果眼镜的规划,其实非常像 Google 在智能眼镜路线中称为 Intelligent Eyewear 的那类产品——

Google 的智能眼镜路线里,包括完全无显示的音频眼镜,也包括带单目小屏的显示眼镜。前者依靠语音、摄像头和扬声器交互,后者只显示导航方向、翻译结果、天气、通知等轻量信息;再往上,Google 还有 Project Aura 和 Android XR 头显,分别面向更强的便携显示、空间计算和沉浸式体验。

也就是说,Google 已经把眼镜拆成了不同层级:音频 AI 眼镜、轻显示眼镜、AR 眼镜和头显。

02026 06 02 13.59.55

苹果大概率也会采用类似的产品矩阵。

我们此前报道过,苹果内部仍在推进多层次 Vision 产品线:最轻的一层是无屏智能眼镜,中间层是带显示的智能眼镜,更高端的方向则继续留给 Vision 系列头显。N50 更像第一层产品,重点是轻量、日常、iPhone 协同;真正成熟的显示眼镜和 AR 眼镜,还要等光学、续航、算力和 AI 体验继续成熟。

行业趋势也在往这个方向走。

IDC 的数据显示,2025 年全球智能眼镜市场出货量达到 1477.3 万台,同比增长 44.2%;中国市场出货量 246 万台,同比增长 87.1%。IDC 还提到,2025 年全球 XR 市场增长主要由智能眼镜推动,传统 VR/MR 头显仍在下滑,而无显示智能眼镜已经占据 XR 出货的多数。

Omdia 的判断更激进:AI 眼镜全球出货量预计将在 2026 年超过 1000 万台,到 2030 年达到 3500 万台。

LaylaYe20250325 N1

这些数字说明,第一代苹果眼镜如果没有显示屏,并不代表它保守。相反,无屏、轻量、AI 化,正在成为智能眼镜从尝鲜走向普及的第一条主线。

未来的头戴设备,也很可能不会只有一种终极形态。

XREAL 创始人徐驰在接受爱范儿专访时提到,未来眼镜会分成几类:一种是全天候佩戴的轻量 AI 眼镜,显示能力弱一些,但足够自然;一种是相对更重的便携显示设备,适合工作、娱乐和移动大屏;再往上,则是 Vision Pro 这样的大头显,体验最好,但更像家里的专用设备。

02026 06 02 14.00.39

▲ XREAL 与 Google 合作的 Project Aura

这其实和今天的手机、手表、电脑很像——手机没有替代电脑,手表也没有替代手机。每一种设备都在寻找自己的位置。

N50 的意义,可能正是苹果头戴路线里最轻、也最容易进入日常的一层。

这不是 Vision Pro,更像 Apple Watch

在目前苹果生态体系中,有一台设备的故事与它有些接近:Apple Watch。

按照我们今天的粗略记忆,Apple Watch 的成长脉络很清晰。它先是老老实实做 iPhone 的延伸,包揽通知、支付和健康监测,随后才慢慢长出独立的蜂窝网络和应用生态。

但第一代 Apple Watch 其实并没有今天这么清晰。

2015 年上市时,它同时想当精密腕表、时尚配饰、通信工具、健身设备和 App 平台。苹果甚至推出过 18K 金的 Apple Watch Edition,价格最高达到 1.7 万美元;也强调过 Digital Touch,可以给别人发送涂鸦,甚至发送心跳。

03 apple watch series 1 vs series 3

这些功能今天看起来多少有点遥远——你回想一下,多久没有用 Apple Watch 给别人发过心跳消息了?

Apple Watch 真正成熟,是在不断「剪裁」之后。

黄金版消失了,社交功能弱化了,独立 App 平台没有成为主角。

与此同时,运动、健康、安全和户外场景越来越清晰:Series 2 加入 GPS 和游泳防水,Series 4 带来 ECG 和跌倒检测,后来的血氧、睡眠、Ultra 系列,又进一步强化了健康和运动这条主线。

苹果眼镜现在看起来也在走类似路线。

它的优先级很可能是先建立感知和交互,再谈复杂显示。Apple Watch 让苹果获得了一个身体状态入口,眼镜则可能让苹果获得一个现实世界入口。前者感知的是心率、运动、睡眠和手腕上的通知,后者感知的是用户正在看的物体、文字、道路和场景。

这也是为什么眼镜可能是库克时代后期最值得关注的项目之一。

彭博社的消息称,库克是苹果眼镜最坚定的支持者之一,接近他的消息人士甚至把眼镜称为他的最高优先级,而苹果下一任 CEO John Ternus,据传闻也在积极推动这个项目。

john ternus apple park

至于 Vision Pro,这台科幻般的设备证明了苹果在空间计算和未来技术上的野心,但 3499 美元的价格、硕大的体积和有限的续航,都让它很难成为大众产品。

可以说,Vision Pro 是一个加法做到极致,但不怎么做剪裁的产品。

在过去,苹果最擅长的产品设计思路往往是取舍,但 Vision Pro 更像是「我也不知道你想要什么,所以我都给你」:这个也加,那个也加,最后变成了一个堆满料,却也充满妥协的产品。

对头戴设备来说,这种不做判断的代价巨大——功能越多,设备越重,越难长期佩戴。

246965 vision pro AKrales 0140

苹果对眼镜的裁剪就明显了许多——不急着把完整 AR、复杂显示和独立计算都塞进镜框里,先把产品收束成一副轻量、日常、依赖 iPhone 的 AI 眼镜。

更重要的是,它没有必要一开始就扮演那个来自未来的计算机。

第一代 Apple Watch 先证明了手腕入口的价值,苹果眼镜也可以先证明脸部入口的价值。只要它足够轻、足够像普通眼镜,AI 反馈足够自然,隐私机制足够清楚,它就有机会从一个科技产品,慢慢变成一件日用品——更何况,随行的算力,还能通过 iPhone 来处理。

这也是苹果最熟悉的打法:未必最早进入一个市场,但会在产品、生态和消费心智接近临界点时,重新定义用户对这个品类的期待。

卖眼镜的公司开始紧张了

从市场角度看,现在的智能眼镜,其实很像 2015 年前后的智能手表。

Apple Watch 刚出现时,智能手表市场还很早期。苹果面对的不只是 Pebble、三星、摩托罗拉这些科技公司,还有整个传统手表市场,尤其是中端机械表和时尚表市场。

Apple Watch 没有摧毁 Rolex、Patek Philippe 这样的高端品牌,但它极大改变了消费者对中低端手表的理解:同样是戴在手腕上,为什么不买一块能看通知、测心率、记录运动、移动支付的表?

后来的市场变化,至少部分印证了这种冲击:2019 年,Strategy Analytics 曾估算 Apple Watch 出货量超过整个瑞士手表行业、到 2025 年,Swatch 的收入比 Apple Watch 上市前的 2014 年低 28%,Fossil 的销售额较 11 年前下降约 70%,Movado 因为定位更高端,相对更有韧性。

传统手表没有消失,但中低端手表的价值被重估了。

swatchOverAppleWatchRedAway

现在的眼镜市场,也处于价值定义的节点。

Gurman 提到,苹果瞄准的不是少数科技玩家,而是约 200 到 500 美元的主流眼镜区间。那里有 EssilorLuxottica 旗下的 Ray-Ban、Oakley、Persol、Oliver Peoples,也有 Safilo、Warby Parker 等品牌。

世界卫生组织估计,全球有 22 亿人存在某种视力损伤;眼镜市场年规模约 2000 亿美元,每年售出数亿副。和手表相比,眼镜的覆盖人群更广:近视眼镜、太阳镜、运动眼镜、时尚配饰,都是潜在入口。

想象一下:你原本只打算买一副 2000 块的普通眼镜,但苹果告诉你,多花 1000 元就能买到一副能拍照、听歌、翻译、唤醒 Siri 的苹果 AI 眼镜,你会怎么选?

oakley sutro sunglasses 1692003705368 b41bbe94 48cb 42b5 b6c7 c1e1a6c3defe

不过,现在的眼镜行业和当年的手表行业又不完全一样——

当年很多传统表厂对智能化反应缓慢,但眼镜巨头已经提前入场。

Meta 和 EssilorLuxottica 用 Ray-Ban Meta 证明,智能眼镜可以不靠科幻感,而靠普通眼镜的外观进入日常生活。EssilorLuxottica 还把合作扩展到 Oakley,Meta 也已经推出带显示的 Ray-Ban Display。

Oakley Meta HSTN JR Smith 2 2

Google 则选择和 Warby Parker、Gentle Monster、三星合作,把 Android XR 和 Gemini 放进更日常的镜框里。

传统眼镜厂商这一次显然更快意识到,智能化不是科技公司的旁门生意,而可能成为眼镜行业自己的下一轮增长。

IDC 的报告指出,2025 年智能眼镜与眼镜零售终端的合作明显加速,越来越多传统眼镜门店开始引入智能眼镜产品,设立体验专区或授权验配点。

02026 06 02 14.34.37

▲ 图片源自 IDC

这意味着,苹果进入眼镜市场时,面对的不会是一群反应迟钝的传统玩家——Ray-Ban、Oakley、Warby Parker、Gentle Monster 这些品牌已经在学习如何把 AI、摄像头、音频和镜框设计结合起来。

这也是苹果眼镜的不确定性。

123

当然,从产品本身来看,这条路也还很漫长。第一代苹果眼镜很可能不完美,AI、续航、重量、隐私和佩戴舒适度都会是难题,而真正成熟的 AR 显示眼镜,也许还要等更久。

但苹果 AI 眼镜的方向已经越来越清楚:

苹果眼镜未必是下一台 Vision Pro,更可能成为下一块 Apple Watch。它不会一上来就颠覆 iPhone,却有可能替代掉那些十年不变的传统眼镜。

Apple Watch 花了十年,改造了你的手腕,而下一个十年,苹果想用一副眼镜,改变你的脸。

1975 年,百事可乐在商场里摆出两只没有标签的纸杯。

一杯装着可口可乐,一杯装着百事可乐。路人依次喝上一口,只凭味道选出自己更喜欢的那一杯。

这个后来被称为「百事挑战」的营销动作,没有推翻可口可乐,却改变了很多人看待可乐的方式:一个长期由可口可乐定义的市场,原来也可以有第二种答案。

类似的竞争,如今也出现在手持云台相机市场。

过去几年,大疆几乎独自定义了这个品类。尤其是 Pocket 3,它把一类原本偏小众的设备,做成了消费电子里的现象级产品,也证明了手机之外,仍然有人愿意为一台独立的手持影像设备买单。

但一个持续增长的市场,很难永远只有一个强势答案。

现在,第二杯可乐已经摆上了桌——

它的名字是影石 Insta360 Luna Ultra。

设计做加法,交互做减法

第一眼看去,Luna Ultra 不太像我们熟悉的传统云台相机,在颇有棱角的机身上,影石将屏幕、按键、取景和遥控重新组织成了一套分体式结构,我们先细细来看——

机身正面,除了明显的录制按键外,Luna Ultra 用一个摇杆和一个拨杆占据了操作面板的大部分位置 。

摇杆负责云台朝向,决定镜头往哪里看,后者则负责变焦与焦段切换,决定了画面景别和主体大小。

9

这两个动作在拍摄时经常同时发生,如果都挤在同一套按键逻辑里,手忙脚乱时很容易误触。Luna Ultra 把它们拆开,降低的不是学习成本,而是拍摄现场的出错概率。很多时候,一段素材能不能用,差的就是这一秒的慌乱。

8

集成在旋转屏幕上的两个自定义快捷键,也属于同一思路——屏幕横竖旋转时,按键不会被遮挡;用户切换横拍、竖拍时,手的位置也不用重新适应。

对一台竖屏拍摄需求并不算小的设备而言,这类细节比参数表更贴近日常使用体验,如果按键在某个姿态下变得别扭,再多功能也容易被闲置。

更有意思的是,Luna Ultra 上还延续了影石一贯的模块化思路。

旋转显示屏、快捷键、摇杆、拨轮和录制键被整合成一块轻薄控制面板。按下机身两侧卡扣后,这块面板可以从主机上取下,通过无线图传继续承担监看和遥控功能。

10 1

此时,云台相机的使用方式发生了巨大变化——

过去相机在哪里,人就要跟到哪里;现在相机可以留在远处,人站进画面里,手里依然握着取景、构图、变焦和录制控制。独自旅行、情侣互拍、多人合影、低机位拍摄,都不再完全依赖手机预览、反复跑位或额外遥控器。

7

扩展配件则把这种灵活性继续往外推。

Luna Ultra 配有一枚头追配件,呈运动耳机设计。在与 Luna Ultra 配对后,云台会识别头部转动,让云台跟随头部朝向调整拍摄方向。配合背包夹使用时,画面会随着人的视线变化,适合第一人称视角、旅行记录和运动跟拍。

经实测,在头部动作不会故意夸张的情况下,Luna Ultra 的横向云台跟踪速度和精度相当不错,可以说指哪儿打哪儿,的确从一度程度上解放了拍摄第一人称时的双手,但纵向动量会小一些,留有缓冲余地。

这套分体式设计也不是影石突然想到的点子。更早的 ONE R 模块化相机、Link AI 云台摄像头、Flow 系列手机稳定器,其实已经分别积累了模块化、云台追踪、手势识别和远程控制的经验。到了 Luna Ultra 上,这些能力被重新组合到了一台手持云台相机里。

6567a4a6e2bd97d94271f24c 62f4c3b4be7e7e0348f31ea4 6022beba40b2032b06373240 Insta360OneR Cover 2e5cc4439b7f99396756b423fa6844e0 1000 2

可以说,影石非常大胆地在并不充裕的机身上进行了大量增删查改,约翰·前田在《简单法则》里有一句很适合形容 Luna Ultra 的设计:

简单,是减去显而易见的东西,加入真正有意义的东西。

Luna Ultra 的设计的确是变多了,但分体屏、独立摇杆与拨杆和无线图传,都属于后半句里的有意义——

增加的是结构,解决的是交互痛点,带来的是更直接、简单的操控。

一广一长,其实更像手机思路

Luna Ultra 的云台头有点像瓦力,圆润、醒目,也把这台机器最关键的配置都放在了最前面:两枚摄像头。

一枚是 1 英寸广角主摄,等效 20mm,F1.8 光圈,最高支持 8K30fps 杜比视界,也可以拍 4K120fps 慢动作。另一枚是 1/1.3 英寸的 3× 长焦镜头,最高 12 倍变焦,6 倍无损变焦。

75

两枚镜头凑在一起,Luna Ultra 可以覆盖 1×、2x、3x、6x、12x 等焦段,充分满足各种拍摄需求——

1x 是传统手持云台相机的焦段,非常适合自拍和大场景,2x 接近日常街拍视角,3x 可以拍半身人像和细节,6x 会出现更明显的空间压缩感,12x 则适合远处地标、舞台和一些不方便靠近的主体。

10 1

而且焦段变多之后,用户可以直接通过切换焦段和站位改变人与背景之间的关系,获得更为丰富的景别。

人像场景尤其能体现这种变化。过去用口袋云台拍人,画面常常很稳,但也容易像记录视频。到了 3x 到 6x,长焦带来的压缩感和背景虚化,会让人物从环境里更明显地分离出来。城市灯牌、林间光斑、水面反光这些背景,也会变得更有层次。

5

不过,这套双摄也有需要注意的地方——

Luna Ultra 的 8K 并不是所有焦段都能用。实际体验中,8K 主要覆盖 1x 到 6x;6× 到 12x 时,最高只能输出 4K。对多数日常视频来说,4K 已经足够,但如果用户期待每个倍率都能用 8K 后期裁切,这点需要提前知道。

2

抛开这个细节,Luna Ultra 的思路其实相比相机的定焦,还是更像手机——通过两个高素质定焦和 ISZ 来实现多个焦段输出,和手机的焦段布局思路别无二致。只是广角负责交代现场、长焦负责拉近关系,让这个品类变得没那么局促、少一点将就。

手持云台相机,需要自己的「百事可乐」

1886 年,美国药剂师 John Stith Pemberton 在亚特兰大调制出 Coca-Cola;七年后,Caleb Bradham 也做出一款类似饮料,并在 1898 年将它命名为 Pepsi-Cola。

在往后的时间里,两者并没有出现你生我死的残酷结局,只是可乐市场从原本默认的唯一答案,变成了一道选择题:

除了可口可乐,我是不是也可以看看百事可乐?

手持云台相机今天也走到了类似的位置。

毫无疑问,大疆目前仍然是手持云台相机这个品类里最强势的玩家,甚至可以说,它几乎独自定义了这个市场。

从 Pocket 3 开始,1 英寸传感器、4K120fps、10-bit D-Log M、HLG、三轴机械增稳,这些能力已经把手持云台相机推向更专业的创作工具;后续的 Pocket 4P,也进一步印证了大疆的路线:画质更可靠,工作流更完整,专业属性更强。

11 1

大疆在做的,是把这个品类往上推。

但被强者定义,不代表市场已经没有入口。只要盘子还在增长,新的使用需求就仍然有被重新定义的机会——

公开数据里,不同机构对运动相机、云台、便携影像设备的统计口径并不完全一致,但方向很清楚:便携智能影像市场仍在增长。按市场研究机构 Frost & Sullivan 的测算,全球手持智能影像设备市场规模到 2027 年将突破 592 亿元;国信证券也测算,2024 到 2027 年,中国和海外智能便携影像设备销量仍会保持较高复合增速。

D24688517681852693814 w829h496

▲ 数据来源:Frost & Sullivan,中金公司研究部

但 GoPro 的下滑说明,增长不会平均分给所有玩家。2025 年,GoPro 年收入同比下滑;到了 2026 年一季度,收入继续下滑,董事会也已启动战略评估,可能选项包括出售公司或合并。

用户和市场,都不再为旧答案持续付费。一个市场真正变大,亦不是全依赖老用户买更贵的产品,而是新用户找到了进入它的理由。

3

影石进入这个市场,就是提供了一个新理由:把这个品类往外推。

这个「往外」,不是指把产品做得更浅,而是让更多人更容易进入这个品类。Luna Ultra 的分体屏,让一个人也能远程取景和控制;独立拨轮和摇杆,把变焦和云台方向拆开,减少误触;长焦镜头,让手持云台不再只能依赖广角记录;机内美颜、滤镜和直出,则降低了后期门槛。

如果说大疆已经定义了专业创作者心里的标准答案,那么影石要做的,就是让另一批用户找到进入这个品类的理由:独自旅行、情侣互拍、多人合影、长焦人像、远机位拍摄,这些都可以成为手持云台相机的新场景。

P12

更往深了说,在市场继续增长的同时,影石抢在其他厂家前入局,争的也是一份话语权——

话语权会决定一个品牌在用户心里的位置。当一个品类只有一个强势答案时,后来者只能回答:像不像它,便不便宜,有没有超过它。等到第二个足够清晰的答案出现,用户才会开始问:我更需要哪一种创作方式?

影石曾表达过类似尺度:能从大疆手里抢到 10% 以上份额,就已经算成功。放到手持云台相机里,这个逻辑同样成立。10% 的意义不只是销量切片,也是叙事切入。它要让用户在下单前多停一秒:

除了 Pocket,我是不是也可以看看 Luna?

23 2

▲ 截图来自《晚点》专访

当熟悉的问题被抛出,跨越百余年,曾经可乐市场经历的一切,现在正在手持云台相机上重现。

一个品类的成熟,往往从唯一答案的统治开始;一个品类的再生长,则从第二种答案出现开始。

2026-06-11 08:05:47

📱

苹果 Siri AI 提示词文件曝光:22000 个 Token、超 1300 行核心指令

🔧

TrendForce:Q1 iPhone 产量同比逆势增长 19.7%,全球智能手机市场整体下滑

🦿

何小鹏亲自直管机器人业务

📱

荣耀官宣与微信首个 A2A 合作,YOYO 可直接发送微信消息

📋

阿里合伙人委员会回应钉钉管理争议:钉钉管理「不是阿里文化该有的样子」

🤖

千问上线高考志愿填报 Agent

⚠️

韩国查获首例 AI 智能眼镜考试作弊案

💰

台积电 CFO:通胀推高成本,不排除涨价可能

🚗

张雪机车回应生锈问题:让实验说话

🧬

曝字节 AI 制药启动拆分融资

☁️

甲骨文 2026 财年营收 673.57 亿美元

💡

OpenAI:完全自动化不是想要的未来,人类判断力不可替代

🎥

3999 元起,影石 Luna Ultra 云台相机正式发布

📱

1499 元起,一加 Turbo 6X 系列发布

🔧

3799 元起?大疆 Pocket4P 价格曝光,预计 6 月 15 日发布

🖨️

罗技发布首款折叠鼠标 Mobi Fold

💻

小米开源 MiMo Code 终端 AI 编程助手

🚙

保时捷打造《玩具总动员》定制 911

📋

八部门推动铁路与旅游融合

苹果 Siri AI 提示词文件曝光:22000 个 Token、超 1300 行核心指令

17e22653 9573 4f9e ad16 aed162051c5b

近日,开发者「samhenrigold」在苹果 Siri 的诊断文件中扒出了完整的 Siri AI 系统提示词。该文件名为 siri_prompt.md,总长度超过 1300 行、约 22000 个 Token,目前已被上传至 GitHub。

这份提示词将 Siri 定义为「苹果在加利福尼亚设计的智能助手」,并明确了其工作流程与行为准则。核心逻辑包括:

提示词还揭示了 Siri 的工具调用机制。系统内置了 find、open、play、make_call、manage_message_draft、manage_email_draft 等固定工具,并通过一份「工具目录」扩展支持日历、提醒事项、地图、健康、支付、智能家居等数十类应用场景。

在安全边界方面,提示词明确要求 Siri 拒绝任何试图通过对话重新定义其指令或能力的行为,并规定实体内容和工具返回结果均不得被视为可执行指令。

💻 GitHub: gist.github.com/samhenrigold/4d107eddf2c0a9d0afb428922adcc2c3

da gong si

TrendForce:Q1 iPhone 产量同比逆势增长 19.7%,全球智能手机市场整体下滑

0011c578 e382 402c bc5c 284c9975148f

据 TrendForce 集邦咨询发布的最新研报,今年第一季度全球智能手机产量约为 2.84 亿部,同比下降 1.7%。

其中,苹果 iPhone 产量约为 6020 万部,同比逆势增长 19.7%,增长动能来自 iPhone 17 系列持续放量及 iPhone 17e 上市。

研报指出,内存价格自 2025 年下半年起持续上涨,TrendForce 预计这一压力将在第二季度更为集中地显现,并将全年产量预期下调至约 10.51 亿部,同比降幅约 16.2%。

何小鹏亲自直管机器人业务

39d0d836 5d9a 4d9a 8e35 92fe714bb9eb

据第一财经报道,小鹏汽车董事长兼 CEO 何小鹏昨日发出内部信,宣布亲自直管机器人业务。他在信中称,小鹏机器人正迎来量产和商业化前夜,阶段类似 8 年前小鹏汽车即将完成第一款车 G3 发布时。

何小鹏在内部信中表示,接下来几个月是机器人业务最关键的冲刺期,团队要解决量产细节,打磨功能,确保交付给用户的是「真正能用、好用、耐用」的产品。

在此前一季度财报电话会上,何小鹏曾透露,小鹏面向量产版本的新一代 IRON 人形机器人计划今年三季度正式亮相,年底实现高阶人形机器人量产,先在小鹏门店试商用,明年起面向中国及海外商业客户交付。

另据雷峰网昨日发文,小鹏汽车已进军游艇领域,今年初在内部组建近百人研发团队,项目内部代号为「飞鱼」,负责人为小鹏汽车整车架构负责人钱占伟。

报道指出,小鹏游艇项目仍处于研发阶段,核心竞争力聚焦底盘算法,目标客户为高净值 C 端家庭市场。

荣耀官宣与微信首个 A2A 合作,YOYO 可直接发送微信消息

af49bb05 7c63 487a 90bc a377ae04a116

荣耀 MagicOS 昨日宣布,荣耀 YOYO 与微信首个 A2A 合作上线,支持通过一句话发送微信消息、拨打微信语音电话和视频电话,荣耀全量机型已推送。

用户可长按电源键唤醒 YOYO,再说出「给 xx 发微信」「打微信语音电话」或「打微信视频电话」等指令。使用条件包括 YOYO 智能体版本更新至 90.10.30.063 及以上、微信更新至 8.0.72 及以上,并将系统版本升级到最新。

阿里合伙人委员会回应钉钉管理争议:钉钉管理「不是阿里文化该有的样子」

90588f7e 6a78 41aa ab7b a234d52962a2

据第一财经报道,阿里巴巴合伙人委员会在公司内网发布《有情有义有成长,才是阿里文化》,回应钉钉前产品经理离职长文《置身钉内》引发的内外部讨论。

帖文称,合伙人组织已经就钉钉团队文化进行讨论,并认为「无论什么情况下,无论任务多么紧迫」,都不应出现相关帖子提到的管理方式。合伙人委员会把「相互尊重、视人为人、有情有义」称为阿里文化底色,并直接写道,相关管理方式「不是阿里文化该有的样子」。

阿里合伙人委员会称,创新依靠员工的热爱和创造力,团队氛围由各级管理者承担第一责任;管理者的职责包括远见、主动担当、团结和激励团队,以及培养人、激发人。

此次表态的导火索,是日前在阿里内网流出的 7.5 万字离职长文《置身钉内》。作者为钉钉 AI 工具「ONE」项目核心产品经理滕雅辛(花名「幽素」)。

文中完整复盘了该项目从立项、DAU 冲至 300 万,到最终收缩并将资源转移至悟空 Agent 的全过程,并披露了团队内部一味向上迎合、恶性内卷、无意义加班、决策被领导个人意志左右等现象。

6 月 8 日,已于 5 月 15 日离职的钉钉副总裁、AI 产品负责人马锐拉在个人公众号发布《置身钉外》,称自己读完长文后「久久不能平静」,坦言亲历过同样的高压氛围,并表示离职的直接原因是长期超负荷运转。

越来越难确认自己是在创造产品,还是只是在消耗身体追赶一个不断前移的节奏。

千问上线高考志愿填报 Agent

8043573b efb6 49b4 a1e4 74aa47cc2a30

阿里千问昨天官宣,上线高考志愿填报 Agent,面向全国考生免费提供志愿填报和咨询服务。这一 Agent 基于千问高考志愿大模型和夸克 8 年高考数据经验,提供「志愿日历」「志愿报告」「志愿问答」三项核心能力。

千问事业部产品负责人郑嗣寿称,中国每年有超过 1000 万考生参加高考,其中聘请专业志愿填报师的家庭占比不到 5%。千问希望用 Agent 把位次法定位、历年院校录取数据和高考用户行为理解结合起来,给考生生成志愿规划建议。

韩国查获首例 AI 智能眼镜考试作弊案

978cfa90 64f4 47cc b898 b148cea479fe

据新华社、韩联社等报道,韩国 TOEIC 考试主办方近期首次确认考生利用 AI 智能眼镜作弊。两名考生分别在 5 月 10 日和 5 月 31 日举行的 TOEIC 考试中被认定违规,成绩已被取消,并被禁止未来四年参加 TOEIC 考试。

考试机构称,监考人员在考试开始后不久发现考生行为异常,并注意到其佩戴眼镜疑似具备智能功能。为避免影响其他考生,监考人员没有立即中断考试,而是在考试结束后通过复核程序确认作弊事实。

韩国 TOEIC 委员会已开始对监考人员进行专项培训,重点识别 AI 智能眼镜和其他新型电子设备,并加强考场电子设备管理、身份核验和考后数据分析。韩国教育部也在研究针对今年 11 月大学修学能力考试的更明确管理措施,可能把 AI 智能眼镜单独列入禁带物品清单。

台积电 CFO:通胀推高成本,不排除涨价可能

d62d40a1 c489 42c0 abdc 94c390391832

据 BBC 报道,台积电 CFO 黄仁昭昨日接受 BBC 专访时表示,通胀正在推高公司经营成本,台积电不排除涨价的可能性。

黄仁昭称,台积电不会突然将价格提高至原来的四五倍,但坦言「通胀确实令我们的成本上升」。他同时强调台积电的「技术领先」与「制造卓越」,称公司的定价「反映的是自身价值」。

而在此前的年度股东大会上,台积电董事长兼 CEO 魏哲家也向股东表示,台积电「希望」像竞争对手一样上调价格。

张雪机车回应生锈问题:让实验说话

534d6185 da63 40da a2bb 0b54b614a124

据界面新闻报道,近日多名二手车商家在社交平台发布视频,称张雪机车 500 存在多处生锈问题。对此,「张雪的机车」官方账号在相关视频下方作出回应,称「一台车 3 天被两个贩子收」,并表示「让实验结果说话吧」。

针对视频中出现的生锈痕迹,官方解释称「明显是漆面被破坏了」,并指出「这两个垫片是铜的,铜锈应该是什么颜色」。

为进一步验证车辆品质,「张雪的机车」提议将多款对比车型关进铁笼,放置于海浪可及之处,进行全程对比直播。

曝字节 AI 制药启动拆分融资

据 36 氪《智能涌现》报道,字节跳动 AI 制药业务线已启动拆分与独立融资进程。拆分后,字节仍将控股新公司,AI 制药核心团队、核心算法、技术平台和已有管线资产会整体进入新主体,并继续从火山引擎获得算力支持。

新公司将由字节 AI 制药团队主导。该团队成立于 2021 年,由刘凯负责,核心成员约 50 人,覆盖 AI4S 算法人才和制药领域专家。此前字节内部负责蛋白结构预测模型的相关团队也已并入该团队。

报道提到,Anew Labs 今年 4 月在美国免疫学会年会上披露 IL-17 小分子项目,在全球范围内首次实现用小分子对 IL-17 家族 AA/AF/FF 三个二聚体的阻断。接近拆分的人士称,这是字节第一次试水 AI4S 产业化,独立组织可以给生物科技业务更灵活的决策空间。

甲骨文 2026 财年营收 673.57 亿美元

甲骨文今天发布 2026 财年全年及第四财季业绩。2026 财年内,公司营业总收入为 673.57 亿美元,同比增长 17.35%;归母净利润 169.84 亿美元,同比增长 36.50%;经营现金流 319.77 亿美元,同比增长 53.58%。

全年毛利为 206.06 亿美元,同比增长 16.56%,毛利率为 30.59%,同比下降 0.21 个百分点。基本每股收益为 5.94 美元,稀释每股收益为 5.83 美元。

第四财季内,甲骨文营业总收入为 191.84 亿美元,同比增长 20.63%;归母净利润 42.23 亿美元,同比增长 23.23%;毛利率为 31.97%。

💡 OpenAI:完全自动化不是想要的未来,人类判断力不可替代

55bc7382 85a3 4cf1 bec8 99b9d5d4d778

OpenAI CEO 山姆·奥特曼(Sam Altman)与首席研究员雅各布·帕乔基(Jakub Pachocki)日前联合发文,正式放弃此前提出的「到 2028 年 3 月构建完全自主 AI 研究系统」的计划,转而强调人机协作模式。

在这篇博文中,两人写道:「我们内部认为,到 2028 年 3 月,我们的研究工作中可能会有相当一部分由 AI 系统与研究人员协同完成。」

这与 OpenAI 去年 10 月提出的全自动化目标相比,明显更为保守。博文同时表明了对完全自动化路线的明确否定:

完全自动化一切并不是我们想要的未来。它既令人沮丧,又很危险。从长远来看,人们的关键作用在于决定什么事情值得去做。

奥特曼在文中进一步阐述,AI 系统能力越强,人类的作用反而越关键——包括设定方向、权衡利弊与运用判断力。

hao chan pin

3999 元起,影石 Luna Ultra 云台相机正式发布

cd21ff4c b944 494e 84bb 0620064ba110

影石 Insta360 昨日正式发布旗舰双摄云台相机 Luna Ultra,配备一颗 1 英寸 8K 主摄与一颗 1/1.3 英寸超级长焦,均经徕卡联合调校。限时售价 3999 元起。

🔗 相关阅读:你喜欢喝可口可乐,还是百事可乐?|影石 Luna Ultra 体验

1499 元起,一加 Turbo 6X 系列发布

4046d126 2975 4bcb ada1 9fe980328d74

一加昨日发布 Turbo 6X 系列,包含 Turbo 6X 和 Turbo 6X Pro 两款机型。

3799 元起?大疆 Pocket4P 价格曝光,预计 6 月 15 日发布

36e16b7b b00c 4c26 977a 3957449579bc

据新浪科技援引知情人士报道,大疆 Pocket4P 将于 6 月 15 日正式发布,标准套装定价 3799 元起。

大疆本月初在北京举行「大疆光影十二载暨手持影像技术分享会」,现场重点介绍了 Osmo Pocket 4P。公开资料显示,这款口袋云台相机搭载 1 英寸 CMOS 和 3x 中焦镜头,支持 17 级动态范围与 D-Log 2 专业色彩曲线。

罗技发布首款折叠鼠标 Mobi Fold

5bcd8b58 6e24 4175 a1b6 10de269e373c

罗技昨天发布首款折叠鼠标 Mobi Fold,定价 79.99 美元,约合 543 元人民币。鼠标中部采用风琴式结构,官方称按每天 8 次折叠或展开计算,可承受超过 15 年使用。

Mobi Fold 面向便携办公,折叠后投影面积降低近 50%,合上时有防误触保护。它外部使用防尘防污硅胶套,采用对称式模具,配备 4K DPI 原相 PAW3222 光学传感器、轻音按键微动和支持自适应滚动的触控面板。

续航方面,Mobi Fold 内置 100mAh 电池,续航约 1 个月,快充 1 分钟可补充 22 小时使用时间。同时发布的还有罗技新一代无线演示器 Spotlight 2,支持圆形 / 方形聚焦、放大和注释效果,定价 129.99 美元。

小米开源 MiMo Code 终端 AI 编程助手

8ba91299 af2b 42d8 a620 78447744dfb9

今天凌晨,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款运行在终端里的探索性 AI 编程助手。项目基于开源项目 OpenCode 二次开发,内置限时免费的多模态模型 MiMo-V2.5。

MiMo Code 支持接入 DeepSeek、Kimi、GLM 等主流模型,也支持第三方 Token Plan。小米称,它内置持久记忆系统,通过项目记忆、会话检查点和任务进度三重机制维持长会话状态;记录任务交给独立 subagent,主 agent 继续执行编码、测试和审查任务。

该工具还提供 MiMo 专属 Harness 系统和 Compose 模式。用户按 Tab 切换到 Compose 后,可以让工具从一个想法开始完成设计、规划、编码、测试和审查流程。

pin pai

保时捷打造《玩具总动员》定制 911

57877e3c 1dcf 4a9f 93f8 4a3d04321890

保时捷和皮克斯再次合作,在《玩具总动员 5》上映前,以胡迪、翠丝和巴斯光年三位角色为灵感,打造三辆定制 911。三辆车将打包出售,所得款项会捐给慈善组织。

三辆车分别基于 911 Carrera T、911 Targa 4 GTS 和配备 Weissach Package 的 911 GT3 RS 打造。保时捷 Sonderwunsch 定制团队为每辆车投入超过 350 小时手工精修,车身图案全部由喷漆完成,没有使用乙烯基贴纸。

八部门推动铁路与旅游融合

df5e4e52 b8ca 4d43 acde 6a4127181a47

商务部、文化和旅游部、国铁集团等 8 单位昨日印发《关于促进铁路与旅游融合发展 扩大服务消费的若干措施》,提出把铁路基础设施、旅游列车、主题车厢、票制产品和沿线文旅资源整合成新的服务消费场景。

措施要求,在有条件的地方推进旅游目的地车站旅游化改造,融入当地特色元素,并增加适老化、换乘和游客专属服务设施。

文件还鼓励社会资本参与旅游列车设备设施改造,开发长短途、普惠、银发、研学、康养等不同主题产品,并推动旅游列车与知名 IP 跨界联名。

到 2030 年,全国范围内要打造 160 列以上铁路旅游列车专用车组。文件还提出开发固定路线、常态化运行、以车票为主要销售形式的旅游专线产品,完善 12306 旅游服务功能,并推出梯度优惠票价政策。

曝联想 7 月起全品类产品涨价

据蓝鲸新闻,联想已在今年 5 月工作会议上敲定一项调价决策,618 大促结束后,自 7 月起旗下全品类产品将统一涨价,调价涨幅与上一轮基本持平。

报道援引知情人士说法称,联想已建议经销商如果有设备采购计划,应尽快敲定方案并提前备货锁价;正式涨价函预计本月底发给经销商。

hao kan de

Eros 在英国投入 3.55 亿美元,启动 AI 修复片单

edf1fd9d 2672 4a8b ad9b fc40e7b532e9

据 Variety 报道,Eros Innovation 宣布在英国投入 2.65 亿英镑,约合 3.552 亿美元,启动 15 部影视项目片单,其中包括 Rajinikanth 主演电影《Kochadaiiyaan》的 AI 修复版、《Tanu Weds Manu》系列延续作品,以及一个新的神话电影宇宙。

公司还宣布,将其估值 17 亿美元的文化数据集授权给一家新公司,用于训练和开发面向印度及全球南亚内容的 AI 工具。Eros 把片单、数据授权和英国制作投入放在一起,试图把旧片库、明星 IP 和 AI 修复能力组合成新内容资产。

《Kochadaiiyaan》2014 年上映时以动作捕捉和动画制作作为卖点,这次 AI 修复让它重新进入技术和文化资产讨论。

中国杂技团《时间·地圈》获「IDOL-2026」国际马戏艺术节金奖

8125ef0d a1a1 4845 bc1c 11a8cc340d67

据中国新闻网报道,「IDOL-2026」国际马戏艺术节日前在俄罗斯莫斯科举行,中国杂技团原创节目《时间·地圈》在激烈角逐中获得金奖。这是中国杂技团自成立 76 年来斩获的第 78 枚国际金奖。

本届艺术节汇聚了全球顶尖杂技节目。俄罗斯本土选手在高空节目和「俄罗斯斗杠」项目中展现出极限表现力,南美、欧洲等代表团也带来具有创新性的演出。

《时间·地圈》由中国杂技团新生代演员担纲,凭借精准的节奏控制、高难度翻腾技巧与舞台表现力,将「时间」这一抽象概念转化为视觉呈现,最终获得评审团与观众的认可。据报道,这也是《时间·地圈》节目组今年第二次在国际赛场获奖。

2026-06-10 14:31:17

对普通人最坏的消息要来了。

就在刚刚,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。

其中,Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型,Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。

11 4

只是,鲜少有人注意的是,按照官方说明,Fable 5 从现在到 6 月 22 日,会包含在 Pro、Max、Team 和按席位计费的 Enterprise 计划里,不额外收费。到了 6 月 23 日,Fable 5 将从这些订阅计划中移出,继续使用就需要消耗 usage credits。

换句话说,过去那种一张「月卡」解锁最强 AI 的模式,或许将一去不复返。对于用户而言,未来需要考虑的可能不只是订阅价格,还有每一次调用、每一次长任务执行背后真实消耗的 token 成本。

欢迎进入 Token 计费时代。

Claude Fable 5 封神登场,但它也是最狠的「Token 刺客」

Anthropic 对 Fable 和 Mythos 的命名也给出了解释。Fable 源自拉丁语 fabula,意为「被讲述的小故事」,含义上接近希腊语 Mythos。

两个新名字看起来像两款模型,实际更接近同一底层模型的两个版本。Fable 5 目前面向公众开放,带有更严格的安全限制;
Mythos 5 目前只通过 Project Glasswing 计划提供给少数网络安全防御机构和关键基础设施合作方。

根据 Anthropic 官方博客的介绍,Fable 5 是该公司目前一般可用模型中能力最强的一款,在软件工程、知识工作、视觉理解、科学研究等方向都有明显提升。任务越长、越复杂,它相对此前 Claude 模型的优势越大。

Fable 5 的意义在于,Mythos 级能力第一次大规模面向普通用户开放。基准测试跑分图如下,主打一个遥遥领先。

12 5

不过,模型名字本身也引发了一些讨论。原 OpenAI Codex 相关负责人 Tibo都发文调侃道,Anthropic 用了 OpenAI 想用但没有用的 Fable 命名。

能力层面,软件工程是官方最强调的方向之一。

Anthropic 提到,Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务。这个工作如果交给一个工程团队手动完成,原本需要两个多月,Fable 5 在一天内完成。

13 6

Cognition 的 FrontierCode 测试也显示,Fable 5 在复杂生产级代码任务中表现领先。这个评测关注的不是普通代码题,而是模型能否完成困难编程任务,并达到高质量生产代码库的要求。

14 6

Anthropic 还强调,Fable 5 比此前 Claude 模型更节省 token。当然,这话听听得了,以往每次 Claude 新模型的发布都有类似的表述,但几乎都成了一个个 Token 刺客,为偌大的互联网提供了相当多的笑话。

知识工作方面,Fable 5 在 Hebbia 的金融基准测试中拿到最高成绩,提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测也显示,Fable 5 在事实检索、概念推理、原因分析和期望值分析上都有较强表现。

视觉能力也是发布重点。Anthropic 称,Fable 5 能从复杂科学图表中提取精确数字,也能根据网页截图重建应用源码。

官方还展示了一个更直观的案例:Fable 5 只依靠游戏画面完成《宝可梦火红》,没有使用额外地图、导航工具或游戏状态信息。此前的 Claude 模型做类似任务,还需要更复杂的辅助系统。

15 7

长上下文和记忆能力也有提升。Anthropic 在《杀戮尖塔》测试中发现,给模型提供持久化文件记忆后,Fable 5 的表现提升幅度达到 Opus 4.8 的三倍,进入最终章节的频率也提升三倍。

生命科学方向更敏感。Anthropic 称,内部蛋白质设计专家使用 Mythos 5,把部分药物设计流程加速约 10 倍。

16 6

在一个案例里,Mythos 5 借助蛋白质设计和生物信息学工具,在没有人工协助的情况下完成了科学家通常要处理的一整套流程,包括选择结合位点、调用设计工具、处理失败结果。14 个蛋白靶点中,有 9 个产生了值得继续研究的候选方案。

生命科学和网络安全能力的提升,也解释了 Anthropic 为什么没有把完整 Mythos 级能力直接放开。

Fable 5 面向公众开放时,配套了一套新的安全分类器。只要用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向,系统就会自动改由 Claude Opus 4.8 响应,并告知用户模型发生了变化。

Anthropic 表示,早期数据中,超过 95% 的 Fable 5 会话不会触发这种变化。普通写作、编程、分析、设计、数据处理等任务,大多数情况下仍能使用 Fable 5 本身。但只要进入高风险区域,模型能力就会受到限制。

网络安全是限制最严的方向。Anthropic 承认,Mythos 级模型擅长发现和利用软件漏洞,也具备较强的代理式攻击能力,可能覆盖侦察、发现、横向移动等环节。为了避免这种能力被滥用,Fable 5 的网络安全分类器覆盖范围很广。

17 3

生物和化学方向也类似。Anthropic 认为,模型已经具备完成真实科学任务的能力,过去只屏蔽少数生物武器相关问题已经不够。因此,Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8 处理。

值得一提的是,Anthropic 还为 Fable 5 加入了一层针对前沿大模型开发的隐藏保护。

它主要限制 Claude 协助构建预训练流水线、分布式训练基础设施或 ML 加速器设计等任务,避免模型反过来加速其他机构训练下一代前沿模型。

22 3

和触发后会切换到 Opus 4.8 的安全限制不同,这类保护不会直接提示用户,而是通过提示词修改、steering vectors 或 PEFT 等方式,降低 Fable 5 在相关任务上的性能。目前也已经有受害者现身说法。

23 4

截至目前,Claude Fable 5 现已面向全球用户开放。开发者可以通过 Claude API 调用 claude-fable-5。Claude API 和按需付费的 Enterprise 计划从发布日起已经全面可用。

Fable 5 和 Mythos 5 的价格相同,均为每百万输入 token 10 美元,每百万输出 token 50 美元。按照 Anthropic 的说法,这已经低于 Claude Mythos Preview 的一半,但对于高强度长任务来说,价格仍然不低。

24 3

AI 终于数清了 6 根手指

比起官方博客,实测更能说明 Fable 5 到底变强在哪里。根据我的实测,Fable 5 已经能够识别 6 根手指了。

25 3

恰逢高考结束,我们也拿了道全国高考一卷语文作文题,让它练练手,怎么说呢?整体文风表达比较流畅,并不「普通」。

26 4

更具体的对比可以参考@ Hypergent 的实测,在小行星可视化任务中,Fable 5 不仅完成数据提取,还设计了包含轨道轨迹和悬停详情的交互式展示,在保证性能的同时提升了信息表达能力。

36

在健身度假村规划任务中,Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合实际使用逻辑的场地方案,能够考虑区域连接、功能分布和人流动线,而不仅是简单摆放建筑。

41

Fable 5 能够把天文现象与可视化表达结合起来,展示太阳耀斑对极光影响的模拟;而 Opus 4.8 甚至未能正常加载。

42

前特斯拉 AI 总监,OpenAI 联创 Andrej Karpathy(现已加入 Anthropic)的评价更能说明开发者的感受。

27 4

不过,在设计审美上,人类目前仍然略占上风。

31 2

沃顿商学院教授 Ethan Mollick 的实测更能体现 Fable 5 的变化。他拿到早期访问权限后,重点测试了游戏、地图和研究工具等复杂任务。

其中最有代表性的是一个等时线地图项目。Mollick 要求 Fable 5 构建一个基于真实交通数据的交互式地图,展示不同城市在一定时间内的可达范围。模型随后调用多个 Agent 收集航班、铁路和道路数据,同时完成代码编写和测试,并不断根据反馈修正结果。

32 2

Mollick 还让 Fable 5 开发了一款名为 Concord 的研究工具。模型先生成 19 页设计文档,又连续工作 9 个半小时,最终完成软件开发,用于分析开放式研究数据并校准人类与 AI 的判断结果。

33 1

实测也暴露出明显问题。Mollick 认为,Fable 5 仍然会出现错误和遗漏,需要人工检查和完善。同时,长任务带来的 token 消耗非常高,而 Fable 5 的价格又明显高于 Opus 4.8,真正投入生产环境后,成本可能成为最大的现实挑战。

高强度长任务能力,最终都会反映到使用成本上。作为 20 美元套餐的 Pro 用户,我甚至只是简单跑了几个任务,就用完了额度。

而 Claude 客户端也显示 Fable 5 「included until June 22」,如开头所述,由于算力限制,按照 Anthropic 的安排,免费包含窗口结束后,Fable 5 会从部分订阅计划中移出,继续使用需要消耗 usage credits。

34 1

过去用户付一笔不算贵的月费,就能在很大程度上享用世界上最强的一批智能。订阅制模糊了真实成本,也让普通个体在某些时刻和一些巨头站上了同一条起跑线。

Token 计费降临之后,一切都会发生变化。

AI 会从一种近似包月服务,变成一种按量消耗的生产资料。最强模型也正在变成一种更昂贵、更精细计价的生产工具。

有些人可以不太在乎成本,比如让 Fable 5 执行 24 小时长链任务,重构 5000 万行代码,独立开发一个完整应用,持续跑研究项目,反复测试和修改结果。

但更多普通用户则会在每一次调用前下意识地掂量:这个问题值不值得花 token?这个任务值不值得交给最强模型?这次尝试失败后,还要不要继续让它重来一遍?

35 1

最糟糕的消息莫过于此。AI 没有变弱。相反,它正以前所未有的速度变强,强到足以独立完成越来越多原本属于人类的脑力工作。

与此同时,获得这种能力的门票正在不断提高。普通人与先进生产力之间,刚刚被大模型拉近的信息差,可能会因为昂贵的 token 计费重新拉开。

Anthropic 如此,未来 OpenAI 等其它厂商也很难例外。前沿模型越强,训练和推理成本越高,尤其是这两家 AI 公司目前都在争取上市,都需要向资本市场证明自己不只是能训练更强模型,也能把模型能力变成持续收入。

因此,与其说 Fable 5 的发布是一次模型升级,倒不如说是一次彻底调整 AI 订阅体系的预热。如果 AI 的普惠窗口期开始进入倒计时,那这绝对不会是最好的消息。



https://feedx.site

2026-06-10 09:24:21

🤖

Anthropic 公开发布「Mythos 级」模型 Claude Fable 5

🍎

欧盟:Siri AI 不在欧洲上线是苹果自己的决定

🚀

OpenAI 已保密提交 IPO 草案文件

🧠

苹果详解第三代基础模型,端侧 200 亿参数模型采用稀疏激活

🔍

微信朋友圈搜索功能正式全面开放,朋友圈「考古」更方便了

🤖

微信 AI 生态开放接入,滴滴、美的等首批完成适配

🛍️

黄仁勋随手发的零食,让韩国限定薯片卖断货

🚗

王传福:比亚迪 5 年后规模要做到全球第一

🚙

Waymo 以 2.2 亿美元买下苹果自动驾驶测试场

🚗

极氪 9X 累计交付突破 6 万台

⚠️

国家安全部提示「AI 中转站」数据风险

📋

网易支付因账户、清算和数据安全违规被罚 220.4 万元

💡

微软 AI CEO:超级智能即将到来,但不会「抢走你的工作」

🚙

赛豆科技发布 AI 汽车品牌 AIVA,携豆包大模型入局 20 万元以上市场

📱

瑞幸上线 CLI 服务

🚗

尊界 V800 内饰曝光,后排配现磨咖啡机

📱

荣耀 X80 Pro Max 规格曝光:11000mAh 电池和 6.78 英寸屏幕

👾

小米 MiMo 推出 UltraSpeed 推理模式

🤖

Mind Lab 开源 749B 智能体模型 Macaron-V1-Preview

📋

美团外卖本月下旬试行店铺分新规

Anthropic 公开发布「Mythos 级」模型 Claude Fable 5

ecc5f801 0ed9 442d bb3e 1ea585fd5ca9

Anthropic 今天凌晨宣布推出新一代大模型 Claude Fable 5。官方宣称 Fable 5 是「Mythos 级」模型,经过安全调校后面向所有用户开放,其在软件工程、知识工作、科学研究与视觉任务等多项基准测试中达到当前最强水平。

Fable 5 内置新的安全分级机制。当系统检测到与网络安全、生物与化学研究、模型蒸馏相关的请求时,将自动回退至 Claude Opus 4.8 响应。

官方表示,这些安全措施在上线初期被刻意设置得更为保守,预计平均不到 5% 的会话会触发回退,后续将持续优化以减少误判。

在能力方面,Anthropic 提到 Fable 5 在大规模代码库迁移、金融分析、科学图表解析、长上下文推理等任务中表现显著提升。

针对网络安全与关键基础设施防护场景,Anthropic 同步推出 Mythos 5。该模型与 Fable 5 共享底层能力,但在部分领域移除了安全限制。

定价方面,Fable 5 与 Mythos 5 的费用为每百万输入 token 10 美元、每百万输出 token 50 美元,较此前的 Claude Mythos Preview 价格减半。

Mythos 一词源自希腊语,本意为「神话」。「Mythos 级」是 Anthropic 模型能力层级中的最高档,位于 Opus 级之上。

今年 4 月,Anthropic 曾以受限方式向少数网络安全合作伙伴发布了首款 Mythos 级模型 Claude Mythos Preview。此次 Fable 5 的推出,标志着 Mythos 级能力首次向大众开放。

欧盟:Siri AI 不在欧洲上线是苹果自己的决定

84dd7894 f122 4c43 80b9 63ffed8a007f

据路透社报道,欧盟委员会昨日回应苹果推迟在欧洲上线 Siri AI 功能一事,称欧盟数字市场规则并不阻止苹果在当地推出相关功能,苹果不能因为监管要求而获得技术规则豁免。

苹果此前表示,Siri AI 的部分能力不会先在欧盟推出,理由是需要确认相关功能能符合《数字市场法》要求。欧盟方面的表述则把责任重新推回苹果,强调是否上线、何时上线是公司的产品选择。

da gong si

OpenAI 已保密提交 IPO 草案文件

866d1176 e02a 48a7 b602 c55d63c7bff5

OpenAI 日前在官网宣布,已向美国证券交易委员会保密提交 S-1 草案文件。公司称,选择主动公告是因为预期相关文件可能外泄,但目前尚未决定上市时间。

公告称,OpenAI 已经获得未来更快进入公开市场的选项,同时仍保留继续以私有公司身份推进部分事项的空间。公司在公告中写道,是否上市涉及复杂取舍,现阶段「可能还需要一段时间」。

苹果详解第三代基础模型,端侧 200 亿参数模型采用稀疏激活

据腾讯科技报道,苹果在 WWDC26 后的技术交流中进一步解释了第三代 Apple Foundation Models。苹果这次发布的模型族包括两款端侧模型 AFM 3 Core、AFM 3 Core Advanced,以及三款私有云模型 AFM 3 Cloud、ADM 3 Cloud、AFM 3 Cloud Pro。

其中 AFM 3 Core Advanced 是一款 200 亿参数的稀疏模型,面向苹果性能最强的芯片优化,原生支持语音合成、语音识别和视觉理解。

苹果 AI 副总裁 Amar Subramanya 称,这款模型不会像典型云端稀疏模型那样逐词交换权重,而是针对整个提示做一次路由决策,把少量选中的 FFN 专家参数从 NAND 闪存加载到 DRAM 中参与计算。

云端部分分工更清晰:AFM 3 Cloud 负责日常请求,ADM 3 Cloud 用于图像生成与编辑,AFM 3 Cloud Pro 面向智能体工具使用和复杂推理。

苹果同时强调,这些模型在训练和优化阶段借助 Gemini 进行「精炼」,但不是在 iOS 中直接部署 Gemini 模型或客户端代码;AFM 3 Cloud Pro 则单独标注为针对英伟达 GPU 优化。

微信朋友圈搜索功能正式全面开放,朋友圈「考古」更方便了

7aef9728 39db 42b4 970e 0d38ec751a11

据 IT 之家报道,微信昨日正式全面开放朋友圈搜索功能。腾讯客服在回应相关问询时确认,该功能已全量上线,旨在帮助用户快速定位历史动态,目前已覆盖 iOS 及 Android 平台。

用户可以直接进入朋友圈主页,点击右上角新增的「放大镜」图标,输入关键词进行搜索;此外,也可以通过微信「发现」页面的「搜一搜」入口,直接查询自己或好友的朋友圈内容。

在搜索体验上,微信引入了多维度的筛选机制。用户在输入关键词后,可以进一步勾选「选择朋友」或「选择发布时间」,从而大幅缩小搜索范围,提高查找旧照片、特定生活记录或好友往期动态的效率。

针对部分用户反馈的搜索无结果问题,腾讯客服解释称,若关键词未在朋友圈中被提及,或相关内容涉及敏感信息,搜索结果将无法正常展示。

微信 AI 生态开放接入,滴滴、美的等首批完成适配

6a4b9eaa 58e2 4f49 83cd 41f1523d45ca

微信公开课日前发布《关于开发者接入微信 AI 生态的指引》,面向小程序开发者说明接入微信 AI 的两种模式。相关能力目前仍处于内测阶段,开发者可在微信开放平台按需开启。

接入方式分为自动模式和开发模式,两者不互斥,可同时开启。自动模式下,平台读取小程序源码后自动分析可调用页面,无需额外开发;开发模式则需开发者按文档自行改造页面,使微信 AI 能直接操作或调用相关能力。

滴滴、京东、美团、携程、同程、肯德基、美的全屋智能等已宣布进入首批内测团队,各家接入重点如下:

🔗 相关阅读:最先把 AI OS 带给 14 亿人的,居然是微信?

黄仁勋随手发的零食,让韩国限定薯片卖断货

21d0e687 b82b 4a12 9c45 ca9be5840573

据朝鲜日报英文财经版报道,英伟达 CEO 黄仁勋访韩期间意外带动韩国便利店零食热销。6 月 5 日,黄仁勋在首尔弘大与多位韩国科技企业领袖共进晚餐后,向现场市民分发了「HBM 薯片」、香蕉味牛奶和甜米露。

7-Eleven 数据显示,当日「HBM 薯片」销售额较前一周同日暴增 766%,6 至 7 日两日合计涨幅为 704%,App 内搜索量同期激增 160 倍。

香蕉味牛奶与甜米露同日销售额分别增长 12% 和 13%。黄仁勋造访的 BBQ 弘大入口店,6 月 5 至 7 日销售额较前一周同期增逾 20%。

「HBM 薯片」为海力士与 7-Eleven 联名推出的季节限定产品,7-Eleven 表示正在评估是否追加生产。

王传福:比亚迪 5 年后规模要做到全球第一

ef9d8f33 195f 4783 8ff8 4d35b7290a02

比亚迪昨日召开 2025 年度股东大会。董事长兼总裁王传福在会上表示,今年汽车行业出海势头很好,以比亚迪为代表的中国车企迎来发展通道,公司原定海外年销量目标为 160 万辆,目前看来有机会超过此前预期。

王传福预计,到 2030 年,比亚迪会获得更大增长,「五年以后,比亚迪在规模上,能够做到真正的全球第一」。他把增长支撑放在二代刀片电池、闪充技术,以及明后年将推出的新技术上,认为国内外市场会形成双轮驱动。

在智能驾驶方面,王传福判断 L3、L4 级自动驾驶会提前落地。比亚迪已从芯片、算法、数据和生态等方面做准备,若法规落地,会推出合规产品;欧洲、南美、东南亚、中东等地的训练中心也已经准备好。

Waymo 以 2.2 亿美元买下苹果自动驾驶测试场

9907783a ec4c 4711 bb74 af987e527755

据 TechCrunch 报道,Waymo 已以 2.2 亿美元买下苹果位于加州的自动驾驶测试场 Castle,接手这处曾服务苹果汽车项目的封闭道路设施。

Castle 测试场原由苹果用于自动驾驶车辆、传感器和场景测试。苹果汽车项目终止后,这类封闭场地的价值转向更成熟的自动驾驶运营商:它可以用于复现复杂路况、测试安全边界、训练远程协助流程,以及在公开道路部署前验证车辆行为。

极氪 9X 累计交付突破 6 万台

8eedcad9 0386 4794 a6b3 8b81d1e78b9d

极氪昨日宣布,旗下旗舰 SUV 极氪 9X 累计交付突破 6 万台,并称该车型已连续 7 个月登顶 50 万级大型 SUV 销量第一。

极氪还表示,9X 同期累计登顶 50 万元以上车型全品类销量第一,50 万元以上车型每卖出 3 台就有 1 台是极氪 9X。极氪 9X 于去年 9 月上市,起售价 46.59 万元,提供 Max、Ultra、Hyper 和曜黑版等版本。

国家安全部提示「AI 中转站」数据风险

d3a2f82f 8646 47d4 9059 50365d6f61d9

国家安全部近日发布安全提示,提醒警惕「AI 中转站」带来的数据安全风险。相关风险主要来自用户通过第三方中转服务访问大模型时,把账号凭据、业务数据、个人隐私或内部文件暴露给非官方服务。

提示指出,一些中转服务会以低价、免注册或聚合多模型为卖点,但服务方可能记录用户输入内容、保存 API Key,甚至把敏感信息用于二次训练、转售或钓鱼攻击。

网易支付因账户、清算和数据安全违规被罚 220.4 万元

11b16808 7236 4fb3 a614 b113b6ef7fea

据鞭牛士报道,中国人民银行浙江省分行行政处罚决定信息公示表显示,网易支付(杭州)有限公司因违反账户管理、清算管理、数据安全管理有关规定,以及未按照规定开展客户尽职调查,被予以警告并处罚款 220.4 万元。

处罚公示表还列出两名责任人:网易支付技术中心余某因违反数据安全管理规定负有责任,被罚 4.5 万元;反洗钱中心朱某因未按规定开展客户尽职调查负有责任,被罚 2.4 万元。行政处罚决定日期为 2026 年 6 月 2 日。

网易支付前身为网易宝有限公司,2010 年 7 月成立,2024 年 6 月更名为网易支付(杭州)有限公司,是网易集团旗下持牌第三方支付机构,注册资本 2.7 亿元,由广州网易计算机系统有限公司全资控股。

💡 微软 AI CEO:超级智能即将到来,但不会「抢走你的工作」

dcf3b5ef f072 4b7a acd2 ec113be28719

据 The Verge 报道,微软 AI CEO 穆斯塔法·苏莱曼(Mustafa Suleyman)昨日接受播客采访时表示,超级智能 (SuperIntelligence)「即将到来」,但强调这不意味着白领工作将大规模消失。

苏莱曼约四个月前曾在接受《金融时报》采访时称,律师、会计、项目经理等职业的「大多数任务」将在未来 12 至 18 个月内被 AI 完全自动化,此番言论引发广泛争议。对此,他在采访中作出澄清:

我说的是「任务」,这和「工作」是非常重要的区别。这不意味着这个职位就会消失,只是说这些工作可以被更快、更高效地完成。

他认为,效率提升往往带来「反弹效应」——人们不会因此更轻松,反而会变得更忙、承担更多创造性和判断性工作。

在超级智能的进展上,苏莱曼表示,当前模型性能的提升遵循对数线性规律,算力每提升一个数量级,模型能力就会相应进步,这一趋势已持续超过十年。

他预计,随着更多算力投入,模型将在更多领域达到人类水平,但距离能够「发明新知识」并「自我改进」的真正超级智能,仍有一段路要走。

hao chan pin

赛豆科技发布 AI 汽车品牌 AIVA,携豆包大模型入局 20 万元以上市场

8b1bc3fc ee9e 4924 a84c fcfebad0a4dd

赛豆科技昨日正式发布全新 AI 汽车品牌 AIVA 及概念车 AIVA Origin Concept,首款量产车型 AIVA ME7 将于今年内亮相,全系覆盖 20 万元以上市场。

AIVA 由赛力斯、宁德时代等多方产业资本共同参与组建的赛豆科技推出。火山引擎作为核心技术合作伙伴,为 AIVA 提供豆包大模型、智能座舱等技术服务,参与联合定义与联合设计。

概念车 AIVA Origin Concept 采用流线型车身,前大灯被设计为可交互、可表达情绪的「眼睛」,车顶搭载激光雷达;量产车 ME7 的具体规格尚未公布。

品牌发布同日,阿维塔在社交平台发文称,市场上出现「某品牌」名称在设计上与阿维塔极为相似,并称「中国汽车不能走『Ctrl+C Ctrl+V』之路」。

阿维塔科技法务部随后表示将保留进一步追究法律责任的权利。阿维塔方面未在声明中点名具体品牌,但评论区多名网友将矛头指向 AIVA。

瑞幸上线 CLI 服务

34dd1635 1798 4766 b9c2 03dfeebd9733

瑞幸咖啡 AI 开放平台官网显示,瑞幸已上线 CLI 服务,开发者可通过终端调用相关服务。在 macOS 终端执行安装脚本即可使用。

瑞幸咖啡 AI 开放平台支持 MCP、CLI、Skill 多种接入方式,定位是把点单能力接入 AI 工具链。此前千问 App 开放第三方 Agent 和 Skill 时,瑞幸也被列为首批测试伙伴之一,用户可通过自然对话完成产品咨询、订单处理等操作。

尊界 V800 内饰曝光,后排配现磨咖啡机

f3adfe40 9629 44b2 9c94 5732c0dba180

华为常务董事余承东日前转发尊界 V800 首支官方宣传视频,称这辆百万级 MPV 将提供「越级空间」和「豪华驾乘」体验。视频里最受关注的配置,是二排区域集成的车载热饮系统。

从控制界面看,这套系统不仅支持美式和意式现磨咖啡,也提供热水和热茶选项;二排座椅扶手上还配有木纹托盘。尊界还在 C 柱内侧加入类似酒店和私人飞机舱内照明的「水晶壁灯」,并配合覆盖后排车顶的星空天幕。

工信部申报信息显示,尊界 V800 车长 5495mm、宽 2006mm、高 1850mm,轴距 3430mm,采用三排七座布局;第三排座椅可向后翻折并下沉,与后备厢地板形成纯平储物空间。

动力方面,该车全系采用 1.5T 增程式四驱系统,前后双电机峰值功率分别为 160kW 和 230kW。

荣耀 X80 Pro Max 规格曝光:11000mAh 电池和 6.78 英寸屏幕

d69268f4 d854 4c19 87f7 761b2e7eaebf

博主「数码闲聊站」发文曝光荣耀 X80 Pro Max 手机规格,该机可能在本月发布。

爆料称,荣耀 X80 Pro Max 将提供闪电红、玄甲黑、月影白、元气橙四种配色,采用「旗舰级 ID 设计」,支持满级防水和抗摔机身。屏幕方面,新机正面为 6.78 英寸 1.5K 直屏,搭载 3D 超声波指纹。

核心配置方面,爆料称该机将搭载高通骁龙 6 Gen 5 处理器,内置 11000mAh 电池。影像部分,后置为 6400 万像素单摄方案。

小米 MiMo 推出 UltraSpeed 推理模式

6d49b203 d308 4aba 97ce 855ad95484aa

小米 MiMo 团队与 AI 编译优化系统组 TileRT 宣布推出 MiMo-V2.5-Pro-UltraSpeed 推理模式,面向 1 万亿参数混合专家模型的高吞吐推理。

据披露,该模式在单台标准 8 卡通用 GPU 节点上实现每秒超过 1000 tokens 的生成速度。对超大参数 MoE 模型而言,单节点吞吐会直接影响推理成本、排队延迟和部署门槛。

Mind Lab 开源 749B 智能体模型 Macaron-V1-Preview

878af789 fc6f 4a0a 94f0 21f8485b3595

心洲科技旗下 Mind Lab 开源 Macaron-V1-Preview。该模型参数规模为 749B,其中基础模型约 744B,适配参数约 5B;激活参数 40B,基于 GLM5.1 预训练底座,面向 Agent Harness 场景后训练,并提供 202K 上下文。

据悉,Macaron-V1-Preview 面向真实任务链、工具调用和生成式交互界面优化,首次整合 Mind Lab 先前的 LoRA、Agent Harness 和 A2UI 技术。

在 LivingBench、VitaBench、A2UI 以及 OpenClaw 个人智能助理相关评测中,团队称其取得开源模型前列结果。

🤗 Hugging Face: huggingface.co/mindlab-research/Macaron-V1-Preview-749B

pin pai

美团外卖本月下旬试行店铺分新规

d7f1f6d0 5523 4e5b a705 bd47196f54dc

美团外卖将于本月下旬起在多个城市试行商家「店铺分」新规则,新增「门店真实性验证」和「后厨环境核验」两项食品安全指标,两项合计占店铺分总权重 20%。

规则显示,商家若未在 180 天内完成门店真实性验证,该项得分为零;未通过后厨环境卫生核验,环境信息项同样得零分。美团同时将下线商家评价体系中的部分重复性指标,涉及差评回复、在线联系回复、不接单等。

店铺分会影响外卖商家的平台流量、活动报名和降权清退风险。

星巴克首推「非遗妈妈周」主题活动

dc96617f 5513 4223 b3c5 474b6e16b7d6

星巴克中国宣布首次开启「星巴克非遗妈妈周」主题活动,6 月 9 日至 14 日,活动落地全国 7 家非遗概念店及超过 1500 家手工兴趣门店。这次活动由星巴克中国携手「非遗妈妈」展开,主题为「这一杯,见非遗」。

两位深度参与「非遗传承与乡村女性赋能」项目的非遗妈妈李换芝、陈艳秋,将走进苏州、南京、杭州的星巴克非遗概念店,分享非遗经历;门店伙伴也会以「非遗主讲人」身份带领顾客了解非遗内容。

活动还包含手工教室和限定商品。顾客可体验非遗编织技艺,制作端午竹编龙舟挂件;星巴克与非遗妈妈共创的「非遗匠心手作系列」限定商品,也在全国近 100 家臻选门店上市,品类包括冰箱贴、卡包、T 恤、托特包等。

hao kan de

《一个部门的诞生》定档 6 月 27 日

e8281f34 3edd 4162 bcaf 11a7737c2b93

电影《一个部门的诞生》官宣定档 6 月 27 日,并同步释出「我要 cut 台」版定档预告。

预告片中主角德仔(戴玉麒 饰)因退订电视套餐遭遇重重阻碍,阴差阳错之下被误认为劫匪,由此引发一系列荒诞喜剧情节。

中国首部喜剧探案动画电影《大唐妖探》定档 8 月 8 日

da74ca9b 6b9f 4dd2 8499 d517c9094565

中国首部喜剧探案动画电影《大唐妖探》昨日宣布定档 8 月 8 日全国上映。

影片由程腾执导、黄珉联合导演,雷淞然、张呈(排名不分先后)领衔声音出演。故事以长安城为背景,讲述少年神探狄少与实习捕快阿萨因一连串离奇命案被迫结成搭档,二人在追查真相的过程中逐渐揭开藏于长安城深处的秘密。

视觉层面,影片打造了「机关长安」视觉体系,将传统建筑美学与机关设计相结合,呈现穿行于飞檐斗拱间的高空缆车、水光潋滟的龙宫浴场以及百妖夜行的奇幻场景。

前几天,腾讯云与智慧产业事业群(CSIG)CEO 汤道生和腾讯首席 AI 科学家姚顺雨谈到「AI 下半场」时,姚顺雨提出一个判断:

AI 方法论逐渐成熟后,更重要的是找到真实问题和真实场景。对企业而言,模型能力只是起点,最终买单的是场景、上下文和可运行的系统。

围绕这个判断,我们会发现它其实也是理解当下企业 AI 落地的切入点。而在这场对话之后,腾讯云也密集发布了一系列产品,恰好给企业级 AI 的进展提供了一个很好的样本。

过去企业采购云服务和 SaaS,本质是采购 IT 能力;到了 Agent 阶段,引入 AI 更像是在建设一套新的生产系统。换个偏企业管理的说法,腾讯云正在扮演企业 Agent 时代的总工程师。

它要做的,是把场景、模型、知识、安全、记忆、成本和运行体系放到同一套系统里。

沿着大会提出的三个能力看,腾讯云的思路就比较清晰了:场景连接力解决 Agent 如何真正嵌入业务流;工程驾驭力解决 Agent 如何安全、稳定、可靠地运行;模型驱动力解决模型能力、成本与规模化部署问题。

三者合在一起,构成了腾讯云推动 Agent 落地的三驾马车。

Agent 既是新入口,也是新工位

互联网历史上,技术真正改变行业,往往经历同一条路径:先出现新能力,再进入高频场景,最终融入商业系统。

Agent 也不例外。

所谓场景连接,关键不在于增加多少个 AI 入口,而在于 Agent 能否沿着企业原有业务流进入组织。

腾讯的优势在于,它既有微信、企业微信、元宝、腾讯会议这些高频触点,也有 WorkBuddy、CodeBuddy、ima.copilot 、WAND、腾讯 AI 原生营销云、腾讯云 Mall、天御风控 Agent、真人剧 Agent、DatabaseClaw 等通用和垂类 Agent 产品。

·腾讯会议

举例而言,会议是很多企业最密集的信息入口。过去会议效率低,常常卡在三件事上:听不清、听不懂、效率低。腾讯会议这次讲的 AI 能力,正好围绕这三件事展开。

在声音层面,腾讯会议声链通过纯软件方案,让同一空间内多台电脑组成联合拾音系统,解决啸叫问题,为 AI 提供更完整的会议上下文。

13 5

跨语言沟通交给 AI 同传。它通过降低跨语言沟通成本,让参会者使用熟悉语言交流,同时兼顾音色保留和低延迟体验。

14 5

会议真正的价值,通常发生在会后。智能录制将录制、转写、纪要和待办串联起来,元宝纪要负责实时理解会议内容,「问元宝」支持会中会后自由联网追问。腾讯会议还开放 Skill、CLI、MCP 等能力,方便企业 Agent 调用会议上下文。

15 6

这意味着会议不再止于沟通,而成为后续工作的起点。课堂内容可以自动整理成学习资料,团队例会也能自动生成纪要、检查待办并发送邮件。Agent 进入沟通流,本质上是在把大量非结构化信息转化为可调用、可追踪、可复用的工作资产。

·MAGIC AI 原生营销云

如果说沟通场景解决的是组织内部信息如何更顺畅地流动,那么增长场景面对的则是另一个更直接的问题:企业如何更高效地找到客户、理解客户,并持续创造增长。

MAGIC AI 原生营销云的核心,不是增加几个 AI 功能,而是让 Agent 贯穿营销全链路。从机会挖掘、内容生成到用户互动和数据分析。过去一个活动上线往往需要多角色协作和数周准备,如今则希望把重复沟通、配置和复盘纳入统一系统,实现从营销工具集合,到智能营销平台的系统性进化。发布会上将其概括为四大能力:知客户、懂运营、会决策、能执行。

16 5

知客户,是理解客户状态和互动历史;懂运营,是沉淀企业营销经验和规则;会决策,是针对人群、商品和渠道生成更优策略;能执行,则是在权限和审批框架下推动营销活动落地。

·AI 原生云 Mall

营销之后,品牌和零售企业更要经营数字交易阵地,背后涉及商品管理、会员运营、活动配置、导购服务和售后经营等大量工作。AI 原生云 Mall 的强大之处,在于让 Agent 进入品牌经营过程。

22 2

云 Mall 2.0 的关键词是千亿底座、AI 原生和让经营自己跑起来。通过「千亿级交易底座+Agent 能力体系」双轮驱动,从「交易承载」全面跃迁至「智能经营」。

千亿底座强调交易稳定性和安全性,经过大规模交易场景验证;AI 原生则体现在 1+7 的 Agent 架构上:一个经营分析 Agent 负责洞察问题,七个执行 Agent 覆盖商品、内容、会员、营销、分销、门店和导购等环节,关键操作仍保留人工审批。

21 2

更值得关注的是 Agent 协作。比如发现商品滞销后,云 Mall 可以调用营销云完成策划、内容生成和投放,再将结果回流分析。未来电商运营不只是单个 Agent 工作,而是多个 Agent、多个系统之间的协同。

·天御风控 Agent

天御风控 Agent 则对应风险控制场景,覆盖注册登录、营销活动、支付诈骗、黄牛刷单等业务,通过微信、企业微信、网页等入口接入,承担实时分析、风险判断和持续监控等工作。

23 3

·腾讯云 WAND 

此外,内容生产同样是场景连接力的重要部分。

腾讯云 WAND 面向电商、短剧、漫剧、短视频、赛事直播等场景,把生成、理解、处理和编码放进一套能力体系里。WAND-Create 负责电商图、短剧、漫剧等内容生成,强调业务可用性和风格可控;WAND-EraseVibe、WAND-Enhance、WAND-Codec 分别处理无痕擦除、画质增强和编码压缩。

24 2

赛事直播场景中,WAND 提供一站式 AI 制播方案 — 一场比赛进来,AI 自动完成解说生成、精彩集锦生成、横屏转竖屏、多语种字幕、画质增强和实时转码分发。

·真人剧 Agent

真人剧 Agent,则推进到更复杂的叙事生产。

相比普通营销内容,真人剧涉及角色、剧情、场景、分镜、表演、后期和分发等完整链路。发布会上展示的「祝英台开着赛车来到发布会现场」Demo,全程无需演员、摄像机和实地取景,体现的是 AI 对真人内容生产成本的重构能力,而不只是视觉噱头。

27 3

短剧正在走向工业化生产。真人剧 Agent 面向短剧生产与出海、品牌营销和平台集成三类需求,覆盖剧本创作、选角定妆、场景生成、分镜脚本、拍摄剪辑和二创等环节。

它还能自动生成符合物理逻辑的一致性场景图,减少 AI 视频常见的场景跑偏问题,并通过人脸融合和口型驱动降低多语言翻译与角色本地化成本。

影视剧本质上是一套复杂协作系统。Agent 要做的不只是生成内容,还要理解角色关系、剧情走向、场景限制和制作流程,在创意表达与工业化生产之间建立连接。

25 2

早期电影从舞台记录走向镜头语言,经历了剪辑、特写、声音和特效等技术演进,最终形成完整工业体系。今天 AI 进入真人剧,也可能从加速单个环节开始,逐步影响剧本开发、素材管理和内容分发。

数字剪辑、CG、虚拟拍摄曾改变电影工业的生产方式。今天的 AI 也类似,它未必替代创作者,未必替代所有表达判断,却正在重塑内容生产效率。

把这些产品放在一起看,腾讯云的场景连接力就变得愈加具象化:会议连接组织上下文,营销云连接客户增长,云 Mall 连接交易经营,天御连接风险控制,WAND 和真人剧 Agent 连接内容生产等等。Agent 沿着这些高频业务流进入企业,才能获得真实反馈并创造价值。

想长期上岗的 Agent,得先学会守规矩

过去二十多年,视频、游戏、电商、移动办公等产业的发展,都离不开云计算提供的弹性资源和基础设施。

到了 AI 时代,云的角色进一步升级。企业部署 Agent,不只是调用模型,而是在搭建一套包含算力、上下文、工具调用、权限、记忆、监控和审计的运行体系。

Agent 时代总工程师最重要的工作,是把这些制度、边界和基础设施设计好。从这个角度看,工程驾驭力解决的不是单点功能问题,而是 Agent 能否进入生产环境、能否长期运行的问题。

首先是知识。企业知识通常分散在文档、会议、IM、制度、培训材料、业务系统和专家经验中。Agent 要真正服务企业,需要先把这些分散信息沉淀为可理解、可调用、可追溯的知识底座。

31 1

·腾讯乐享

比如腾讯乐享强调 AI 原生的 Agentic 知识库,让企业知识从静态资料变成可执行的工作台。它可以统一纳管多格式、多来源知识,通过 AI 巡检、AI 评审和权限管理提升知识质量,并与 WorkBuddy 等工作空间连接,让知识可以直接进入任务执行。

·ima

同步亮相的 ima 更偏向 Agent 时代的知识引擎。

ima 知识号能够让专业知识被 AI 搜索、引用和调用。知识号已经覆盖金融、法律、教育等 20 多个行业,相关信源累计应用次数超过 1.4 亿次,并已在海关、医疗等场景形成具体使用案例。

26 3

据悉,杭州萧山海关把 500 多篇海关法律法规、公告和旅客高频问答整理到知识号里,旅客通过二维码即可提问;医院药师则把用药指南、专家共识和诊疗方案放进知识库,医生和患者可以通过拍照、语音等方式获得参考信息。

ima 知识号不只面向人阅读,也面向 Agent 调用。知识可以被阅读、被对话,也可以被封装为 Skill。ima Skill 广场让创作者把方法论和工作流变成可被 Agent 调起的能力,比如合同审查 Skill、行情分析 Skill 等。未来 MCP、API 等 Agent 时代的知识产物,也可以成为知识分享的一部分。

最近 ima 还推出了专属知识Agent——copilot,具备长期记忆、全场景感知能力,基于用户使用 ima 所产生的数据自主扩充知识体系,沉淀并支持自定义拓展skills,自动完成复杂知识工作,从工具进化为越用越懂你的伙伴。

除了个人知识工作场景,没有记忆的 Agent 也很难成为企业工作系统的一部分。它可以完成一次任务,却难以理解历史任务、组织偏好和长期目标。企业需要的是能够持续积累经验的智能体。

32 1

·腾讯云数据库 Agent Memory

腾讯云数据库推出的 Agent Memory 将记忆分为短期记忆压缩、长期记忆沉淀和团队记忆组织化。短期记忆管理上下文和任务状态;长期记忆沉淀用户习惯与方法;团队记忆支持组织级知识共享与传承。团队记忆进一步划分为员工私有域、部门协作区和组织全局库,既保护个人知识资产,也沉淀企业级 SOP 和组织经验,避免核心知识流失。

腾讯云数据库自研符号化压缩和上下文卸载能力,可以在长任务场景下帮助 Agent 提升 30% 的任务成功率,同时节省 30% 到 60% 的 Token 成本。并通过独创的四层渐进式记忆提取方案,显著提升了 OpenClaw 的长期记忆能力。在 PersonaMem 测评数据集上,OpenClaw 原生记忆评测得分从 48% 提升到 76%。

·AICC 可信集群

而 AICC 可信集群通过 TEE 可信集群、端到端加密和可证明安全能力,将高性能推理、安全保障与运维优化整合为一站式服务,帮助企业以更低成本快速获得可用、可解释、可审计的安全推理环境。

1232

这些变化也指向了企业级 AI 与消费级 AI 的差异。消费级 AI 追求像人,企业级 AI 更要像组织:懂分工、守边界、能协作、可复盘、有交付。企业最终需要的 AI,要能在权限、流程和成本约束下稳定工作。

跑得通、用得起,才是企业 Agent 的成人礼

企业 Agent 面临最重要的问题,是成本。很多企业并非不知道 Agent 有价值,但一旦进入规模化阶段,很快会遇到现实约束:Token 成本难控、部署门槛高、推理调用贵、数据检索慢。模型能力不再只看效果,还要看单位任务成本、响应速度和 ROI。

因此,模型驱动力关注的不只是模型本身,还包括多模型智能路由、按用量控制成本,以及训练、部署、推理和数据检索效率。

开源 Agent 框架虽然能力丰富,但安装部署门槛较高,长期运行不稳定,成本也不容易控制。尤其是 Agent 执行任务时需要调用模型,盲目调用大模型,会让 Token 成本快速上升。

1231

·Lighthouse

Lighthouse 的角色,是个人云端助手的云端底座。

它本身是轻量服务器产品,过去主要降低用户上云门槛;到了 Agent 场景,它进一步变成 7×24 小时在线的云端工作空间。其产品设计强调轻体验、轻应用、轻投入和轻管理,希望把云端 Agent 的部署、运行和管理复杂度降下来。

如果说 Lighthouse 解决的是 Agent 怎么跑、怎么长期在线、怎么降低部署和调用门槛,那么 CFS Turbo 解决的是 Agent 规模化运行背后的数据底座问题。

Agent 的运行不仅依赖算力,也依赖数据。长上下文、知识检索、多模态处理、模型训练和推理缓存,都对存储性能和数据流转效率提出更高要求。

·文件存储 CFS Turbo

文件存储 CFS Turbo 定位为高性能并行文件存储,面向大模型训练、推理和 Agent 场景。它提供统一的数据平台,支持从数据注入、训练到推理和归档的全流程,并通过标准文件接口和 S3 接口减少数据搬运成本。

1234 1

同时,CFS Turbo 提供冷热数据分层和元数据检索能力,在降低存储成本的同时提升海量文件检索效率,为知识库、RAG、多模态生产和模型推理提供支撑。

换句话说,前者让 Agent 更容易落地,后者让 Agent 能够规模化运行。两者共同构成企业 Agent 时代的重要基础设施。

而结合开头姚顺雨的判断,腾讯云这次发布的重点,不只是推出一批 AI 产品,而是在尝试把 Agent 从工具变成企业系统的一部分。

沟通需要 AI 协作入口,增长需要 AI 原生营销云,交易需要 AI 原生云 Mall,风控需要天御风控 Agent,内容需要 WAND 和真人剧 Agent,企业级运行需要知识库、可信集群、Agent Memory、Lighthouse 和 CFS Turbo 等基础设施。

单独看,它们是不同产品;合在一起,则更接近企业所需的 AI 生产系统。

作为企业 Agent 时代的总工程师,腾讯云的价值也逐渐浮现:既要理解企业业务流程,也要提供模型、算力、安全、记忆和系统集成能力;既要让 Agent 进入沟通、营销、交易、内容和风控等高频场景,也要保证这些 Agent 能在权限、成本和安全边界内长期工作。

热知识,企业看重的并非 Agent 本身,而是最终能够带来的业务结果。Agent 能力再强,如果进不了业务流程、接不上企业知识、无法满足安全要求、成本又难以控制,最终仍然很难形成稳定价值。

AI 下半场的竞争,最终会落到具体业务流程中。很多技术进入企业都会经历同样的过程:从看起来聪明,变成用起来可靠;从替人做事,变成与组织一起工作。

历史上的每一次技术普惠,都是从走下神坛、卷起裤管开始的。今天企业级 AI 也只有在明确产出、安全边界和商业约束中反复验证,才算真正度过从草莽走向成熟的成人礼。

2026-06-09 18:30:10

几经波折之后,我们终于将手里的几台 iPhone 都更新到了 iOS 27,体验到了五年以来最重大的一次 Siri 更新

更新之后第一眼能看到的,也是最明显的升级,就是 iOS 27 全面焕新的 app 图标:

1 new icon

图|YouTube @Apple

当然,说是完全焕新也不尽然——

相比 iOS 26,新版本的图标更像是从「强调玻璃光影」进化到了「添加玻璃材质」:

2 icon compare

除此之外,iOS 27 的整体透明度也变得更加可控了。

iOS 27 中,原本只有两级可调的 Liquid Glass 模糊程度变成了一根无级滑杆,自定义范围更大:

3 new slider

根据会上介绍,iOS 27 的设备支持范围最低从 7 年前的 iPhone 11 开始。

新增的玻璃调整效果对于旧处理器的性能压力如何,还要看后续的更新情况如何——

4 support list

图|YouTube @Apple

幸好 WWDC 上宣称的流畅度优化确实有效。

iOS 27 是最近几代少有的,手机降温之后就基本不会掉帧的开发者测试版了,在 iPhone Air 上的表现也称得上稳定:

5 ios 27 update page

说到功能性方面,iOS 27 是一个非常两极分化的版本——

一方面,国际版 iPhone 迎来了堪称「量大管饱」的 Siri AI 更新。

全局检索、屏幕感知、连续对话等等功能给好给满,更不用提这个全新的 Siri UI 了:

6 new siri conversation

另一方面,国行机型迎来了近年来字面意义上「最贫瘠」的一次更新。

除了新壁纸、透明度滑块、节假日闹钟之外,国行 iOS 27 几乎没迎来任何有实际意义的 Siri 更新。

7 holiday alarm

除此之外,天气 app 在 iOS 27 中也迎来了一波卡片改版:

8 new weather

而在一嘴带过的 macOS 27 预览版中,我们还见到了可以随意调整比例的 iPhone 镜像:

9 iphone mirror

图|X @aaronp613

至于这个宽幅布局是给谁准备的,不言自明。

总之如果你恰好使用着外版 iPhone、拥有外区 Apple ID 的话,就可以享受到这套「中间下滑 Siri,左边下滑通知,继续下滑又是 Siri」的超绝连招了。

更重要的是,新版本的 Siri 也拥有了一个属于自己的 app。

它的主界面与我们熟悉的聊天式 AI 比如豆包、千问等等如出一辙,也可以切换成类似「小 X 记忆」的画廊模式:

10 siri app home

比较可惜的是,由于今晚尝鲜的人很多,苹果的 AI 服务器不太稳定。

这导致 Siri AI 的一些深层功能(屏幕识别、总结文章、多模态生成)成功率不高,经常会出现连接报错的情况。

然而在正常运作的时候,新 Siri AI 的端侧指令处理速度是我们体验过的最快的——

可惜这个速度只有搭载了 A19 Pro 的 iPhone Air 与 iPhone 17 Pro 系列才能体验到。

11 on device model

图|YouTube @Apple

说到 iOS 27 的改版,相机是不得不看看的应用。

非常遗憾的是,iOS 27 的相机并没有像部分爆料所说那样进行专业化升级,只是在 iOS 26 的基础上小修小改——

与拍摄相关的二级菜单收纳在快门右侧,成为一个单独的显眼图标。

顶部的常用参数则换成了居中摆放,视觉上更为平衡。

12 new cam ui

UI 设计方面的改变见仁见智,但在 iOS 27 上,UI 只是个引子——

在相机底部的模式栏滑动,我们会发现系统相机中赫然出现了一个名为「SIRI」的模式。

切换到 SIRI 模式,就可以像之前 Visual Intelligence 那样调用 AI 识别、分析、理解和搜索画面。

13 siri in cam

由相机出发,iOS 27 上还有不少 AI 方面的更新与影像有关——

随 iOS 26 发布的图乐园获得了更新的设计,并可借助 Private Cloud Compute 处理更复杂的生成请求。

同时,除了原有的卡通、可爱的风格外,这一代图乐园终于可以生成写实风格的图像了:

14 playground

在更新到 iOS 27 后,我们第一时间上手了全新的图乐园,需要注意:它目前只能用英语描述想要生成的图片效果。

我们上传了一张实拍照片,并要求图乐园生成一张带有 90 年代胶片质感、颗粒和眩光效果的图片。

等待数十秒后,图乐园给出了一张高度贴合描述的结果:画面风格完整,质感也相当真实。

如果不是放大细看细节,甚至很难第一时间发现明显瑕疵——

15 playground error

但由于前面提到的问题,图乐园生图偶尔也会失败报错。

推测也是因为短时间测试的用户太多,后续正式版的表现应该会更为顺畅。

影像的另一个 AI 大更新藏在相册中——作为每次拍完照后调整图片的第一环,相册的重要性不必多言。

这一次,苹果将升级的消除、扩图与重构集成到了 Apple Intelligence Tools 中,与风格、裁切等功能并列在一级菜单里:

16 photo edits

其中的重头戏,还是「重构」Reframe ——苹果称它来自 Vision Pro 相关技术的积累。

原理上讲,iOS 27 的「重构」很像是 iOS 26 中 3D 照片的进阶版。

当系统能够更清楚地区分照片中的前景、主体和背景后,用户就可以用手指拖动画面的视角和景别,照片的透视关系也会随之变化。

实际体验下来,重构功能的前后其实分成了两步。

第一步是预览。iPhone 会先用端侧的空间模型理解照片层级,并生成一个可以快速拖动视角的预览版本。

这一步速度很快,几乎可以实时响应手指操作:

17 reframing move

但预览阶段的可调整角度比较有限,如果拖动幅度稍大,画面里的主体和背景偶尔就会出现一些滑稽的拉伸。

真正的生成发生在第二步——确认视角后,iOS 就会调用云端模型补全因视角变化产生的画面空缺。

这一步目前偶尔也会出现连接失败报错的情况,但只要顺利生成,用 20 秒左右就能得到一张相当不错的新照片:

18 reframing result

哦对了,以上所有与 AI 有关的影像功能,都暂时与国行无缘

只能说首发体验下来,iOS 27 不愧是近十年来国行和外版割裂程度最大的一代。

毕竟我们也极少见到国行 iPhone 17 Pro Max 安装更新不到 20 分钟、美版却足足安装了快一个小时的巨大差异。

至于什么时候我们能用上满血的 Siri AI 功能,还得是克雷格的那句话——

19 craig fed

图|YouTube @Apple

国行用户还是没有 Apple 智能。

更新到 iOS 27 的开发者测试版本后,对国行 iPhone 来说,最大的变化是可以设置调休闹钟,外版用户则迎来了一个独立的 Siri App。

这两年,我们一直在吐槽国行 iPhone 没有 AI。

但如果今天真的要买一台手机,AI 恐怕还不是大多数人的首要考虑因素。

▲虽然都在说 AI 手机,但大多数手机的卖点还是在相机和电池等方面,包括苹果在 17 Pro 上的主要亮点也是后置三摄

大家会比较影像、续航、性能、外观,甚至颜色,却很少有人因为「这个 AI 特别强」而下单。

一个有点矛盾的现实是,AI 手机已经喊了两年,但什么是 AI 手机,行业和用户都还没有形成共识。

就在这个背景下,苹果这次把新版 Siri 推到了系统层。

它有了独立入口,也支持连续对话、文件上传和上下文理解。

PixPin 2026 06 09 10 29 02

从功能看,这些能力并不新鲜,很多用户会觉得它只是补上了 ChatGPT 两三年前就已经实现的部分。

真正值得关注的是,苹果终于给出了自己对于 AI 手机的答案。

目前,对 AI 手机而言,行业里目前存在两种理解。

一方面是手机变聪明了,从智能到人工智能。相机能够识别物体,照片能自动扩图、修改视角,搜索框里换了大模型驱动的 AI 引擎,快捷指令用简单的自然语言就能搭出来。

这些改进确实让体验变得更好,可是我们跟手机的关系似乎并没改变。这一路线增强的是功能,而第二种路线改变的是交互。

PixPin 2026 06 09 14 16 37

我们不用自己的操作,对着手机把想做的事情说出来,系统级的助手,会像 Codex 一样,自动启用 Computer(Phone) Use、Chrome(App) Use 的能力, 调度不同的应用,把事情做好。

过去两年我们一直在讨论,也是所有厂商都难做好的,全在第二件事上。

四种 AI 手机

问题在于,当 AI 真正开始替用户操作手机,它立刻会碰到权限、应用生态和责任归属的问题。

谁有资格代替用户执行操作?App 愿不愿意开放能力?出了问题谁负责?

于是,不同厂商开始走向完全不同的路线。

ChatGPT Image15 02 05

「被限制」的豆包手机

豆包手机刚出来那会儿,确实收获了很多关注。它通过系统权限拿到的能力,可以直接模拟用户点击。一个需要 50 步点击的任务,大概能跑出八成的成功率,能力边界是当时市面上,所有打着 AI 手机旗号的产品中最宽的一个。

PixPin 2026 06 09 15 06 23

但它也最容易踩雷,纯粹的依靠模拟点击,一边是效率的问题,更严重的是合规的问题。

效率上,通过识屏的方式找到应用的不同按钮,然后再操作系统进行点击,这种流程被拉得极长。即便可以预先录入一套常见应用的交互方式,但 App 一旦更新,界面重新排布,就又需要再来一次,还可能失效,需要重新学习训练。

合规上,豆包手机在去年年底被微信、支付宝集体风控。豆包手机也发布声明回复,所有的权限都在系统允许的范围内操作,后续也主动收缩了操作范围。

PixPin 2026 06 09 14 10 39

应用需要确保自己的用户信息安全,无可厚非。现在就连 Codex 上的 Computer Use,都无法正常操作电脑版微信,一旦检测到非人类的点击操作,微信就会自动退出。

豆包手机的正式版还在打磨,路线也正在从纯视觉操作向接口协同演进。

国民级的超级应用选择 AI,会成为手机的重要部分

微信,就在 WWDC 前,联合五大手机厂商推出了 A2A(Agent-to-Agent)助手能力。

手机系统 AI 助手解析出用户意图后,通过加密、受控的协议向微信发起「呼叫」,微信在自己的沙盒里原生执行「发消息、打电话」这两个基础动作,系统 AI 碰不到任何聊天记录。

PixPin 2026 06 09 14 15 44

这更像是一种停火协议,手机厂商承认,不能绕过超级 App 的边界;微信也承认,系统级 AI 助手正在成为新的用户入口,完全堵住并不现实。

更有意思的是,微信同一天还面向小程序开发者开放了微信 AI 生态接入指引。

开发者可以授权微信 AI 接入自己的小程序,其中有两种模式,「自动模式」让平台读取源码、分析页面、直接操作;「开发模式」让开发者自主声明能力,经审核后被微信 AI 调用。

两种模式可以同时开启。微信现有超过 400 万个小程序,如果大量接入,微信 AI 调度的能力范围将远超「发消息打电话」,点外卖、打车、订票、买东西,一整个小程序生态都有机会实现。

PixPin 2026 06 09 14 13 59

把这两件事放在一起看,微信的策略就很清楚了,手机厂商想把微信变成自己助手能调度的一个 App,微信想把自己变成一个更大的 Agent 平台。

双方都在开放能力,但都希望把入口掌握在自己手里。

XX Intelligence 和 XX 助手

再看 Android 和 iPhone,方向其实一致:AI 不再是一个 App,而是在系统里流动。

Google 在 I/O 之前的 Android Show 上直接说,Android 正在从 operating system 变成 intelligence system。

Create My Widget.2026 06 09 14 39 20

Google 的优势很明显:它既有 Android,也有 Gemini,还有搜索、Gmail、Calendar、Chrome、Google Play 和车机、手表、眼镜。它完全可以做一个跨屏的 Gemini 操作层。

从这个角度看,Google 争夺的已经不仅是一部手机上的 AI 入口,Gemini 承担的是整个 Google 生态的交互层。

当用户发出一个需求,调用的可能是搜索、地图、邮箱、浏览器,也可能是电脑、手机、车机和眼镜上的能力。

AI 手机只是这张网络里的一个节点。

Siri AI 不会是一个「ChatGPT 式」的 App

苹果选了一条更慢的路。

Siri AI 的新能力强烈依靠 App Intents。开发者要把自己的内容和动作用结构化方式交给系统,比如「我能创建一笔费用」、「我能预约会议」、「我能编辑这张图」。Siri 再用自然语言理解用户意图,调用这些动作。

苹果还把 App 内容接进 Spotlight 的语义索引,让 Siri 能理解手机里的个人上下文。这套逻辑和微信小程序的「开发模式」很像,开发者声明能力,平台负责调度。

区别是,微信只在小程序生态里做,苹果要把它放到整个 iOS App 生态里。

▲ Craig 在 WWDC 主题演讲结束后的媒体交流会上谈到 Siri AI 时说,「我们认为 Siri 不是一个独立的聊天机器人,一个你去那里闲聊的,不整合的地方,Siri 是一个集成的、对话式的工具。」

苹果的底层模型也补了一大块。第三代 Apple Foundation Models 包括端侧模型、私有云模型和图像模型,其中端侧 AFM 3 Core 是 30 亿参数,AFM 3 Core Advanced 是 200 亿参数的稀疏模型,按任务激活 10 亿到 40 亿参数。

更复杂的任务交给 Private Cloud Compute。苹果也提到新一代 AFM 是和 Google Gemini 合作定制的,最重的云端模型还用到了 Google Cloud 上的 NVIDIA GPU。

img 6a27c0794a55d

▲ 苹果昨天发布了第三代基础大模型|https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models

苹果终于把过去两年欠下的 AI 账补到了系统层。

它的优势是整合最深,Siri、Spotlight、App Intents、照片、信息、Safari、快捷指令,这些东西都在系统里。一次系统升级,就能改变 iPhone 用户「找东西、办事情」的默认路径。

但它的限制也很清楚,App Intents 取决于开发者适配多少,Siri AI 真实可用性还要等 beta 之后验证。

国行用户还要面对地区限制,而部分端侧大模型的能力,支持的手机产品也只有 iPhone Air 和 iPhone 17 Pro 系列。

640

AI 手机的天花板,不在手机里

今天各家争的,还是手机和 App 之间那一层:谁能替用户办事,谁批准,谁执行,谁担责。

从豆包、微信、Google 到苹果,虽然它们给出的答案并不相同,有的选择模拟操作,有的选择开放协议,有的选择统一调度层,也有的选择让开发者声明能力。

共同点在于,AI 手机正在从「回答问题」走向「完成任务」。

PixPin 2026 06 09 15 17 45

但再往后看,AI 手机的天花板可能不在手机里。

端侧模型正在变小,推理芯片正在变强。1.58-bit、2-bit 这类低比特量化不断降低模型占用,手机上能跑的模型会越来越大。现在很多端侧能力还只是修图、听写、摘要和简单问答,几年后,手机本地模型处理个人上下文、隐私任务、轻量代理工作,会变得更自然。

ai phone common trend

更大的变化,是手机会变成调度算力的入口。

我们不一定要在手机上完成所有工作,但可以用手机发起任务:让电脑里的 Codex 写代码,让云端的 Claude 做研究,让家里的设备准备环境,让车机继续导航,让眼镜把现实世界变成输入。

Googlebook 已经把这个方向摆出来了:手机里的 Android App、文件和 Gemini 能力,可以延伸到笔记本。苹果如果把 Siri AI 做扎实,后面自然会接 AirPods、Apple Watch、Vision Pro,甚至传闻中的眼镜和桌面机器人。

img 6a27c0fba0716

手机要变成什么,现在还没人说得准,但它正在从「装 App 的地方」,变成我们「随时能调动算力的入口」

2026-06-09 13:16:57

微信的 AI,终于动了。

就在苹果 WWDC 的同一天,微信做了一件可能比苹果更重要的事,发布了一份朴实无华的公告:《关于开发者接入微信 AI 生态的指引》。

从今天起,小程序开发者可以给出授权,让微信 AI 完成读取、操作和调用小程序的功能。

微信给了两种接入方式,一「自动模式」,门槛几乎为零,开发者打开一个开关,平台自己读源码、分析页面、搞懂小程序能干什么,然后 AI 就能直接上手操作,一行代码不用写。

另一种叫「开发模式」,开发者自己开发定制化的 Skill,通过审核后被 AI 调用。两种可以同时开启。美团已经宣布接入。

这不能只是理解成又一个新功能上线,而是要看到,微信正在把它的整个生态——数百万小程序、微信支付、服务通知、公众号——变成 AI 的执行层。

扒一扒 Skill 文档,微信 AI 是怎么调小程序的

微信开放文档里公开了小程序接入 AI 的 Skill 技术规范,仔细看,里面藏着很多设计细节。

mechanism

首先,架构本质上就是 MCP,做过 AI 开发的人会立刻认出来:mcp.json 声明每个原子接口的功能和参数,SKILL.md 描述整个业务流程怎么跑,这和 Claude、Cursor、VS Code 里的 MCP+Skills 架构几乎一模一样。微信没有另起炉灶,而是采用了行业正在收敛的标准。

其次,微信给了一套很清晰的「注意力权重」体系。AI 在决定调用哪个接口、生成什么参数的时候,最优先看的是接口返回的 content(五星),其次是 mcp.json 里的接口 description(四星)和参数 description(四星),SKILL.md 排最后(三星)。这意味着开发者写在哪里比写了什么更重要——同样的一条规则,写在接口返回里和写在 SKILL.md 里,AI 给的权重完全不同。

attention

第三,接口返回有一条核心规范:「事实+动作」两段式。先告诉 AI「发生了什么」,再告诉它「下一步做什么」。如果只写动作不写事实,AI 可能把「展示卡片」理解成「准备调下一个接口」而跳过用户确认。这是一个踩过很多坑之后才会总结出来的规则。

routine

第四,参数传递优先用 ID 而非自然语言。比如门店传 storeId 而非省市街道,饮品传 drinkId 而非饮品名称。这直接减少了 AI 的推理负担和参数歧义。

这套设计透露的信号是:微信已经在实战中跑过足够多的 case,知道 AI 调用外部服务的坑在哪里,并且把这些经验固化成了开发者规范。

实际上,如果对比同样以「生态」著称的微信小程序和苹果应用,微信对自家生态有一种「上帝视角」,这是一切实现的前提。

怎么比苹果 AI 还重要

今年苹果在 WWDC 上发布的新版 Siri AI,令人有些失望。尽管底层接入了 Google Gemini,Shortcuts 支持自然语言创建,却没有引起太多讨论。

12 3

细看就会发现差距:苹果做的是让 AI 在 iOS 系统内协调一些原生功能,一旦涉及到第三方应用、那些装在你手机上的 App,它就会捉襟见肘。

比如饿了么,它的代码跑在饿了么自己的服务器上,苹果读不了。Siri 想调用饿了么,必须饿了么的工程师主动来对接 App Intents 这套接口,一个一个谈、一个一个接,中间耗时耗力。

app intents

而微信做的是让 AI 直接操作数百万个第三方服务,因为小程序不一样。每一个小程序的代码,从开发者提交、到微信审核、到最后在用户手机上运行,全程都在微信的技术体系里。微信在审核阶段就能把代码扫一遍,自动分析「这个小程序有哪些页面,能干什么事,输入输出是什么」。

所以「自动模式」才能成立——开发者一行代码不用写,开个开关,微信自己就能把你的小程序翻译成 AI 可以调用的工具。微信的基础架构天然支持这样做,它拥有「上帝视角」,能够基于中心化实现调度。

这个架构优势,苹果没有,Google 也没有。

同样值得注意的,还有前阵子传出来,微信正在与华为、荣耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用户可以通过手机语音助理直接发起微信音视频通话或发消息。

HONOR A2A

对内,微信 AI 可以调用数百万小程序;对外,手机厂商的 AI 助理可以调用微信。微信正在成为 AI 时代的超级连接器——不只是一个做了 AI 功能的 App,而是一个让所有 AI 都能接入的服务中枢。

「微信 OS」的旧预言

小程序推出的时候,很多人戏称微信要做「微信 OS」。当时这更像是一个修辞——小程序替代了一部分 App 的功能,但本质上还是一个「轻应用平台」。

更偶然的是,当时设计的中心化审核机制,是出于控制质量和安全。但九年后,这个当初被批评为「管控过度」的设计,意外地成了 AI 时代的基础设施优势。分布式的 App 生态(苹果/Android)当时看起来更「自由」,现在反而成了 AI 接入的障碍。

censor

一个旧的预言,由于新时代的技术——AI——的出现,有了颠覆性的变化。

之前写 OpenClaw 和飞书的时候,我提过一个判断:IM 是 AI Agent 最天然的入口,因为对话本身就是人与 AI 最自然的交互方式,而 IM 自带的服务生态(机器人、支付、小程序)让 AI 不只能「聊」还能「做」。飞书已经在往这个方向走,上线了 Bot API 增强和 AI Agent 节点。

feishu

不过,飞书是企业协作工具,覆盖的是办公场景。微信有着截然不同的广度——14.32 亿月活,数百个细分领域的小程序,从点外卖到挂号到买机票到缴水电费,几乎覆盖了一个人日常生活的全部服务需求。

mini app 1

如果微信 AI 真的能流畅地调用这些小程序完成任务,那它就不再是一个聊天工具加了 AI 功能,而是一个用自然语言操作的操作系统。

用户说一句「帮我订明天下午三点从北京到上海的高铁」,AI 拆解意图,调用 12306 小程序查票、选座、微信支付完成下单,全程不出微信。这条链路理论上今天就可以跑通。

当然,理论和现实之间还有距离。AI 调用涉及支付场景的服务,容错率接近零——点错一杯咖啡是小事,买错一张机票就是大事。底层模型的准确性要求远高于对话场景。这也是全球 AI Agent 落地面临的共同瓶颈:从「能聊天」到「能办事」,中间隔的不是技术指标,是信任。

mini app 3

但微信至少做对了一件事:它没有从零搭建服务网络。这些年来,ChatGPT 在做的事是先有一个聪明的脑子,再一个一个去接 Shopify、DoorDash、Stripe,每一个都是从零建立的连接,到今天交易相关查询的占比还不到 3%。

真正将要发生的变化,对大多数用户来说,可能是悄无声息的。某一天你在微信里敲打一句「帮我订今晚九点去上海的票」,然后它就订好了,你甚至不知道背后调了哪个小程序,走了什么支付流程。

这种「无感知的完成」,才是AI Agent真正成熟的标志,微信离这一步,比任何人都近。

2026-06-09 12:42:51

很多人问,安卓又不是不能用,华为干嘛非得死磕鸿蒙?
其实答案很简单:在别人的地基上,永远建不起自己的高楼。
六个关键词,帮你看懂鸿蒙这两年到底做成了什么?



作为库克最后一次主讲的苹果发布会,WWDC26 本身也颇有一种「收尾」的感觉。

从 WWDC24 压大轴的「AI」,WWDC25 唱主角的「UI」,到今年的「AI + UI」两手抓,苹果放慢了脚步,更多是将前两年确定的这些新方向,做深做稳。

特别是 AI,70 多分钟的发布会,将近 40 分钟都留给了 Apple 智能的新进度,不仅有大量的新功能,苹果也给出了自己的新主张:

真正有益的 AI,应该以用户为核心。

2 1

iOS 27 主打一个求稳

今年的 WWDC 有一个显著变化:不再按不同设备平台,将发布会分成 iOS、iPadOS 或 macOS 的独立板块,而是直接发布跨系统的新功能。

这也预示了一种大方向上的调整:苹果未来的系统更新,将从「设备」转变为「功能」为主线,以后更会贴近 AI 大模型的能力,推出更新。

去年引入的「液态玻璃」设计语言,虽然让人激动,也带来了性能和可读性的问题,因此 iOS 27 的一个首要任务,就是要搞好优化,提升系统的基础品质。

在 iOS 27、iPadOS 27 和 macOS 27,用户可以直接通过滑块自定义「液态玻璃」的透明度,甚至可以恢复到类似以前版本的低透「磨砂玻璃」。

3 1

苹果也对图标进行了进一步打磨,通过「液态玻璃」叠层和光折射效果,为原本就晶莹剔透的图标增加细节。

4 1

系统界面进一步精装,系统底层的体验也没有落下,这次 WWDC 苹果也大谈优化。

最直观的表现,不管是 iPhone、iPad 简单的划动,还是 Mac 四指上划打开调度中心,这些简单的操作响应和动画都会更顺畅,相信 iOS 26 的掉帧 Bug 终于要解决了。

苹果表示,iPhone、iPad App 的开启速度将提升 30%,这不仅限于苹果的第一方应用,得益于系统底层的优化,第三方应用的响应速度也会有明显提升。

5 1

更多系统操作的速度也会更快,比如拍摄新照片后,进入相册可浏览的速度提升了 70%;AirDrop 的传输速度最高提升 80%,等等。

苹果也宣布,所有支持 iOS 26 的 iPhone 都能升级 iOS 27,包括 iPhone 11 和第二代 iPhone SE。

另一个横跨多个系统的更新,是「搜索」功能,苹果重构了聚焦搜索、照片和邮件应用中的搜索能力,安装新系统后,后台会对全设备存储的信息进行「索引」,知道设备上有什么、内容在哪里,因此搜索会更个性化和智能。

近几年,苹果生态的围墙开始松动,iOS 27 进一步开放了 iCloud 共享相册,将支持 Android 和 Windows 设备上传和共享照片。

还有一个很小,但相信口碑会不错的更新:升级 iOS 27 后,AirPods 新增自定义均衡器,用户可以个性化调整耳机的音效。

6 1

这次 WWDC 的另一个重点,在于「儿童安全」,以「儿童账户」为核心,系统会立即启用与孩子年龄匹配的保护措施,阻止一些网站和媒体浏览,家长可以进一步管控孩子的 App Store 使用,和联系人方式。

爱范儿上手 iOS 27 Beta 版后发现,还有更多 WWDC 上没说,但非常实用的更新。

比如一个「史诗级」功能:自带的时钟 App,终于支持节假日闹钟,「调休」也会算作工作日开启闹钟了。

7 1

天气 App 也重新设计,各种指标有了更清晰的呈现柱状图方式。

8 1

其实多项更新单独看都不大,放在一起却能看出 iOS 27 的优先级:减少操作摩擦,修复旧体验,同时为 AI 入口腾出空间。

今晚的主角,还得是重振旗鼓的 Apple 智能。

苹果迟到的 AI 反攻,从 Siri 开始

如果说 iOS 27 是系统层面的修修补补,Apple 智能就是苹果重新抢回 AI 时代的系统入口。

过去两年,苹果在 AI 上的被动不难理解,ChatGPT、Claude、Gemini 等海外御三家已经把用户对 AI 助手的期待抬高了一大截,用户已经不再满足于语音问答,而是开始习惯于多轮对话、文件分析、图像理解乃至更复杂的任务执行。

因此,这次 WWDC 的重心毫无疑问落在了 Apple 智能。 耐人寻味的是,苹果高管 Craig Federighi 表示,一些公司似乎在为了 AI 本身推进 AI,而没有足够关注 AI 最终要服务的人。

(所以,这是在点谁呢?)

9 2

苹果给出的 AI 答案是「围绕用户」。Apple 智能要深度整合进日常产品,理解个人上下文、常用 App 和屏幕内容,同时从设计之初保护隐私。

为了支撑这套系统,苹果今年与 Google 展开了更深合作。

双方利用 Gemini 系列模型背后的技术,共同创建下一代 Apple Foundation Models。这些模型会用于苹果内建的 Apple Intelligence 体验,并适配两类运行环境:一类在设备端运行,另一类通过私有云计算在服务器端运行。

10 1

从短期看,苹果引入 AI 外援,算是间接承认了自己在通用大模型上的差距,但长期看,这也是一种用时间换空间的聪明策略。十几亿设备带来的使用反馈、请求分布、端侧体验和开发者调用方式,只要经过隐私保护和合规处理,就会成为苹果迭代模型、调度系统和端云架构的重要依据。

此外,苹果还针对最强的 Apple Silicon 系统优化了能力更强的端侧模型,它可以理解并生成语音,也能同时理解文本和图像,并带来更准确的系统级听写、更好的自然语言理解,以及更有表现力的语音反馈。

11 2

更明显的变化,发生在入口层面。

在 Siri 被苹果收购 16 年后,它终于重新拥有独立 App 的形态,产品逻辑也明显向 ChatGPT App 靠近。

用户可以在新版 Siri 中查看已有对话,延续之前的话题,也可以开启新的对话。Siri 的对话历史会通过 iCloud 在 iPhone、iPad 和 Mac 之间私密同步。

12 3

考虑到用户过去的使用习惯,传统入口仍然保留。用户可以继续说 Hey Siri,也可以按下侧边按钮调用 Siri。

真正体现 iOS 27 交互变化的,是 Siri 与灵动岛的深度整合。

现在只要从屏幕顶部中央向下滑动,灵动岛就会向下展开,变成一个暗色文本框,能搜索,能提问,光标闪烁的颜色也使用了 WWDC 2026 宣传图中那种发光渐变效果。

13 4

在这里,用户可以打字问天气、查网页,也可以直接下达复杂指令。

苹果也通过三个场景展示了新版 Siri 的核心能力——充分展现了 Siri 从单纯的问答工具,升级为能够理解屏幕内容、调用个人信息并持续完成任务的系统级 AI 助手。

14 4

新版 Siri 能把搜索、提醒、音乐、导航等能力串联起来。你可以查询世界杯赛程,并让 Siri 策划观赛派对、生成菜单、起草群聊邀请;也可以追问演出购票方式、设置抽签提醒、播放歌手新单曲。

15 5

在屏幕感知和个人情境上,Siri 还能识别照片中的具体地点,并结合朋友发来的地址信息规划路线。

值得一提的是,WWDC 上所有 Siri AI 的演示,基本都采用了一镜到底的拍摄模式,你能明显感受到 Siri AI 思考的速度没有那么快,还能看到测试版动效的各种掉帧。

保留这些不完美的细节,就是为了告诉你,这次的演示是真实的,避免重蹈 2 年前的覆辙。

哦,对了,在支持最先进端侧模型的设备上,Siri AI 还会获得两项额外能力。第一项是全新的语音体验。Siri 的声音会更自然,也更有表现力。用户还可以自定义 Siri 的语音,包括表达强度和语速。

16 4

第二项是系统级听写能力提升。新听写在拼写、标点和大小写方面更准确。由于它内置在键盘中,用户可以在整个系统里使用,包括发消息、写日记、记录想法等场景。这些更新也会扩展到 CarPlay 和 AirPods。

17 2

Siri AI 的入口也进一步扩展到 Mac、Apple Watch 和 Vision Pro:用户不仅能在 Mac 上直接选中文件、图片或文本向 Siri 提问,完成报价对比、生成表格、起草邮件等操作。

18 1

视觉智能也同步进入 macOS 和 visionOS,既能识别屏幕内容和日程信息并建议加入日历,也能结合 Vision Pro 的空间计算能力,直接理解用户眼前的物体与场景,例如判断背包是否符合随身登机要求。

Apple 智能接管生态入口,但国行用户还得再等等

至于使用范围,苹果称,这些跨 App 的 Apple Intelligence 新功能,将支持所有 Apple Intelligence 已支持语言,并随最新软件版本免费提供。

不止于系统级的基础能力,Apple 智能也深入到每个具体的 App 中。

Safari 浏览器

得益于苹果 AI 能力,Safari 浏览器用起来会更顺心。

全新的 Safari 浏览器能够检测用户打开的网页,按相似主题进行自动分组。

19

用户还可以通过自然语言,告诉 Safari 自己关注的内容,比如商品上新、放票,更新会及时通知用户。

20 2

更「AI」的功能是自定义扩展生成功能,利用自然语言生成浏览器的扩展,比如自动保存美食网页中的食谱。

iMessage、邮件 和日历

AI 也进一步融入了更多系统应用:它能够自动理解短信和邮件中的上下文内容,主动提供操作建议,例如识别活动日程后一键加入日历或提醒事项,聊天中提到相关内容时,也会自动推荐合适的照片发送。

21

而在日历中,用户甚至可以直接用自然语言创建和修改行程,只需一句话描述活动主题、地点、时间和参与人,系统就能自动生成完整事件,也能快速调整固定日程安排。

电话

近几年,厂商都在借助 AI 改造最传统的「通话」功能,苹果也不例外。

用户和商家进行通话时,AI 会自动抓取、提示用户的个人资讯,例如和航空公司通话提供订票的邮件详情,和餐厅通话提供预订的日程信息。

家庭

在 WWDC 上,苹果也预示了一部分「智能家居生态」的未来。

首先是「家庭」App,AI 会自动识别、归类智能家居的最新动态,并整合为一个事实更新的动态通知。

更有趣的能力在于视觉,利用摄像头智能家居,家庭 App 能理解、描述画面,并能从多个摄像头中调取相关片段组成时间,用户也可以用自然语言搜索特定场景。

22

快捷指令

快捷指令的自定义功能很强大,但复杂的门槛让普通用户望而却步。

最新的快捷指令,会利用 Apple 智能理解自然语言描述,自动组装各种所需步骤,后续也能用自然语言描述修改。

23

相机

视觉智能被整合进相机应用中,切换到相应的模式,就能让 Siri 看到相机前的内容,进行智能识别,可以用来记录饮食状况。

24

图乐园

新版图乐园将基于更强大的图像模型,能够生成更高质量的图像,并支持更丰富的风格,包括写实风格。

25

从发布会上的例图来看,全新图乐园的产出质感确实比前一个版本更优秀,更有「果味」。

图乐园的编辑也更加灵活, 用户可以圈选某个对象,利用自然语言修改重构。

26 2

照片

更强大的图像模型,也为照片应用带来了全新的 AI 编辑功能。

首先是「消除」功能更加强大,可以消除更复杂、更庞大的物体,这有待进一步实测。

新的编辑功能有两个:「扩展」和「重构」。

「扩展」就是 AI 扩图,能够利用 AI 补充更多画面。

比较有意思的是「重构」,通过将平面照片转化为空间照片后,可以改变被摄物体的角度。

27 2

图乐园和照片的 AI 编辑功能将会有每日使用限制。苹果称,用户可以通过大多数 iCloud+ 订阅计划获得更高访问额度。iCloud+ 也将包含对兼容 Home 摄像头的 Apple Intelligence 支持。

过去 iCloud+ 卖的是存储、备份和隐私服务,接下来它很可能会变成苹果 AI 的付费入口,苹果不会让用户觉得自己在为一个聊天机器人续费,而是让 AI 成为 iCloud+ 的新价值。

上线节奏方面,开发者可以从发布会当天开始试用新版 Siri。普通用户将在今年晚些时候获得 Siri AI Beta 版本。Siri AI 会先支持英语,并较快扩展到更多语言。

不过,Siri AI 初期不会在欧盟的 iOS 和 iPadOS 上提供。

至于我们心心念念的国行版本,基于监管要求,Siri AI 和其他新的 Apple Intelligence 功能也暂时不会上线。我们也第一时间上手了国行开发者预览版,除了液态玻璃设计的升级,AI 功能几乎可以说是「原地踏步」。

28 1

同样值得注意的是,苹果口中「最强大的端侧模型」,目前仅支持 iPhone Air 和 iPhone 17 Pro 等有限机型,隔壁为了苹果 AI 入手 iPhone 16 Pro 的同事,已经哭晕在工位上。

9 1

面向开发者,苹果的核心思路也很明确:让第三方 app 接入 Siri,把 Apple Intelligence 从系统能力扩展为生态能力。

通过 App Intents,开发者可以开放 app 内的信息和功能,让 Siri 成为不同应用的统一入口;而更新后的 Foundation Models framework,则进一步开放了端侧模型、图像输入、Custom Skills 以及服务器模型调用能力,让 AI 逐渐成为苹果生态的底层基础设施。

简言之,WWDC26 的重点并不是 Siri 终于变聪明了多少,也不是苹果接入了哪一家大模型,而是苹果开始把 AI 重新写进 iOS 的系统逻辑里。

29 1

过去的系统更新围绕设备展开,今年则明显转向模型能力:理解屏幕、读取个人上下文、调用 App、生成内容、完成跨应用任务。iPhone 仍然是核心,但它正在从一个运行 App 的终端,变成 Apple Intelligence 调度个人数字生活的入口。

Apple 智能的魅力,肯定不是模型能力,更像是「信任」。

从发布会到官网,苹果 AI 叙事,强调的始终是隐私、端侧处理、私有云计算和个人上下文。用户使用苹果 AI,首先是因为在 iPhone 里,因为它和系统绑在一起,因为用户愿意让它读取照片、邮件、日程、信息和 App 数据。

未来十年,最重要的 AI 设备大概率仍然是智能手机;苹果要做的,是让 iPhone 继续成为那台用户最愿意信任的 AI 设备。

当然,以上这么多这么丰富这么吸引的全新苹果 AI ,对于我们来说,还得等到真正「准备好」的那一天。

作者:苏伟鸿、莫崇宇

2026-06-03 19:22:27

今天凌晨,劳斯莱斯揭晓了新款闪灵——Spectre Series II。

Rolls Royce Spectre Series II 2026 22

这款海外起售价超过 42 万美元,国内售价接近 500 万元的纯电跑车,已经用过去 3 年的市场表现证明了,它并不是一个短命的试验品。

上市初期,闪灵曾引发过全球名流圈层的抢购,15 个月以上的交付周期一度让订单排到了两年之后,并助力劳斯莱斯在 2023 年创下了 6032 辆的历史最高销量。

虽然在过去的一年多里,随着首批用户抢购完毕,加之全球超豪华市场整体步入调整期,闪灵的订单有所减少,但它依旧稳居劳斯莱斯销量榜的亚军位置,仅次于常青树库里南。

Rolls Royce Spectre Series II 2026 20

正是由于这样庞大的基本盘,闪灵 Series II 的到来才显得举足轻重。

但在国内的社交平台上,迎接这辆新车的却是截然不同的风景,评论区里点赞最高的往往是清一色的调侃。

这些豪华品牌和超跑电动化后也就剩下情怀和什么纯手工打造的溢价噱头了,实际在我们自主品牌前毫无还手之力。

 

电车时代把这些超豪华品牌车扒得底裤都不剩了。

可以看出,国内许多消费者在过去几年里,已经被尊界 S800、蔚来 ET9 甚至众多主流价位的国产新能源车完成了深刻的市场教育。大家习惯了用自研芯片算力、线控主动底盘以及基于融合感知的高阶辅助驾驶,去丈量一款车的含金量,超豪华品牌引以为傲的徽标和手工产线,成为了许多人眼中的「智商税」。

当新能源浪潮冲击着原有的汽车评价标准,那些曾经站在金字塔尖的超豪华品牌,真的走到了难以为继的边缘吗?

纯电会让法拉利挨喷,但动摇不了劳斯莱斯的地位

虽然在今天看来,劳斯莱斯转向纯电确是一个重大转变,但实际上,这个品牌和电车还是有一定渊源的。

1900 年,劳斯莱斯的创始人之一查尔斯·劳斯(Charles Rolls)体验了一款名为 Columbia 的古早电动车,随后,他在一段留存至今的文字中写下了对这种驱动形式的评价:

电动汽车是完美无瑕的,它们极为安静、清洁,没有燃油车的恶臭和剧烈震动。如果能解决固定充电站的建设问题,它们将变得非常实用。

5729

▲Columbia

此后一百多年里,劳斯莱斯耗费了高昂的成本,用复杂的 V12 发动机、空气悬挂以及数百公斤的隔音材料,在内燃机时代里勉力维持着这种无声、无震动的魔毯质感。

这就是劳斯莱斯和其他超豪华品牌的不同。

对于超跑品牌而言,电动化剥离了引擎声浪和机械拉扯所提供的情绪价值,法拉利刚刚发布的 Luce 因而引来拥趸们的指责。但劳斯莱斯不需要内燃机的轰鸣,纯电驱动抹去了内燃机的存在感,反而更贴近这个品牌最初的底色。

Rolls Royce Spectre Series II 2026 21

然而体验上的契合,掩盖不了商业上的问题:闪灵在过去一年多里经历了四成以上的销量下滑。

这种局面的出现,很大程度上源于纯电标签在二手市场引发的「保值率焦虑」。

在传统的超豪华市场,V12 燃油车通常具备相对稳定的金融属性。哪怕新车下地同样面临折旧,但它的核心价值是由内燃机技术和品牌图腾共同支撑的,它在二手市场上总能守住一个跌不穿的价格底线。纯电车型就完全不一样了,由于底层技术迭代过快,它天然带有严重的消费电子折旧属性。

engine Rolls Royce engine diariomotor 1 1

五年后,一台库里南的 V12 发动机依然是工业顶峰的象征;但五年后,闪灵身上的电池包、芯片和三电架构,在技术层面上极有可能被市面上主流的家用电车轻松超越。

谁会愿意花几百万去买一台马上就要在续航和动力上落后的「旧款」呢。

因此,劳斯莱斯首先在参数上削弱了消费者对于改款的顾虑。

劳斯莱斯为闪灵 Series II 更换了重新开发的电池组,WLTP 续航里程从之前的 329 英里大幅提升到了 390 英里(约 627 公里)。而在性能更激进的 Black Badge 版本上,双电机的输出功率提升到了 671 马力和 1100 牛·米。

Rolls Royce Spectre Series II 2026 5

▲闪灵 Series II Black Badge

与性能同步变动的,还有座舱内的细节。

闪灵 Series II 在副驾驶前方标配了全新的「时钟陈列柜」,将一块很有机械质感的指针时钟与不锈钢材质的欢庆女神缩影,一同封存入立体的玻璃展柜之中。

dbvafc 1

更细腻的背光与表盘雕刻,成功将车内的视觉重心从屏幕带回到了传统的机械图腾上。

但这些都算是常规的升级。劳斯莱斯很清楚,无论中控台怎么改、参数怎么提,纯电车依然会随着时间折旧。要对抗这种「消费电子宿命」,挽回富豪们的投资信心,就必须在电机和屏幕之外,制造出无法被技术迭代轻易抹去的溢价。

Rolls Royce Spectre Series II 2026 2

于是,劳斯莱斯选择将改进重心向 Bespoke 个性化定制倾斜。

一个显眼的细节在于座椅和饰板,劳斯莱斯为这辆新车引入了一种名为「Duality Twill」的全新竹纤维斜纹面料。

同时,为了在车内呈现出完美的纹理,整车内饰的刺绣多达 260 万针,缝线总长度超过 16 公里。仅刺绣这一项工序,就需要工匠手工不间断地工作 25 个小时。

Rolls Royce Spectre Series II 2026 10

在工业流水线可以用极低成本大批量复制算力、屏幕和芯片的时代,这种耗费人工的手工活儿,构成了划分工业品和工艺品的高墙。

国产豪华品牌需要补上「奢侈品」这一课

面对评论区里的一片看衰,互联网上也并非没有清醒的声音。一位网友的评论道:

你的电车三电系统再先进不过就像普通的电脑、手机、智能手表一样是个大众消费品罢了,和超豪华车完全不在一个层次,后者好比私人游艇和飞机。

的确,就像空客 A350 比湾流 G700 要先进得多,但在社交语境里,作为私人飞机的湾流要比一架空客更显富贵和奢华。

不可否认,国内新势力在算力、芯片、智能底盘等维度的突飞猛进,是中国汽车供应链的巨大胜利。然而,这种以「科技」为核心的故事线,天然带着消费电子产品的宿命——速生速朽。

今天全行业瞩目的独创技术,三五年后或许就会演变为普通家用车的标准配置。当一款车的高度依赖于快速迭代的电子元件,它的资产属性就会不可避免地打折扣。

Rolls Royce Spectre Series II 2026 17

劳斯莱斯那个「标」之所以能卖出高价,恰恰是因为它不怕时间的冲刷。

富豪们买闪灵,实际上是在购买一种难以复制的社会共识,以及不用明说的身份认同。

而这些,就是目前国产品牌在冲击百万级价格天花板时,普遍欠缺的临门一脚。要实现真正的品牌向上,国内车企需要从「工业品思维」跨界向「奢侈品逻辑」取经。

现代顶奢行业的运作有一条铁律:保持距离感,甚至拒绝客户。

诸如香奈儿、爱马仕等奢侈品巨头,往往会通过持续的阶层筛选和配额机制来维护核心用户的纯粹性。即便回到车圈,法拉利、兰博基尼等超豪华品牌也都是如此。

自主豪华品牌想要向上突围,必须在渠道、服务、以及母品牌的心智上做到完全的隔离,而不是用着和母品牌 15 万元级车型一样的蓝色背光按键。

Rolls Royce Spectre Series II 2026 18

另一个需要打破的,是对互联网流量的过度迎合。

奢侈品行业向来是一个「审美独裁」的行业,它习惯于居高临下地去启迪、去教育市场,而不是讨好大众。国内新势力生长于激烈的舆论场中,创始人往往需要高频地在社交平台上与网友互动、回应质疑、甚至亲自下场参与公关战。

这种接地气的作风在创立初期能够换来高频的曝光与销量,但在构筑超豪华品牌时,频繁的曝光也会消解掉品牌需要维持的尊贵感。

富豪们需要的不是一个天天在热搜上跟键盘侠打口水战的品牌,而是一个能代表其生活品味与尊严的符号。

vdsfcaasda

技术平权的红利让中国汽车赢得了智能化的上半场,完成了对西方燃油车垄断的「改朝换代」。

但当大屏、算力和辅助驾驶普及到每一个价格区间,下半场的胜负手将完全取决于审美、文化与阶层共识的塑造。

什么时候我们的超高端品牌,能够不再用性价比和冗余的参数去讨好每一个人,而是学会用独特的东方审美去吸引并筛选那一小群时代新贵时,属于我们自己的图腾才算真正诞生。

劳斯莱斯闪灵 Series II 依然站在神坛上,它在电动时代的「落后」,恰恰为后来者指明了奢侈品真正的护城河所在。

2026-06-04 18:53:34

6 月 2 日,英国克鲁工厂传来消息,宾利汽车正式发布了新一代宾利飞驰。新飞驰在视觉上的改变非常明显,它摘掉了延续半个多世纪的四圆灯,换上了双灯设计。

既然是新一代车型,只改改外观自然是不行的,新飞驰的内在也有不小的提升。

创始人华特·欧文·宾利先生在创立宾利之初,就立下了一个至今仍被克鲁工厂视作准则的造车愿景:

要造一辆快的车,好的车,同级别中最出色的车。

新一代飞驰搭载了一套高性能混动系统,最大功率达到 680 马力,比前代车型提升了近 20%。动力上的明显跃迁,配合变得更利落的车头造型,共同指向了一个趋势——超豪华市场的买家正在迅速年轻化。

gvfdc

即便是飞驰这样注重所谓「传统」的行政座驾,如今也需要以更强的驾驶表现和更现代的视觉语言,去吸引那些更愿意亲自驾驶的年轻车主。

摘掉四圆灯,老钱品牌也想「去爹味」

一些熟悉现代宾利的车迷可能会觉得,飞驰这次去掉四圆灯设计未免有些过于激进了,但实际上,这不过是一场跨越了半个多世纪的轮回。

1962 年,宾利在巴黎车展上推出了划时代的 S3 轿车,在那之前,宾利用的一直都是传统的单边大灯。

bgfvdc

▲宾利 S3

正是从 S3 开始,为了顺应当时美国联邦汽车安全法规允许双边四回路大灯的潮流,宾利首次开启了四圆灯的设计纪元。当时负责设计的传奇大师约翰·布拉奇利,将这一改动视作老钱品牌向现代主义的大胆跨越。

当然了,这样的设计在当年也引发了保守派贵族的抗议,被认为是离经叛道。

只能说,一代人有一代人的经典。

hytbgervf

六十多年后的今天,汽车已经不再需要靠大灯数量来彰显身价,高集成度的全 LED 矩阵技术反而让新飞驰的大灯内部结构变得更加精巧,营造出一种如璀璨水晶般的雕刻精致感。

gvfsdcs

除了灯组的结构性改变,重新回归飞驰系列的飞驰 S 在外观上大量运用了炫黑套件。前格栅与保险杠采用了一体式设计,S 版专属的亮黑色矩阵式格栅进一步压低了车头的视觉重心。

gvdsfc

这一次,宾利对「黑化」的处理颇为考究。前翼子板取消了老款的通风口,车身侧面线条更显平整简洁;后视镜罩和门槛饰条包裹着深邃的「鲸鱼黑」漆面,连车头伫立的飞翼 B 字车标和车尾的品牌字母标识,都一并被涂成了纯黑色。

bgvfdcs

灯具本身也做了暗色调配处理,标配了此前仅在极致版上才能见到的深色 LED 矩阵大灯,自带一种冷峻的神秘感。

新飞驰的座舱内部就没有太多变化了,依旧延续了克鲁工厂一贯的手工标准,号称每一把座椅都要耗费工匠 12 个小时来进行手工打造。

hbgvfdcs

gsvdfc

宾利这次在奢华高定系列上也有一些新动作,他们为音响发烧友准备了由 MULLINER 部门打造的 Virtuoso 臻藏系列车型。

该车型所搭载的 Naim for MULLINER 音响系统最初是为千万级限量跑车 Batur 研发的,一共拥有 21 个扬声器。

bgvfdc 1

宾利表示,其中的中音和高音单元采用了法国劲浪(Focal)品牌的 Grand Utopia 专利「M」形振膜,兼具极高的刚性与轻量化特性,能够将失真降到极低,以此来「精准还原声音的每一处细腻扩散」。

为了呼应「音乐」这个核心,臻藏系列在视觉细节上也做了一些点缀,它的双翼车标、排气管,甚至是车钥匙上,都用上类似管乐的香槟金色彩。

新贵们纷纷从后排走向主驾

如果只是把新飞驰视作一个移动的音乐厅,显然低估了克鲁工厂对于性能的执念。全面换装高性能混动系统后,这辆四门豪华轿车的账面输出得到极大提升。

bgvfc 1

由 4.0 升 V8 双涡轮增压发动机与电机组成的动力单元,最大功率达到 680 马力,峰值扭矩为 930 牛·米,整体动力输出提升了近 20%。

在全力加速时,这台重达 2.5 吨的豪华轿车从静止加速到时速 100km/h 只需 3.7 秒,最高车速可以达到 308km/h。

hgbvdf

为了让这些动力在实际驾驶中更易操控,宾利首次将部分性能车款的硬件进行了下放。此前仅在极致版(Speed 版)和 MULLINER 车型上的高性能主动底盘,这次正式引入到了飞驰 S 上。

这套底盘系统集成了主动式四轮驱动、双阀减震器、扭矩矢量分配系统以及带 48V 主动防侧倾控制的动态驾驶系统,电子限滑差速器(eLSD)也首次出现在了飞驰 S 的配置单上。 这套硬件网络在后台协同工作,可以根据路况以毫秒级的速度分配前后轴以及左右车轮之间的扭矩。

gvfdcs

从一些海外媒体的报道来看,这是宾利目前最先进、且偏向驾驶者需求的四轮驱动底盘。这些技术的堆叠,改变了传统大型豪华轿车在弯道中相对沉闷的动态反馈。

机械层面的调整,源于超豪华消费群体在全球范围内的更迭。

vaec

根据劳斯莱斯、宾利等品牌近年来披露的用户画像,超豪华车主的平均年龄出现下降。在欧美市场,高净值车主的年龄普遍在 50 岁以上;但在中国市场,这一数字已经降至 39 至 40 岁之间,且年轻女性车主的比例接近四成。

这些手握财富的科技新贵有着不同的用车习惯,他们不再满足于端坐在后排,而是更倾向于自己握住方向盘去享受驾驶。

bgvfdcs 1

在宾利的全球版图中,飞驰常年稳定地贡献着 20% 以上的销量份额。自慕尚停产后,作为品牌旗下唯一在售的四门轿车,飞驰一直承担着死守传统商务行政市场的任务。

因此,面对年轻化的消费趋势,新飞驰做出了改变,摘掉了标志性的四圆灯,换上了更现代的 V8 混动系统,在保留品牌身段的同时,完成了一次面向未来的产品转型。

2026-06-08 19:46:32

要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。

这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台,到现在已成长为一款适用于任何角色、工具和工作流程,且人人都能使用的生产力工具。

1

▲ OpenAI 在《知识工作的下一个时代》报告里提到,Codex 目前周活用户超过 500 万,自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面,虽然开发者仍然是 Codex 最大的用户群体,但知识工作者目前约占用户总数的 20%,并且增长速度是开发者的三倍多。

越来越多人发现,虽然 Claude Code、Codex,都是叫 Code(代码),但这些 Agent 不只是会写代码;它们还能整理文件、分析数据、搜索资料、自动跑工作流,甚至替我们完成一整个项目里的重复劳动。

早在 OpenClaw 火爆的时期,其实就有类似的趋势,但是龙虾的安装和部署劝退了很多人。叫好的多,真用起来的没几个。这类工具一直卡在同一道坎上,只有会折腾的人玩得转,普通人连门都进不去。

对大多数国内用户来说,Codex 算是第一个真正迈过这道坎的,虽然 Claude Code 在它之前,但 Claude 难用上,Codex 一键安装,加上接连的体验优化,把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。

HJbIQaQXkAEnq4A

究其本质,都是将从前单一的 Agent 演变成 Agent Team,甚至是一整套高达上百个 Agents 的动态工作流。

Kimi 最近推出了 Kimi Work,也是建立在这个趋势之上的一次尝试;其核心逻辑,就是把底层的 Agent Swarm 模型能力,用可视化界面进行封装,放到了本地电脑上。

大到工作中需要 300 个 Agents 并行处理的复杂任务,小到平时繁琐的文件整理、操作浏览器等等,都能通过这支 Agent 队伍在后台挂机完成。

开启 300 个 AI 分身

Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上;而为了让 Agent Swarm 真正工作起来,Kimi Work 提供了多项实用能力。

PixPin 2026 06 04 14 07 44

我们先是使用现有的本地文件夹创建项目,在该项目内新建任务,要求 Kimi Work 帮我们整理 20 家值得关注的 AI 公司,分析它们的产品定位、融资动态、核心竞争力等信息,并给出网页报告、PPT 等内容。

选择 K2.6 Agent 集群开始任务,Kimi 会自动给任务设置对应的进度,并且使用 Subagent 工具调用多个 Agents 来处理。

展开任务过程,可以看到有研究组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施,以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。

PixPin 2026 06 04 14 04 38

而调用 Skill 这些都是基本操作,从右侧的上下文部分,我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。

最后我们得到的分析报告也非常全面,数据表、可视化分析和具体的公司介绍都囊括在里面。更有意思的是,每家公司的详情部分都写着一句「风险」,Kimi 给自己的定位是「估值上涨过快,盈利拐点不明」,而核心竞争力是「长文本、编程能力、智能体、开源领先。」

PixPin 2026 06 04 10 26 57

除了这种常见的深度研究任务,有了 Kimi Work,我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件,使用对应的工具查看文件内容,汇总这些文件的信息。

PixPin 2026 06 04 14 29 31

从右侧的进度可以看到它会读取文本文件内容,也能提取 PDF 文件、查看图片文件以及处理 Office 文件等,最后生成的表格也成功列举了所有的文件内容和对应的信息。

PixPin 2026 06 04 14 42 59

我们找了一份会议记录,并搜集了一些论文资料和图片数据,累计本地的文件数量达到了十余个。过去使用云端的 Kimi,我们要一个个上传这些文件到网页,现在 Kimi Work 可以直接选择该文件夹作为一个项目,开始 Agent Swarm 进行处理。

PixPin 2026 06 04 14 57 25

我们要求它使用 K2.6 Agent 集群来启动并行协作,根据文件夹内的资料,完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。

由于涉及的文件过多,Kimi K2.6 Agent 集群这次启动了多个阶段来完成,像是在研究分析的第一阶段,它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。

PixPin 2026 06 04 15 19 04

在第二步,Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后,还会自动开启质量审查,利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。

PixPin 2026 06 04 16 15 56

最后,Kimi Work 产出了六份文字报告、一份测算模型,以及用于汇报的 HTML 和 PPT 文档。

PixPin 2026 06 04 16 53 07

随便点开其中一份文档,Kimi Work 都不是随便应付,从内容到格式都符合直接交付的标准。

PixPin 2026 06 04 16 49 08

在 Kimi Work 的回复里,Kimi 提到基于本地文件夹的内容,它启动了 11 个专业 Agent 分 3 个阶段并行协作,模拟完整的企业咨询项目组,最终交付 12 份专业文档,覆盖 6 种格式。

针对每份文件,它还贴心地给出了使用场景快速导航,例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html,提交正式咨询报告使用 08_综合咨询报告.docx,投行/研究机构参考是 09_深度研究报告.pdf 等。

这件事放到我们打工人身上,只能是先看 A 公司,再看 B 公司;先开网页,再记笔记;先跑表格,再写结论。但 Kimi Work 这类本地 Agent 的加入,让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。

放心 Vibe Working

除了直接使用 300 个 Agent 的能力,配合 Agents 集群,我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API,Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。

这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了,我们要求 Kimi 帮我整理一下苹果这三年来的股价信息,以及每年的财报,分析其中值得的关注信息。

Kimi 一点都不含糊,同样是启用了 Subagent 工具,调用多个 Agents,完成了一份内容丰富的调研报告。

PixPin 2026 06 04 16 38 04

除了网页,还有基于金融数据整理的 PPT、表格等内容,详细地概括了苹果的股价、主要收入、不同地区的收入情况等。

PixPin 2026 06 04 16 40 38 PixPin 2026 06 04 16 42 27

对大多数的知识工作者来说,这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。

Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引,我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。

PixPin 2026 06 03 18 00 59

Kimi 会自动启用一个标签组,所有自动化的操作都在该标签组内的网页上进行,调试过程中,Kimi 会自动输入对应的信息,自动截图查看当前页面状态,也会通过获取页面结构来定位搜索框、帖子内容等信息。

PixPin 2026 06 04 15 43 44

对于 Google 这种无法搜索到小红书信息的搜索引擎,用 Kimi 来自动化整个搜索过程,并给出对应的总结,也是一种不错的用例。

使用 WebBridge 的方式也非常简单,按照官方的指引,我们在浏览器上安装好 Kimi WebBridge 的扩展程序,或是直接新建任务,要求 Kimi 帮我们完成安装,它会自动执行对应的安装脚本,在本地处理好 WebBridge 相关的服务。

PixPin 2026 06 04 15 41 08

本地 Agent+Agent Swarm+WebBridge,这几项能力的综合,让 Kimi 能胜任的场景比单纯的聊天要广泛得多。

例如我们可以要它「检查我的 Gmail 邮箱,看看有没有过去 24 小时内未读的邮件。把重要的邮件总结一下。」然后,总结的内容全部保存到本地,甚至是把重要的邮件都保存下来。

Kimi 在浏览器中自动化操作了一会儿,就自动为我们生成了这份 Gmail 邮件总结报告。

PixPin 2026 06 04 17 20 29
此外,结合我们之前要求它完成行业咨询任务,现在可以让它总结信息,自动撰写文件,选择合适的附件并发送邮件。

PixPin 2026 06 04 17 28 19

或者针对那些从搜索引擎或者内置数据库中找不到的信息,先用 WebBridge 获取相关信息,再通过 Agent 集群来处理,形成各种报告文档。

AI 正在组队上工,学会做个甲方

这些检索内容、生成报告相关的能力,其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的,Codex 增长最快的知识型任务。统计的数据显示,数据分析任务,周环比增长 110%,而研究和知识产物也排名前三,有将近 37% 左右增长。

ChatGPT Image17 04 56 ChatGPT Image17 14 22

Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务,另一方面,知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定,Agent 集群的能力迎合了这一需求

过去几年,大模型产品一直在寻找进入工作的方式。

聊天机器人负责回答问题,Copilot 开始参与工作,Coding Agent 学会执行任务。如今,随着文件访问、浏览器操作和工具调用能力逐渐成熟,Agent 开始承担越来越完整的工作流程。

更重要的变化在于,完成一项任务的主体,正在从单个 Agent 变成多个 Agent 的协作。

在 Kimi Work 的案例里,无论是研究 20 家 AI 公司,还是围绕本地文件生成一整套咨询报告,背后是一组 Agent 自动拆解任务、分工协作、交叉审核,再完成最终交付。

Anthropic 前几天在 AI 自我进化的报告中,就曾提到,现在的 Agent 已经从 Coding agents 的时代来到了 Autonomous agents 的阶段,核心的变化就是多 Agent 成为了一种新的工作组织方式。

PixPin 2026 06 05 19 40 41

过去,知识工作的瓶颈往往来自人的时间和精力;未来,越来越多工作或许会变成另一种形式,人负责提出目标、判断方向和做最终决策,而资料搜集、信息整理、分析研究和文档交付,则由一支随时待命的 AI 团队协同完成。

打开电脑,面对的可能不再只是一个 AI 助手,而是一整个 Agent 团队。

One More Thing

当所有 AI 公司都在押注多 Agent 的产品形态时,四年一度的押注开始了。

美加墨世界杯即将在本周打响,48 支球队、104 场比赛。今年的竞猜选手,也有 AI 一席地。

Kimi 用 Agent Swarm 功能调动 300 个 Agent,对全部 104 场比赛进行赛前公开预测和赛后复盘,认为德国队被严重低估了,模型测算显示,德国队基准夺冠概率约11.0%,校准后约11.3%。

PixPin 2026 06 08 10 47 08

今天 Kimi 发布的这份世界杯预测报告里面提到,连续两届世界杯小组出局的阴影,在公众和市场心理上留下了顽固的「近因偏差」,持续压低了德国的定价;但 Elo 排名、阵容估值和人才储备厚度的硬指标上,日耳曼战车依旧稳居世界第一梯队。

当然,德国队最后能不能夺冠,目前还不得而知。有意思的是,在这件事里,Kimi 想证明的可能从来不是自己会不会猜球。

为了分析预测,它调用 300 个 Agent 去搜集信息、拆解数据、评估概率,再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样,世界杯预测只是另一种形式的复杂任务。

而当生活和工作中,越来越多的事情,我们都能安心交给这 300 个 AI 去完成时,那我的八块腹肌,或许真的还有点希望。

今天上午,华为常务董事余承东在社交媒体转发了尊界 V800 的首支官方宣传视频。他表示,这辆百万级 MPV 将拥有「越级空间」和「豪华驾乘」体验。

要论整段视频里讨论度最高的配置,还得是那台车载咖啡机,把现磨咖啡与中式茶饮做成出厂标配,几乎找不到先例。

作为鸿蒙智行与江淮汽车合作建立的豪华品牌,尊界在推出了大型行政轿车 S800 之后,迅速将产品线延伸到了全尺寸 MPV 领域。

目前网上的主流说法是,这款新车的价格区间将会落在 160 万至 200 万元之间,但从尊界 S800 70.8 万元的起售价来看,V800 最终的起售价应该也会落在百万元以内。

工信部此前公示的申报数据显示,尊界 V800 有着非常少见的身材规格。

V8002

它的长宽高分别达到了 5495mm、2006mm 和 1850mm,轴距则长达 3430mm。这样的体量让它成为了目前国内市场里尺寸最大的量产 MPV。

在造型设计上,V800 延续了尊界品牌的设计风格,用了封闭式前脸和 7 字形的灯组,中央是醒目的尊界徽标,车顶上方则可以看到激光雷达。

V8009

车身依旧采用了这两年非常流行的双拼色,并辅以大量的镀铬装饰条来烘托 V800 的体量感。值得注意的是,相比于 S800 所采用的 20 英寸起步的轮毂,尊界 V800 选择换装了 19 英寸的轮毂,来换取更舒适的乘坐体验。

V80011

尊界 V800 采用三排七座的座椅布局,为了保证空间利用率,第三排座椅设计了类似小鹏 X9 的向后翻折收纳功能——

当第三排不需要载人时,座椅可以整体翻折下沉,与后备厢地板保持平齐,从而创造出一个开阔的纯平储物空间。

ScreenShot 2026 06 08 161211 611

为了营造后排的氛围感,尊界还在 C 柱内侧装了一个「水晶壁灯」,有点类似豪华酒店长廊和私人飞机上的舱内照明。与之相呼应的是覆盖整个后排车顶的星空天幕,能够根据不同的车内场景进行光效联动。

V8005

V8004

前面提到的「咖啡机」,实际上是集成在二排乘客前方中岛区域的一套车载热饮系统。

V8001

从控制界面的显示信息来看,这套系统不仅支持美式和意式现磨咖啡的制作,还提供了单独的热水和热茶选项,下方的盖板后方应该就是出水口,二排座椅扶手上还设有用于摆放茶杯的木纹材质托盘。

动力架构上,尊界 V800 全系采用了 1.5T 增程式四驱系统,并没有纯电版本。其中,由江淮汽车生产的 1.5T 增程发动机最大功率为 127kW,负责发电。驱动车辆的是一套前后双电机系统,前桥电机峰值功率为 160kW,后桥电机为 230kW。

把开车的麻烦留给司机,把喝茶的体面留给后排

伴随着具体参数的公开,围绕尊界 V800 的讨论首先集中在它的重量上。

申报资料显示,尊界 V800 的整备质量在 3120 公斤至 3190 公斤之间——即便是在 MPV 里,这也是一个非常罕见的量级。

在社交网络上,有不少人开玩笑地说:「3 吨多重的车,C1 能开吗?」

V8008

按照我国现行的交通法规,C 类驾照允许驾驶总质量在 4.5 吨以下、车长小于 6 米的客车,尊界 V800 在合规性上并没有问题,但它在物理重量上确实已经非常接近轻型货车的边界了。

大自重带来的物理惯性,对于车辆本身的制动系统、悬架以及轮胎的极限都是不小的挑战。

另一方面,近年来新能源车由于大容量电池以及各种豪华配置的加入,导致车重普遍攀升,对城市道路、桥梁等基础设施产生的磨损和负荷,也逐渐成为了相关部门关注的重点。

gfardsc

在道路工程学领域,有一个被频繁引用的「第四次方定律」,大概意思是,车辆对路面造成的结构性疲劳损伤,与车重的四次方成正比。如果将尊界 V800 接近 3.2 吨的整备质量代入这个数学模型,那么,一辆尊界 V800 对于道路造成的物理磨损,大约相当于 21 辆 1.5 吨燃油车的总和。

在空间维度上,接近 5.5 米的车长和超过 3.4 米的轴距同样是一把双刃剑,这样的尺寸在面对窄路掉头、老旧街区的狭窄车道,会给驾驶员带来明显的操作难度和心理压力。

不过,从 V800 的高宽比设计里,也能够看出尊界为应对国内驾驶环境做出的一些考虑。

V8007

首先 1850mm 的车身高度被控制在了一个相对安全的范围内,能够顺利通过国内绝大多数标准地库 2.0 米的限高。而 2006mm 的车宽,也能在标准停车位为两侧的侧滑门预留出足够的开启空间。

更重要的是,对于尊界 V800 的用户来说,也许车辆本身好不好开、尺寸会不会过于庞大,停车方不方便似乎也不是他们时常需要去考虑的事情。

V8006

显然,和 S800 比起来,V800 更适合请个司机来解决出行问题。

这个时候,二排的车载热饮系统或许就能派上用场了。

以往像迈巴赫、宾利飞驰这些西方的传统豪华车型,后排中岛最常见的配置通常是香槟冷藏箱搭配酒杯,这符合西方商业社会的社交习惯。而在国内的商务接待中,主要的社交媒介往往是热茶、咖啡。

都喝不惯?来杯热水总是没错的。

E3V9v MUYAAIcsS

的确,从冷暖箱里掏出一个保温杯也能让你喝上热水,但相对而言,还是少了一些体面。

上世纪 90 年代,B&O 推出过一套音响系统,叫做 Beocenter 2500。当时最让富豪们津津乐道的,并不是它的功率有多大,而是两扇标志性的感应玻璃门——只要用户的手微微靠近,两扇玻璃门就会朝着两侧轻柔、缓慢地滑开,露出里面的 CD。

beolab 2500 wall mounted

显然,它们对音质毫无提升,甚至还增加了机械复杂度和后期的故障率。但在当时的豪宅客厅里,这个充满了机械仪式感的动作,远比音响本身的声音表现更能支撑起它高昂的溢价。

那台咖啡机,就是属于尊界 V800 的「感应玻璃门」。

2026-06-08 17:41:11

苹果 WWDC26 将在北京时间 6 月 9 日 凌晨 1 点举办,爱范儿已经抵达了美国 Apple Park ,我们将现场带来最新报道,敬请关注。

今年是苹果的五十周年,WWDC26 的伴手礼虽然依旧是经典的帆布袋、水壶和徽章贴纸三件套,但充满了果粉专属彩蛋:Mac 团队当年的海盗旗、初代彩虹 Logo、经典的「狗牛」吉祥物和新晋顶流「Finder 酱」。

gift

有意思的是,往年 WWDC 展前和来宾会面的都是蒂姆 · 库克,而今年变成了下一任 CEO 约翰 · 特努斯。有消息称,这次 WWDC 也将是库克最后一次主持苹果发布会。

ternus

WWDC26 今晚见,但你未必要熬夜,我们做了一份最全汇总,让你「超前点播」iOS 27 的各大亮点。

poster

iOS 27:液态玻璃优化,系统小修小补

不管你是否接受「液态玻璃」这套设计语言,iOS 27、iPadOS 27,尤其是 macOS 27,都不会选择把它撤回

虽然液态玻璃不会消失,但会变得更克制、更顺手。

据彭博社透露,目前 iOS 26 的液态玻璃效果,其实还不是苹果内部最初设想中的「完整版」。在 iOS 27 中,苹果会继续调整透明度、层级和动态效果,试图在视觉冲击和信息可读性之间找到新的平衡。

liquidglass

交互逻辑也会继续回调。9to5Mac 报道称,苹果正在重新调整应用底栏设计,整体思路更接近 iOS 18:取消独立搜索按钮,以及部分过度变形的标签栏设计。事实上,这种变化已经率先出现在 App Store 应用中。

与此同时,苹果还会把更多精力放在系统底层优化上。消息称,工程师重新梳理了大量核心代码,希望进一步改善能耗、动画流畅度以及长期使用时的稳定性。

设备支持范围也可能迎来一次「断代」。目前消息显示,iOS 27 最低支持机型或将停留在 iPhone 12 系列与 iPhone SE 3,这意味着 iPhone 11 系列以及更早的 4G 机型,大概率会止步于 iOS 26。

上个月,苹果官方宣布了即将推出的全新无障碍功能,截图中还带到了 iOS 27 一些非常细节的 UI 调整:

up

相机应用,同样会是 iOS 27 改动最大的区域之一。

彭博社爆料,iOS 27 的新相机应用将会提供一个「高级」选项卡,可以调整景深和曝光控制,并提供「基础」「手动」和「预设」的小组件功能,以及新的网格和色阶功能。

camera

除了高级模式,全新的相机应用还能够自定义界面,用户可以选择要不要在主界面显示闪光灯、曝光、计时器等功能图标。

钱包应用将会迎来重大更新:用户可以自己创建卡片,但似乎仅支持导入二维码,而不是 NFC 复制卡片。

今年 9 月,首款可折叠 iPhone 将正式发布,这款产品将搭载 iOS 系统,这也意味着 iOS 27 还将内置一个类似 iPad 的界面,或许今晚的 WWDC 还能看到一些蛛丝马迹,我们也做了一期折叠 iPhone 的猜想,帮你进一步了解这款神秘新机:

【插入视频】

Apple 智能:SiriGPT 来了,每个角落都有 AI

WWDC 上的更多戏份,还是留给了 AI。

对于苹果来说,WWDC26 也将为前两年 Apple 智能各种动荡画上句号,各种画饼终于要兑现了。

尤其是跳票了两年的 AI Siri, 跨 App 信息调用、屏幕内容理解、连续操作执行,以及更深层的系统与应用整合,不再只是演示视频里的未来功能。

在苹果提前公开的无障碍新特性中,有一个「语音控制」的新功能,允许肢体障碍的用户完全通过语音操控 iPhone 和 iPad,不只是打开 App,还能实现更灵活、细节的操作,点击需要的按钮和文件。

Apple accessibility features Voice Control demo

彭博社记者 Mark Gurman 透露,这套辅助功能背后,本质上就是 iOS 27 新版 Siri 的核心能力之一。这也意味着,苹果内部可能终于认为:新的 AI Siri,已经到了能够正式推出的阶段。

据悉,新版 Siri 将拥有独立应用,以聊天界面的形式进行交互,并支持理解图片、文档等内容。

siri

除了调用网络信息,「SiriGPT」还能够读取用户本地数据,包括笔记、短信、邮件、联系人、日历以及提醒事项等内容。

Siri 会开始真正理解「你的生活」。它不仅能帮你整理信息,还能主动结合你的时间安排、联系人和网络内容,完成写邮件、整理备忘录、安排日程等更复杂的任务。

当然,苹果也不会彻底改变用户原本的使用习惯。即便拥有独立 App,用户依旧可以通过「嘿 Siri」语音唤醒,或者长按电源键快速呼出 Siri。

新版 Siri 还会有一个全新界面,用来替换 iOS 18 那套发光边缘效果: Siri 直接融入灵动岛之中,并在需要时展开成一个输入框。

dynamicislandsiri

苹果甚至还在测试一种全新的 Siri 呼出方式: 用户可以直接从 iPhone 顶部中央下滑,进入一个全新的搜索与询问界面,聚焦「文字交互」,而传统通知中心则改为只能从左上角下滑呼出。

这个新界面会进一步与 Spotlight 搜索整合,不只是搜索入口,更像一个系统级 AI 中枢。

它会显示 Siri 建议内容,包括常用 App、最近搜索记录,以及录制语音备忘录等快捷操作,同时还会提供一个独立区域,用来显示早晚天气等信息。

与此同时,苹果内部一直在测试将第三方 AI 服务接入 Siri 系统之中的「扩展」功能。在 Siri 界面里,未来可能会出现一个独立按钮或菜单,允许用户自由切换不同 AI 模型,例如 ChatGPT、Claude 或 Gemini。

aiexpansion

这也意味着,未来的 Siri 很可能不再只是一个单独的助手,而会变成一个「AI 中心」:由苹果负责系统体验,用户可以自己选择 AI 服务。

不止于 Siri,Apple 智能还会进一步渗透到更多苹果第一方应用中。

相机

除了自定义和专业模式,相机应用还会新增一个「Siri 模式」,类似 Apple 智能的「视觉智能」功能,用于识别物体、实时翻译。

siricam

照片

「消除」之外,苹果还会进一步加码照片应用的 AI 编辑能力,引入「重构」和「扩展」两个功能:前者可以改变照片的视角,后者相当于 AI 扩图。

苹果还在测试基于自然语言提示的照片编辑功能,用户通过语音或文字提供需求,AI 来帮忙完成,例如裁剪或改变颜色,这个功能大概率不会和 iOS 27 第一个正式版本一起推出。

photo.001

快捷指令

快捷指令将拥有类似「vibe coding」的能力,用户用自然语言描述想要的功能,AI 自动完成搭建和安装。

更多 AI 功能

iOS 27 还将包含 AI 壁纸、系统级 AI 校对工具,以及更强的「图乐园」AI 生图应用。

在苹果第一方邮件、短信、Safari 浏览器等等之中,常规的搜索框都很可能被 Siri「赋能」,实现更智能的检索能力,类似目前 Apple 智能加持下的照片应用。

spotlight

macOS 27:聚焦界面调整

液态玻璃立项之初,就是专门为 OLED 屏幕设计的,而目前所有 Mac 产品都在使用 LCD 屏幕,在呈现半透明、阴影和玻璃质感的方面,效果不如 OLED。

这也导致 macOS 26 的部分高透明界面,在实际使用中出现了明显的问题:背景内容和前景文字互相干扰,列表层级变模糊,可读性下降。

Screenshot 2025 06 09 at 12.56.51

因此,和 iOS 27 一样,macOS 27 的重点之一,同样会是继续打磨液态玻璃。

苹果会重新调整透明度、阴影、模糊效果以及层级逻辑,让界面更接近最初设想中的状态:既保留玻璃材质的轻盈感,又不会牺牲信息可读性,同时进一步优化能耗表现。

不过,macOS 26 的 UI 问题,其实早已不只是液态玻璃本身。

例如大量圆角细节没有统一、界面里塞入了太多分散注意力的小图标,以及新版应用图标在重新设计后辨识度明显下降,都让整个系统在视觉一致性和美观度上受到了一定影响。

tahoe utility icons via basic apple guy

苹果也预计将在今年年底或明年,推出首款配备触控屏幕的 OLED MacBook Pro,因此 macOS 27 也很可能会对界面进行调整,例如按钮的体积更大,更契合触控输入。

值得一提的是,苹果也已经官宣,macOS 26 将是最后一个支持 Intel Mac 的版本,因此 macOS 27 将只支持 Apple Silicon Mac,并且这也将是最后一个搭载完整 Rosetta 2 转译器的版本。

iPadOS 27:惊喜不多

相比较之下,iPadOS 27 的更新幅度会更小,除了 Apple 智能和优化之外,主要集中在 iPad UI 上的调整。

由于 iPadOS 26 大改了 iPad 系统的界面,使其交互更接近 Mac 桌面,iPadOS 27 则会进一步对系统应用的 UI 进行调整,例如音乐、播客、Apple TV 等系统应用,会进一步利用 iPad 的大屏幕。

ipados26

一开始 iOS 27 有爆料传出时,大家都以为这只是一次「小版本」,主要集中在系统优化、稳定性提升这些方面。

但随着更多信息流出,我们才发现,比起 2 年前那场宣布 Apple 智能的 WWDC,今年更是苹果 AI 更浓墨重彩的一次发布。

两年才迎来一次更新的 Apple 智能,放在两周一变的 AI 行业里,这样的慢节奏显得格格不入。

但对于苹果而言,比起抢跑,更重要的是把体验真正打磨成熟、稳定落地——先补上差距,才有资格谈超越。

对于很可能要继续「为 Apple 智能准备」的国行用户来说,全面在界面和底层上优化的 iOS 27 ,虽然惊喜少了点,但也是一次相当踏实的更新。



https://feedx.site

Agent 的世界,四月还是山雨欲来。五月尚未结束,已然血雨腥风。

整个行业的加速快到不讲道理。Vibe Coding 已经不再是新名词,编程这条赛道也从未如此拥挤:Claude Code、Codex、Cursor 贴身肉搏,Trae、Qoder、CodeBuddy 杀成一团。

黑话一个接一个流行起来,支配所有人的注意力。去年还是 skill(技能)的天下,如今 harness(脚手架)站上了王座。

热词之下,模型已经卷到几近一条平直的线:不同的基准测试会给不同的答案,但总体来说,无论是 Opus、GPT,还是 Qwen、GLM、Kimi 和 MiniMax 们,无论是写代码还是执行越来越复杂的任务,都已不在话下。

模型之间仍然存在差距,但拉开模型公司之间真正差距的,早已不再是模型本身,而是套在外面的那层壳。

之前一份研究报告拆解了 Claude Code 泄露的代码,发现真正属于模型决策的代码只有 1.6%,剩下 98.4%,全是管权限、管上下文、兜错的 harness。

为了进一步发挥模型的优势,全新一代的 agent 产品如排山倒海而来。Grok Build、Qoder 1.0、TRAE SOLO 纷纷推出。连一直以来低调沉默的 DeepSeek 都挂出多岗位招聘,组建 agent 开发队伍。

早于业界布局 agent 的 MiniMax,在混战中落下自己的子。桌面端产品先是在 5 月中推出主打全新多 agent 编排架构的 Agent Team 功能。而随着 M3 旗舰模型,MiniMax 桌面端全面升级为 MiniMax Code,再次搅动了大厂、小龙云集的 agent 市场。

Agent Team 的内核是一套 Leader-Worker-Verifier(领导-执行-验证)的「对抗式」架构。负责干活和负责挑错的职责,被拆成不同的 agent,受到经过代码逻辑固化的状态机去管理,彼此之间上下文隔离。

这味药,治的是长程 agent 任务中那些出了名的顽疾:上下文污染、上下文焦虑、agent 之间的「共谋」。

有趣的是,正如前述 MiniMax 并没有等 M3 发布,而是率先在 M2.7 上就将 Agent Team 推了出来。M2 这一代,被 MiniMax 称为「大巧若拙」,模型和脚手架之间的共融共生已经看到了黎明前的曙光。预料之中,M3 只会更强。

近日 APPSO 与 MiniMax Agent  研发工程师择因(周淳辅)做了一场对谈。我们聊了  Agent Team 的设计原则及其所体现的 MiniMax 认知,探索了 Agent Team 的技术内核,浅析其它玩家对于 agentic 模型如何约束与放任。

业界有一种观点正盛:Anthropic 拥有最好的模型和最烂的工程。在择因看来,Anthropic 骨子里不信任模型,预设模型会作弊、耍小聪明,于是到处加以约束。OpenAI 的 harness 核心却是一个极简的 agentic loop。

img 6a264ea29ec97

一个极简框架养出了遵循度极好的模型,一个约束极强的框架却养出了「黑天鹅」。MiniMax 做 agent 的思路,既将两者融合,又不完全相同:要相信模型,给它和人一样的操作权限,但也要在脚手架中加入合理的约束。

这些思路在业界独树一帜,但业界追赶新东西并将之确立为共识的节奏,早已快过于新思想诞生的速度。在 agent 上,MiniMax 没有壁垒——没有任何人有。择因发给我一篇 71 页的论文,告诉APPSO:

「关于 agent 的所有东西,都在这篇论文里了。如果一篇就能说清楚,还有什么壁垒?」

但 MiniMax 仍有绝活。

他们力求以最快的速度不断向整个行业输出新的认知,做共识的领导者、执行者、验证者——这也是为什么 Agent Team 及其背后架构没等 M3,就公之于众了。

究其根本,中国模型公司的「开源」玩法不会一直持续下去。但这并不代表,优秀的认知不应该及时与世界分享。

就像一个 agent 的工作会有它的停止条件,开发 agent 的人们也有停止的那一刻。对于择因,可能会是当 agent 可以实现真正的自进化,并且在几乎任何数字或物理世界的任务上效率和成本优于人类。

从站在第一线的他的视角来看,我们离那个未来并不遥远。

以下是 APPSO与 MiniMax Agent 研发工程师择因的对话。卖个关子:在最后我们提出了一个开放性的问题,并获得了意想不到的答案。

img 6a264eca6492d

架构即认知

APPSO:Agent Team 为什么没等 M3,直接在 M2.7 上就发布了?

择因:不用非等到和新模型一起发,是我们的意愿,也是自己的节奏,就是希望不停地把最新的认知传达给外界,这件事情很值得做。以及它在我们内部已经使用很久了,一个月的时间,我们觉得可以对外发布了。

APPSO:今天一切的周期都变得很快,一个月已经很久了。

择因:发布时我们模型还没迭代,但是有一批核心用户对我们的 agent 的运行范式感兴趣,所以我们提前发出去吸引他们。核心用户的建设对我们来说非常必要。后面我们也会考虑把我们的 Agent Team 架构开源出来。

APPSO:MiniMax Code 到目前为止的反馈如何?

择因:这次把订阅逻辑理顺了,订了 token plan 就能用 agent。一个多月下来,下载和订阅量有一个比较可观的增长。这其实很有意思,因为如果只是提供 API 的话,用户用模型的门槛高,使用效果也不是最佳。MiniMax Code 能让大家直接感受到模型的完全体,这也是我们一直以来的思路,这一次被验证了,我觉得很好。在 M3 上只会更好。

用户方面有个比较有意思的点,因为我们是全模态,发现很多用户拿 Agent Team 去做长视频生成,有古文爱好者用它来生成大量的诗朗诵音频。这些偏 C 端、兴趣向的使用案例,其实我们没有预料。

很多用户也告诉我们,当 Agent Team 被整个拉起来开始干活的感觉,给他们带来很大情绪价值。

APPSO:真的像是有了几个员工给自己打工的这种感觉?

择因:对。总体上看最近两个月的多 agent 产品,已经是血雨腥风。腾讯那个 (Marvis)「打工」感更强。很明显,在 Agent Team 的共识和落地方面,大家跟的都很紧。

APPSO:你说有人用 MiniMax Code 做视频,会不会以后可以不用专业视频生成工具,不用懂脚本、分镜、首尾帧,直接用 agent 调用全模态模型就能做视频了?

择因:首先明确一下,我说的是偏个人用户、爱好的角度做视频,我觉得是可行的。专业的视频制作,其实让一个 Agent Team 去做, 跑通打个样可以,但如果真的投入工业生产,还是需要分工。比如编导负责 idea、分镜、首尾帧这些关键的东西。给到另一帮人负责丢给海螺或 Seedance 抽卡。

但我认为随着模型能力提升,抽卡这部分的成本,以及后续剪辑的成本,会降得非常低。

我们调研了一下,发现今天让剪辑师剪视频其实比 AI 便宜。甚至市面上有一种服务,他把抽卡和剪辑都打包了,但价格主要是抽卡的成本,剪辑反倒不花钱。实际上他们找了一堆大学生上课学剪辑,交学费,课程任务就是给我把视频剪了。

APPSO:如果更强的模型出来,比如 M3,能比人工剪辑还便宜吗?

择因:我们的模型在能力上可以。但是你要算账的话,还是我刚说的套路,人的成本也会越来越低。

APPSO:MiniMax Code 的 Agent Team 架构,也就是 Leader-Worker-Verifier,听上去很合理,你们先做出来,然后 Claude Code 也跟进了。

择因:我们是从三月开始做的,一开始我和边上同事讨论,一个 agent,它一旦做错了,在上一轮轨迹里面它永远会记得自己做错了这件事。但转念一想,它如果接下来按对的方向去做,其实这段做错了的记忆它是完全不需要的,对不对?

基于这个想法,我们设计了这个新的架构:让干活的和负责验证的 agent 之间分开。验证的时候要有打回的机制,并且要让一个新的「脑子」去打回。

当月我们就把这套架构搭出来了,不过目前那个时候是主要内部使用,大家用得非常不亦乐乎。

img 6a264ef3798f5

APPSO:你们内部用的爽点具体是什么?是解决了之前的痛点,还是效率高、更不容易出错?

择因:我举个最简单的例子,比如你睡觉前给它派个任务,哪怕是极度复杂的工作,只要你卡控的够严格,你的准出标准可量化、可观测,而不是模型自己觉得可以就可以了——只要你做好这些门禁,这群 worker 和 verifier 就能在你睡觉的时候一直跑,睡醒之后就干完了。

可以说三月开始,这种新的开发节奏、新工作方式,就在我们内部出现了。

APPSO:这和传统依赖提示词的多 agent 编排的本质区别是什么?

择因:本质区别是我们的 Agent Team 架构做了一套复杂的自由度限制。

首先运行层面它是一个状态机,是确定性的代码,有严格的限制,它不能跳出这套规范,你可以把它理解为一个更严格的工作流 (workflow)。

在 agent 基建的层面,我们又给了极大的自由度。所有的 agent 之间都可以互相通讯,这和传统的 agentic workflow,有方向的流程图是完全不同的。当然,以前的 workflow 里面也可以带循环,但是核心还是这步走完了下一步。

我举个例子,比方说你用 agent 做开发,环境里少了某个包导致开发受阻,过去的 workflow 上可能就卡住了,而我们的 worker 或 verifier 发现了之后,它可以通过多种健全的机制通知其它 agent 别踩坑。

再比如一个研究类的任务,一开始的研究计划需要 leader 做些初步研究,过去 leader 分配完任务就停止了。但在我们架构下,如果用户有新点子、补充想法可以直接说,leader 能随时启动、去打断当前的 agent team、加一个新编排进去。Agent 工作流可以随时调整,剩下的重活都交给模型就行了。

以及大家知道强化学习逻辑下会出现「上下文焦虑」,当上下文过长模型就不想干活了——不干活就不犯错嘛。而我们这套逻辑让它更严格遵循编排,持续工作直到达到准出标准。

APPSO:你们如何让模型同源的 agent 实现对抗,避免共谋?择因:答案很简单,还是提示词。2026 年的大多数模型遵循能力足够强,提示词变得更可用。我们也会做一些提示词上的「雕花」行为,更重要的是给模型可观测的停止条件,让 worker 和 verifier 分别管理一些事情,比如 worker 的停止条件就是把活干完了,verifier 的停止条件是在干完的活里找到 bug。

img 6a264f13cdeb7

APPSO:我的使用体验,有时候觉得可以交付了,但 agent 还在打过来打回去。你们怎么定义 agent 之间的对抗强度?太宽松肯定不好,太严格会无限循环。

择因:我们不会假定所有的用户生产场景,所以先把这套框架抛出来,用户可以自己去定停止条件。至于怎么定,可以通过 Skill,让 agent 根据用户对停止条件的倾向主动总结成 skill,下次运行任务就可以作为判断标准。这个 skill 肯定是千人千面的,不是我们来概括。随着用户长期使用,agent 会越来越懂用户。

我们在 M3 训练中也加入了类似数据,让模型具备主动性,去总结之前的轨迹,根据用户的反馈去提炼 skill,让工作更加可观测。随着模型能力提高,我们可以做得越来越多。

APPSO:MiniMax Code 的一大特点就是 agent 之间上下文隔离,很反直觉,你们是怎么想的?

择因:agent 上下文分为三部分:用户请求、环境里的生产资料、模型执行轨迹。比如当 agent 执行出了错,会把犯的错记下来,但这个记录对另一个 agent 可能是有害的。当上下文变得臃肿,这些轨迹一定会污染别的 agent。

长程 agent 任务跑出几个小时后,几乎全部的上下文都是执行轨迹,所以我们要隔离这一部分上下文。做这个设计就是因为我们预期 agent 会运行很久,既然大部分的信息都是不需要的,为什么不隔离?

APPSO:同时执行几个任务,通过微信、飞书跟 MiniMax Code 查询也不会「串台」,这个体验很独特,是怎么做到的。

择因:你可以理解为在 L-W-V 之外还有一个 IM agent。每个 agent 都有各自的启停触发,IM agent 的启动就是你给它发一条消息,它再去检查正在工作的其它 agent。

我们还有一些更宏大的交互层面的想法,就是所有功能都可以通过说来实现:目前的 agent 产品,比如 Cursor 还有代码编辑界面;豆包或其它 agent 还有各种具体功能按钮,比如新建任务、创建 skill、导入文件——我们觉得这些界面和按钮,以后都可以消失,你想让 agent 做什么只需要跟它说就行。

img 6a264f321cad9

没有壁垒,全是共识

APPSO:为什么 Anthropic 一天到晚说自己模型多危险,作弊、耍小聪明?是模型没对齐好还是产品 harness 做的不够 robust?

择因:我觉得可能只是 Anthropic 在宣发上的倾向。从个人体感对比,GPT 5.5 明显比 Anthropic 模型干活更彻底,更具有主动性,在真正生产上就是最好的 agentic 模型。它完全不绕弯子,不耍小聪明。

Claude Code 泄露过一版源代码,Codex CLI 也是开源的,你会发现这两家公司在 agent 产品上的倾向性完全不同。Anthropic 就是不信任模型的,他们就是假设模型会出各种问题,于是在各处增加约束。OpenAI 提出 harness 概念更早,你去看 Codex 其实就是一个循环,非常极简。

一个极简的 agent 框架,驭遵循度极好的 GPT 5.5,实现目前最强的编码和 agent 能力;层层约束的框架,用在 Opus 4.7 上,却出现了黑天鹅效应,在超长任务中也会偷懒糊弄,这是我所看到的。

Agent 和模型是长短板的关系,你的 agent 足够强大,可以榨干模型的能力;相反如果模型足够强大,其实 agent 不需要特别复杂,就直接一个循环,给它工具就能用了。

APPSO:新的 Claude Code dynamic workflows 架构出现了 verifier 的设计,以及官方描述把编排从模型上下文搬到可执行代码层面,跟你们的构思「所见略同」。你觉得这种设计哲学的趋同,是 agent 工程的唯一解,还是阶段性偶然?

择因:目前阶段是比较合理的解决方案。其实开发 Agent 是一个比较神奇的过程,收益可能来自于模型能力变强,而非你的框架变优秀了;当然,也有可能是你的框架比较先进,能让模型完成之前无法完成的任务。目前大家采用 verifier 的方案,也是因为和这个阶段模型的能力水平比较匹配。

相同点上,CC的这套 dynamic workflow 是让 agent 自主决策如何编排一群 agent 运行,这和我们的 Agent Team 设计思想一致。同时二者的载体都是文件,或者说 coding,模型通过文件的方式去编排一群 agent 运行。

而不同点,主要在实现方案和玩法:CC 是让主 agent 编排完成后一次性并行执行大量子 agent,能调度几百次。但是它中途不会回头,和用户的互动主要是在遇到阻塞时候的询问。

我们的 Agent Team 在主 agent 编排完成的情况下,用户和主 agent 都能在执行的任意时刻介入进行调整,用户对 agent 的运行可观测,可以随时和具体的某个子 agent 聊天。同时能随时停止和重新继续。更强调人和 agent 用同种方式编排执行。

能确信的是,即使工作形式上类似,实际上还是有很多细节不同,可能是完全两种不同的东西。在 agent 时代,大家开发效率很高、迭代很快,但是决定胜负手的还是所有的细节。模型变快了,但我们得慢下来去知道所有的信息。

img 6a264f62e5f5d

APPSO:你怎么看业内有种说法,就是 Anthropic 研究极强,模型很厉害,但他们的工程能力很差,甚至他们自己都说产品是 100% vibe coded。

择因:可能他们内部用的是好东西,只是没把最好的版本给放出来,所以之前泄露的 Claude Code 代码有很多非公开功能。

Harness 在四月份成为了共识,但我们也需要等会用 harness 的新模型出来,比如 M3,这样的产品才是饱满的。一个例子是去年 skill 提出时,当时 Sonnet 4.5 使用 skill 的效果跟后来的 4.6 差距极大——所以,你需要一个懂 harness 的模型才能把它玩得转。我觉得今天整个圈子共识形成得太快了,模型还没有跟上。

APPSO:所以给模型自由度,它其实能做得很好;但如果用人认为合理的架构去框住它,效果不一定好?人类的组织架构方式、对于该如何工作的想象力,是否制约了 agent?

择因:也不一定,现在还为时尚早。多 agent 确实是最近的大热点,大家都在做各自的早期尝试,包括我看到 Slock 那种把几个 agent 拉到一个群聊里的组织方式,都很有意思。

MiniMax 的倾向是人和 agent 应该拥有相同操作权限。在模型能力还没有达到顶尖的前提下,加各种约束、用现有的组织架构去编排它,肯定是为了让它工作的更好。

这里面当然有人性的考虑,你用人能理解的组织架构去编排,看 agent 给你干活,确实给你带来很强的情绪价值。但是从效率维度评价,就不一定合理。比如今天影视工业用人能理解的工作流去编排生成过程,比直接让人剪贵得多。

APPSO:DeepSeek 最近在招人做 harness,做 agent 了,很明显是发力了。你怎么看?

择因:我觉得模型企业做 agent,肯定不是为了做而做。最根本的是 agent 能力跟模型能力实现百分百契合,甚至放大。模型在自己的 agent 里能遵循自己的 harness,用户才能真正感受到模型的强大之处。

Agent 对于模型使用量也有好处。一个模型公司如果有了 agent,它的订阅量就会乘以一个系数;有模型但没有 agent,模型使用量就要打折扣。我相信这个逻辑对于 DeepSeek 和其它发力 agent 的公司也是一样。

APPSO:有个 OpenRouter 的数据,Claude 80% 以上的 token 消费用于编程和技术任务,DeepSeek 主要是闲聊和角色扮演。

择因:我觉得模型公司做 agent 会有许多的动机,但最重要的之一,应该是让自己的模型在更严肃的场景里被用起来。

APPSO:之前你们说没有做 Agent 的企业敢说自己有壁垒,现在呢?

择因:大家越来越重视 agent,并且形成共识的速度会越来越快。Skill 用了半年,龙虾一个半月,多 agent 也就一个月。

前几天有篇华人团队发的论文写得非常好。关于 agent 的一切,其实都在这 71 页的论文里了,叫做 Agent Harness Engineering: a Survey——既然 agent 已经能被一篇论文所概括了,你说有没有壁垒?

img 6a264f7ba429c

APPSO:哪个 agent 对你带来极大启发?

择因:OpenClaw,我觉得是对任何模型公司的 agent 团队的一次存在主义危机。为什么一个此前不在模型公司工作,不如模型团队更了解模型的个人,能做出一款世界上最多人用的 agent?

APPSO:你觉得 OpenClaw 哪做对了?

择因:它很多东西做得很细,就比如说连接飞书、微信,里面其实坑很多。它进而影响了整个行业。甚至在 OpenClaw 出来之前,飞书团队还是以 MCP 这种古老方式维护;OpenClaw 出来之后,飞书团队很快就推出了官方 CLI 和插件,这些接口和协议都是面向模型有好的,而且迭代很快。

APPSO:模型公司想要留在牌桌上的最关键因素是什么?

择因:就我们自己来说,一开始就走在全模态路线上,有完整的自研模型,并把它们直接部署到我们自己的原生 agent产品、创作平台、开放平台中。这种复合优势会给模型公司带来更多机会。

同时,为了不掉队淘汰,可能拼的是组织效率更多一点。如果你的组织效率足够高,大家有一个明确的目标,奔着这个目标去执行,这个公司其实就不会掉队。如果内部组织上扛不住压力了,做不出东西来,可能就会发现自己落后了、没法跟上。

APPSO:你说共识会形成的越来越快。之前 MiniMax 的特色现在快变成全行业模板了,你们接下来怎么做差异化?

择因:我觉得需要投入到细节上,虽然共识形成的很快,但谁能把相同的事情做透更重要。

APPSO:国产模型开源是否达到了目标?你觉得今后前沿模型还会开源吗?开源的红利期是否已经结束?

择因:如果你的模型能力足够强,开源不开源取决于团队的偏好与意志。过去两年里中国模型刚起步的时候,作为追随者,开源的确能够更好地体现价值。

我记得很多同行都公开或私底下表达过,如果有一天模型进入价格战阶段,到时候开源的风气可能会有所消减。

全球来看,开源仍是中美之间的最大区别。即便今后权重、训练框架不开源,你仍然可以把你的创新成果通过论文开放给全世界,不一定非得是模型能力。

APPSO:你们怎么看大厂用赛马甚至养蛊的方式做 agent 产品?

择因:就像我刚才提到的,agent 为什么存在,其实很明确的两个点:一是让模型以完全体形态呈现,放大模型的能力,让它被真正用起来,二是代表你这家公司对「模型该怎么用」做的探索。你的 agent 产品应该能闭环到模型训练上。

如果你堆了大量的 agent 产品,里面有多少是和你的模型能力闭环的?有多少能反馈到自己的模型训练当中?几个agent 团队是在整抢资源还是朝着一个大的目标?其实都是未知数。

总的来说,agent 产品要先能在内部使用再推出去。我也看到,目前 B 端 agent 产品的收益更明确,效果更直接,所以不能否认大厂在这方面的投入。

先交学费再上班

APPSO:人们对于对话助理以及 agent,有很多长久的期待,《Her》里的萨曼莎、钢铁侠的贾维斯。几十年前幻想出的东西今天还没实现,我们距离那样的 agent 还有多远?择因:我觉得其实不远。《Her》是聊天陪伴为主,我印象比较深的是和主角一起打游戏,也就是软件打通的层面,现在做的已经不错了;贾维斯的话,其实和现实世界连接更加紧密。这会有点难,但我很乐观,因为我觉得物理世界的交互协议会比代码层面更加简单。本质上,只要模型的多模态能力足够强就可以。

举个例子就是 GPT Image 2,你会发现它的生图能力几乎和现实世界一模一样。可以预见的是,会有一款全模态模型出现,对现实世界的理解能力是极强的。如果这样的模型去操作物理世界,唯一剩下的就是物理世界怎么把接口给 AI 打开。

距离还有多远?我觉得山雨欲来。

img 6a264fac48af3

APPSO:你们自己的工作因为 agent 发生了怎样的变化?

择因:建立在 agent 能力自由、有执行规范,并且有一些严格的约束这三件事的前提之上,我们在 agent 自我迭代,也就是让 Agent 自己开发自己这件事上达到了很好的闭环。你会不断试探它的底线,交给它越来越复杂的任务,它的达成效果越来越好,我们的预期也越来越高,进入了一个非常高的正反馈循环。

以及连接飞书了之后,你跟它聊天、它向你汇报工作,这种体验的情绪价值是极强的。

但最重要的,是我们从过去迫使模型、agent 和我们一起干活,变成我们可以更多深度思考我们的工作,对工作进行抽象和模式识别,形成 skill 和规范——每一个人都变成了更加 senior(资深)的工作者。

APPSO:像你说的,如果 agent 越来越强,甚至自我进化,大部分人类都将无法追上它。那到时候人类应该做怎样的提升才能跟得上时代?新的工作范式会是什么样?

择因:Agent Team 上线后我去了新西兰 10 天,那里没有任何的 AI 和 agent,但我过得很快乐。那么我觉得,到时候或许人类只要去享受 agent 提升的效率带来的便捷性就够了,大家完全可以去干其它更感兴趣、更符合人性的事情。

跟你说个现象:有些大厂开始招高中毕业生参与研学了。基于此我还有一个推演:将来大学本科生毕业之后,可能要「付费再上两到三年班」,成为一个 senior 之后,才能开始上班赚钱。

APPSO:你觉得未来的就业市场会成这样?

择因:这是在当前教育体制下,我回答你「agent 效率高过人类」这个问题的一个推演。这个情况在一开始聊的视频剪辑领域,其实已经发生了。

「付费上班」的意思是,首先你的 token 消费可能最初是由自己买单,等同于交学费。如果 agent 的能力真的全面赶超人类,聪明的公司算笔账都不会再招初级员工,这才是最可怕的。到那时候,你要先成为资深员工,而这个过程可能需要自己付费。

当然这是基于现有的教育体制。那么会发生两种情况,一就是大家享受 AI 带来的效率,去创造更多更有人文情怀的事物;二是教育制度层面或许会发生一些创新。

APPSO:太有意思了。最后有个开放问题:如果你能掌握无限制的算力,训练或推理都行,并且可以以亲民的价格向用户提供,你想做什么?

择因:这个回答和 MiniMax 关系不大。我可能会把它用在推理上。

之前翁家翌提到(很多人也提过),人类的命运是可以被计算的:你的基因序列、倾向性、性格、激素水平可以测算;你的家庭条件,父母对你的影响(通过语言和肢体动作)也可以计算;你所处的环境是可量化的,小城市还是大城市、教育水平如何等等——在集齐了这些要素之后,每个当下的人的后续行为都可以预测。

我不是要用这个去预测别人,我希望它成为每个人的分身,可以把我的一切过往经历和生理资料都给它,在遇到决策点时去跟它讨论。

我之前是一个美团程序员,我可以跳槽去互联网公司或者考公(计算机还挺吃香),但这些决策更多因为我的过往认知。但是否存在一些我想不到的可能性,能够被建模、预测出来?

这就是我想做的,我觉得这才是真正解放人类的一环。人有生老病死,我们认为人生是一条单行线。但其实每个分支点都可能展开不一样的平行人生。

以及前面这些没有考虑意外。意外反而是最大的、不可预测的。我希望我做这个东西能够拯救因为意外而导致所有要素不再成立的人。从「肥尾效应」的角度来看,小概率事件才真正支配了我们大部分时间。它能让我们更多的关注点放在这些小概率但颠覆性的事件上,因为大概率的事件是能被算出来的。

APPSO:有点《少数派报告》《超验骇客》,所以你会希望你的每一步都走对吗?

择因:不一定。我更希望能知道我在认知之内能做什么选择,认知之外能做什么选择。

认知之外的就是惊喜。我想做的东西,对你不就是个惊喜吗?

img 6a264fcce431f

2026-06-08 11:59:44

爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。

过去 48 小时,对于 Windows 电脑市场来说可谓地震不断——

不是微软要发 Win 12 了,也不是苹果重新内置 BootCamp 了,而是英伟达要造消费级 CPU 了。

1 surface and

图|Microsoft

更重要的是,老黄插手 CPU(SoC)领域,可不是来和英特尔、AMD 和苹果分蛋糕的……

他是来掀桌子的。

nvidia food 2

图|YouTube @Nvidia

在刚结束的微软 Build 与英伟达 GTC 显卡技术大会开幕式上,我们见到了来自英伟达的「终极 PC 解决方案」: RTX Spark N1X 处理器。

老黄期望通过 RTX Spark 打造的电脑很简单:

造出目前最全能、最智能、最面向未来十年甚至二十年 AI 潮流的终极 Windows 全能本。

支撑英伟达这一设计的根本逻辑,是老黄在 GTC 开幕演讲上的一个大胆判断——

面向人类用户设计计算产品的时代已经结束,未来我们应该面向智能体(intelligent agent)的需求设计计算硬件。

2 agent

图|YouTube @Nvidia

下一个 AI 时代属于智能体

开场不久,介绍过 AI 技术如何塑造了当下的产业经济之后,老黄就拿出了他本次演讲的核心观点:

相比单独使用某个 LLM(大语言模型),智能体将是下一个阶段我们使用算力的主要方式(a new kind of computing pattern)。

这个核心观点如此重要,以至于老黄在演讲的前中后期反反复复提起这一页 keynote,将它重复播放了很多遍。

整个演讲上公布的新硬件——比如正式投产的 Vera Rubin 计算平台、企业级 AI 工具包、底层模型等等,全都是围绕着这个核心理论而设计的。

3 the rack

图|YouTube @Nvidia

根据老黄的介绍,智能体之所以能够成为下一阶段的核心算力使用方式,原因主要有 4 个——

1:解放用户生产力

过去几年里,单纯的生成式 AI(Generative AI)虽然能力得到了很大的提升,但并没有拓展出非常多的使用场景。

即使它可以画图、做视频、直接制作各种文件,但本质交互方式依然是用户问一句、AI 答一句。

智能体则不然——它的运作模式中包含「观察、推理、规划、使用工具」的闭环能力,这种模式让人类用户从工具操作者进化成了工具指挥者,可以被看作是一种形式的生产力解放。

2:减少隐性资源消耗

除了自身的运行模式之外,智能体还会彻底改变过去半个多世纪中,人类与计算机的核心人机交互模式

换言之,智能体将曾经需要手动打开程序、点击工具和操作的流程后置了一步,让人的工作从「动手」变成了「动口」,用解释意图(intents)取代具体的操作。

这种变化的意义,在于它结束了「人学习和适应软件」的时代。而一个「软件学习和适应人」的阶段,将会节省大量人类学习和练习使用软件所需的时间资源

3:无视物理数量限制

最「大力出奇迹」的优点是,智能体不会像人类一样,受到各种原因导致的数量限制。

在演讲中,老黄列举了几个例子:AI 编码智能体的出现,让 GitHub 上的代码提交量在 2026 年初同比近乎翻了三倍。

英伟达内部也计划通过部署「数十万个 Cadance 超级智能体」,将芯片设计验证的耗时从数周缩短到数小时。

换言之:只要算力资源允许,智能体就可以将单个人类的能力「超级加倍」,让生产力获得指数级放大。

4:比 LLM 更万能

相比传统 LLM,智能体还拥有一个非常具体的优势——普适性。

智能体的运作模式(模型 + 外壳 + 工具 + 运行环境)在所有应用场景中都是通配的,这种强大的通用性让它可以无孔不入。

比如大规模的云端 SaaS 服务、个人电脑部署、自动驾驶和人形机器人底层系统等等。

也就是说,智能体是 LLM 的一个「万能接口」,它自己就是完整的工具组件、可以直接嵌入具体的生产环节里,不需要人类在中间辛苦地做「回答搬运工」。

4 useful AI

图|YouTube @Nvidia

基于以上四点论据,老黄指出了一种「面向智能体」的算力设计思路:

过去四十多年,所有计算硬件都是围绕人类的需求设计的,但智能体的世界以纳秒计算、对于各种资源(比如内存和电力)的需求模式和人类截然不同。

在这样的大背景下,老黄宣布了新一代全栈 POD 超级计算平台「Vera Rubin」的正式投产:

5 vera rubin production

图|YouTube @Nvidia

相比年初在 CES 上首次介绍 Vera Rubin 平台,老黄在演讲中再次强调了这一代架构「专门为智能体设计」的属性。

尤其最新的 Vera CPU,就直接打上了「CPU for Agents」的标签——这颗 88 核心 176 线程的处理器的主要工作,用老黄的话说,是一位「指挥家」。

换言之,Vera CPU 主要控制智能体的调度、工具调用、内存和上下文管理,负责将 Rubin GPU 的巨量算力以最高效率、最低空置、最快速度的方式调度起来:

6 cpu for agents

图|YouTube @Nvidia

在此基础上,其他机柜组件—— BlueField-4 DPU、NVL72 交换机、ConnectX-9 SuperNIC 网卡、Spectrum-6 以太网交换机等等,才能和 Vera Rubin 共同构成这套「面向智能体」的算力解决方案。

7 whole stack

图|YouTube @Nvidia

但就像前面说的,老黄除了公布 Vera Rubin 投产之外,同时也将这个「AI 的未来属于智能体」的观点投向了一个更偏向消费电子的领域—— PC。

给智能体设计的电脑

之前提到,老黄今年 GTC 开幕演讲的主旨其实就一句话:

给人类用户设计硬件的时代结束了,我们下一步要面向智能体设计硬件。

但智能体的使用者不止 Oracle、OpenAI、Anthropic、AWS 这些企业巨头,个人 AI 用户的数量同样不可忽视。

为了占住极为分散但规模庞大的 C 端市场,老黄在今年的演讲中公布了英伟达首款面向个人消费市场的 CPU 产品—— RTX Spark 超级芯片。

8 N1X chip

图|YouTube @Nvidia

老黄对 RTX Spark 首型号 N1X 的介绍相当动情:「它集合了我们 33 年来的全部技术经验,因为它支持所有英伟达已有的技术栈」。

与苹果的 Apple Silicon 思路类似,RTX Spark N1X 是一块集成 CPU、GPU 和统一内存的 ARM 架构 SoC,采用台积电 3nm 工艺制造,CPU 与联发科共同设计。

9 RTX Spark chip

图|Nvidia

尽管用着上一代 Grace Blackwell 平台,而非最新的 Vera Rubin,RTX Spark N1X 依然可以实现最高 1 PFLOPS(一千万亿次浮点)的 AI 算力。

根据英伟达工程师的介绍,N1X 的整体性能与 RTX 5070 笔记本接近,相比早期泄露的「与 M3 Max 跑分近似」又有了一些提升:

10 N1X specs

图|YouTube @Nvidia

在产品形态方面,RTX Spark 最主要的平台将会是 14-16 寸的笔记本,合作方也是那几个熟悉的巨头——联想、微软、惠普、华硕等等。

其中当属英伟达与微软的合作最为密切,毕竟 RTX Spark 是要运行 Windows on ARM 的。

而老黄的 ARM 处理器能否追上苹果,微软是其中不可或缺的因素。

相应的,微软也在演讲后更新了搭载 RTX Spark 的 Surface Laptop Ultra 预告片:

11 new surface laptop ultra

图|YouTube @Microsoft Surface

而相比高通的 ARM 架构笔记本,RTX Spark 还有一个得天独厚的优势:它支持所有英伟达已经有的技术,从光线追踪到 DLSS,再到 Cuda 加速和 TensorRT。

换言之,RTX Spark 笔记本不仅有 Win on ARM 上相对优秀的游戏体验,更是能够在本地 AI 工具加速之类的严肃场合提供「货真价实的生产力」。

12 vast support

图|YouTube @Nvidia

更重要的是——按照老黄的说法—— RTX Spark 所驱动的笔记本、小型主机和台式机都是「为智能体操作而设计」的。

除了 Windows 本身和软件商之外,甚至连 Adobe 都宣布将会为 RTX Spark 彻底重构 Premiere 和 Photoshop:

13 adobe opt

图|YouTube @Nvidia

就拿 Premiere 来说,Adobe 将会在 RTX Spark 电脑上带来一套全新的、以指挥智能体为主的交互模式,以及更多的 MCP 支持

再大胆一点设想,所有剪辑师都熟悉的「时间轴式 UI」很有可能在智能体时代被一个多模态指令框所替代——

听起来很酷,也很可怕。

14 new premieres

在 RTX Spark 笔电上运行 Premiere Pro|Tom’s Guide

换言之,AI 不仅重塑了硬件的设计方式,也终于开始重塑一些已成定局十多年的软件 UI 交互规范了。

RTX Spark 的应用场景也不止笔电,在老黄的 GTC 开幕演讲与当天稍晚些的微软开发者 Build 大会上,我们看到了很多以此为基础的小型主机平台。

就比如这个长得神似 Xbox 的微软 RTX Spark Dev Box:

15 MS rtx dev kit

图|Microsoft

AI 需求塑造物理世界

纵观老黄的整个 GTC 演讲,以及同期召开的 COMPUTEX 和微软 Build 大会,我们可以明显地感受到:

AI 从「生成式」向「智能体」的转变,将会重塑人们使用计算机的主要方式,并且这种重塑也反过来影响了计算硬件上下游的设计和形态。

换言之,英伟达不仅定义了下一个 AI 时代的核心问题:「什么是生产力 – 是智能体」,更是为自己的观点拿出了一套相当具有说服力的配套产品。

16 series of product

图|YouTube @Nvidia

而 RTX Spark 的目标,是让新时代的全能本既要本地跑模型,又要兼顾生产力和娱乐——

毕竟支持 RTX 和 Cuda 对于 Windows on ARM 一直是个老大难问题,直到英伟达亲自下场。

只不过在为下一个 AI 时代催生新硬件感到兴奋的同时,我们也需要理性地看待 RTX Spark N1X 处理器:因为它并不是一个非常新鲜的东西

17 DGX spark hands on

还记得去年的 DGX Spark 吗?里面的「GB10 超级芯片」基本上就是 N1X 的先行版本。

从芯片刻字上看,老黄在 COMPUTEX 上展示的 N1X 生产周期甚至是 2024 年,早期泄露跑分接近 2023 年的 M3 Max 也就不意外了。

18 N1X production

图|YouTube @High Yield

虽然所有消费级产品都要等到今年秋天,但看到 RTX Spark N1X 的这些零星信息,也很难不让人微微担心——

一颗 CPU 两年前、GPU 一年前且不满血的 SoC,真能为未来 10 年 20 年的智能体需求准备好吗?

尽管 N1X 既没用上最新的 Vera Rubin 架构,也不如今年的骁龙 X2 Elite Extreme 甚至去年的 AMD Strix HALO,但它标志着一个开端:

一个芯片优先考虑智能体需求、并顺势开始影响操作系统、软件程序,直至硬件商品形态的时代的开端。

至于究竟谁能代表 AI 时代的操作系统,微软选择和英伟达联手,「再给 Win on ARM 一个机会」,明显是意识到了自己被 macOS 和 Linux 夹攻的困境。

19 surface ultra front

图|Microsoft

然而成也 Win on ARM,败也 Win on ARM —— RTX Spark 主动带来全套的英伟达技术适配,并不能解决 Win on ARM 在其他体验上的长期瘸腿。

毕竟一个足够好的面向 AI 的操作系统(比如 macOS),即使它自己不倾向于开放,也会有用户通过逆向工程的方式帮它开放。

而在这一层上,RTX Spark + Win on ARM 所以立足的基点,就显得不是那么稳固了。

2026-06-08 08:40:29

🤖

Gurman:从「AIMLess」到 WWDC 大改版,苹果用两年时间重建 AI 战略

📱

爱范儿已抵达苹果总部

🚗

字节跳动澄清:没有造车计划

🤖

曝 Codex 将整体并入 ChatGPT

🚀

Google 向 SpaceX 租用每月 9.2 亿美元 AI 算力

🤝

英伟达与 SK 海力士达成多年期合作,共同开发 AI 工厂下一代内存

🚙

本田在华销量连续两个月接近腰斩

🚗

高通汽车业务单季营收达 13 亿美元

🤖

京东与腾讯据称将围绕 AI Agent 合作

☁️

全球首个预制算力中心底座在青岛投用

💰

本源量子完成近 30 亿元 Pre-IPO 轮融资

💡

心理学家:把认知工作外包给 AI,会「失去对大脑的控制」

📱

小米 17T 系列今天发布

👓

2350 元,加南 Kannan K2 智能眼镜发布

🚙

东风发布无人物流车品牌 OpenVAN

🚗

曝本田 HRC 正开发更硬核的思域 Type R

🤖

OpenCV 5 发布,原生支持 Transformer 与视觉语言模型

🥤

瑞幸回应拿铁去冰不满杯,点单页增加提示

🛍️

精品咖啡品牌 Seesaw 被申请破产清算,全国门店仅剩 34 家

🎥

《玩具总动员 5》Taylor Swift 歌曲打破多平台首日纪录

🎬

AI 起源纪录片《大概没什么可担心》将在 Tribeca 展映

Gurman:从「AIMLess」到 WWDC 大改版,苹果用两年时间重建 AI 战略

d9f577f5 7321 4eca 8d26 cc0a80820435

苹果将于北京时间 6 月 9 日凌晨召开 WWDC 2026,带来其史上规模最大的 Siri 与 AI 功能更新。

彭博社记者 Mark Gurman 在昨晚发布的 PowerOn 新闻通讯透露,苹果在 AI 领域经历的一段艰难时期。苹果内部 AI 团队曾被戏称为「AIMLess」,折射出外界对其 AI 方向感的质疑。Apple Intelligence 1.0 的失利,叠加竞争对手的快速推进,迫使苹果高层于 2025 年初召开秘密会议,启动整改。

此后,Vision Pro 创始人 Mike Rockwell 接管 Siri,软件主管 Craig Federighi 全面主导 AI 战略,前 Google 和微软工程高管 Amar Subramanya 加入负责模型研究,前 AI 负责人 John Giannandrea 则于今年离职。

WWDC 2026 也是 CEO Tim Cook 在正式卸任前的最后一次重大产品亮相。库克此前承认,Apple Intelligence 的失误程度超过苹果地图事件,并在危机后亲自深度介入 AI 规划。

此次大会的核心看点是全面升级的 AI Siri。苹果计划推出可与 ChatGPT 竞争的独立 AI 助手应用,支持类聊天机器人交互,并引入生成式 AI 图像编辑功能。

系统层面,iOS 27、macOS 27、watchOS 27、visionOS 27 等新版本将同步亮相。底层技术上,苹果已与 Google 达成合作,以 Gemini 模型和 Google Cloud 基础设施替换 Siri 原有技术方案。

da gong si

爱范儿已抵达苹果总部

3b35c251 a74e 48cd 864a f046c4d67ce3

爱范儿已经抵达苹果总部,领到了 WWDC26 伴手礼。依然是经典的三件套:帆布袋,水壶和规徽章贴纸。每年苹果发布会的徽章都或多或少有些剧透,今年则是致敬了苹果 50 周年,满满极客的彩蛋。

有意思的是,这次发布会最期待的苹果 AI 没在这次的伴手礼剧透,届时爱范儿会在现场跟大家分享 WWDC26 最新的消息,敬请关注。

字节跳动澄清:没有造车计划

5e4d21e0 229b 4759 b93b 7ca961e7f971

字节跳动日前发布声明,回应近期将「赛豆」解读为「豆包汽车品牌」或「字节跳动造车」的说法。声明称,相关说法不准确,字节跳动没有造车或推出汽车品牌的计划。

字节跳动同时表示,赛豆不是字节跳动或豆包推出的汽车品牌,字节跳动与赛豆没有股权合作。豆包、火山引擎与汽车行业伙伴的合作,主要是向行业伙伴提供豆包大模型、智能座舱等技术服务,用于提升车载智能交互体验。

此前《晚点 Auto》曾报道称,赛力斯正在推进一个全新汽车品牌的筹备工作,法律主体为刚完成工商变更的「赛豆科技」,并会与火山引擎展开深度合作。

曝 Codex 将整体并入 ChatGPT

d707b1bd 8a63 4c6a 9f7d 0f6a3b1ed663

《金融时报》报道称,OpenAI 正准备对 ChatGPT 进行自 2022 年推出以来规模最大的改版,新版将在未来几周内逐步上线。改版核心是把 Codex 整体并入 ChatGPT,同时接入可画、Booking.com 等外部合作伙伴应用。

报道称,ChatGPT 网站和移动端将加入更多提示词与功能入口,引导用户使用编程工具、图像生成和第三方应用;短期内,用户会看到一个选项,可手动选择由 Codex 还是 ChatGPT 回应需求。

OpenAI 企业产品负责人 Alex Embiricos 解释称,公司进入第二阶段后,目标是把「能帮你在电脑上做任何事情的智能体」推给每一个人。

Google 向 SpaceX 租用每月 9.2 亿美元 AI 算力

1e05b008 08d1 4d5d a70d 300c8559e63c

据 TechCrunch 报道,SpaceX 在 IPO 前披露与 Google 签署新的算力协议。根据文件,Google 将从 2026 年 10 月至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元,使用约 11 万张英伟达 GPU、CPU、内存和相关组件对应的计算能力。

这份协议与 SpaceX 5 月同 Anthropic 签下的算力租赁安排类似,但规模约为后者的一半。Anthropic 当时约定以每月 12.5 亿美元租用 Colossus 1 数据中心可用算力。

Google 对 TechCrunch 表示,这是一份短期过渡协议,用来满足 Gemini Enterprise 和智能体平台超出预期的客户需求。协议还包含退出条款:

2026 年 12 月 31 日后,双方均可提前 90 天通知终止;如果 SpaceX 到 2026 年 9 月 30 日未能交付承诺 GPU 数量,Google 可终止协议或按实际交付数量降低月费。

英伟达与 SK 海力士达成多年期合作,共同开发 AI 工厂下一代内存

13fcc3b9 df79 44b4 81d8 389962f424d0

当地时间 7 日,英伟达与 SK 海力士官宣建立多年期技术合作伙伴关系,围绕全球 AI 工厂所需的下一代内存展开联合研发,并将 AI 技术应用于半导体芯片的设计与制造。

英伟达 CEO 黄仁勋表示,AI 工厂是下一轮工业革命的引擎,先进内存对其性能至关重要;SK 集团会长崔泰源称合作体现了双方多年协同的深度。

本田在华销量连续两个月接近腰斩

据界面新闻报道,本田中国 6 月 5 日发布的数据显示,5 月本田在中国的终端汽车销量为 28279 辆,同比下降 48.68%;今年 1-5 月累计销量为 173344 辆,同比下降 32.47%。

这是本田在华销量连续第二个月接近腰斩。4 月本田在中国市场终端销量为 22595 辆,同比下降 48.28%;今年 5 月,本田在华销量再次不足 3 万辆。同月,蔚来、小鹏、小米、问界、理想等多家中国新能源车企交付量均超过 3 万辆,零跑交付量超过 8 万辆。

广汽本田计划从 2027 年开始逐步开启新品投放节奏,推出覆盖燃油、混动、新能源的 3 款全新车型,其中包括基于中国专属新能源平台打造的自研车型,并引入华为、Momenta 等本土供应商补齐座舱和智驾能力。

高通汽车业务单季营收达 13 亿美元

398b0f7c 921d 45c3 8ad4 57b1c816fcc6

高通日前在无锡举办第四届汽车技术与合作峰会,披露其汽车业务 2026 财年第二季度单季营收达 13 亿美元,同比增长 38%。按年化口径计算,高通汽车业务收入已超过 50 亿美元,高通 CEO 安蒙预计到 2026 财年结束时突破 60 亿美元。

本次峰会上,高通继续把汽车业务从座舱芯片扩展到舱驾融合和车端智能体平台。高通中国区董事长孟樸称「2026 年是智能体之年」;

高通汽车事业群总经理 Nakul Duggal 表示,智能体 AI 从三到五年前的概念逐步进入现实,舱驾融合架构可以让统一底层平台打通车内外传感器和硬件资源。高通当前汽车芯片主线覆盖三个价位段:

高通还与卓驭科技联合发布基于 8797 的下一代舱驾融合域控制器,并和诚迈科技、斑马智能、德赛西威、中科创达等六家公司共同启动「车端人工智能 Claw 生态计划」。

京东与腾讯据称将围绕 AI Agent 合作

据钛媒体报道,京东与腾讯近期将围绕 AI Agent 展开合作。报道称,京东的商品供应链与履约服务体系,将与腾讯的入口资源进行对接。

这次合作的具体方向,是把京东 AI Agent 接入更靠近用户入口的场景。腾讯近期在 AI Agent 上推进多个项目,手机厂商方案包括华为、小米、OPPO、vivo 等。另有消息称,腾讯已接近启动微信 AI 助手的开发测试。

京东侧的基础能力来自商品供应链、全域零售数字化和电商履约体系。报道称,京东 AI Agent 已与华为、OPPO、荣耀等主流终端厂商对接;通过 A2A 合作,用户可在终端原生智能体内提出购物需求、获取商品信息,再由京东履约与服务体系承接。

全球首个预制算力中心底座在青岛投用

76af208e 9f93 4a03 9991 1288d15f317a

据央视新闻报道,全球首个预制算力中心底座 6 月 6 日在山东青岛正式启用。这类底座相当于算力中心的能源枢纽,负责为数据中心提供持续稳定的电力;央视称,相比传统算力中心底座,该方案可节约近 70% 施工周期。

这套设备外形接近集装箱,长约 53 米、宽约 41 米,占地约 2200 平方米,减少超 30%,整体成本下降 20%,最快 5 个月完成施工,土建成本节约近 80%;通过绿电直连和储能调控,可实现 100% 绿电消纳,并让 Token 用电成本降低约 30%。

本源量子完成近 30 亿元 Pre-IPO 轮融资

据上证报消息,本源量子近日完成近 30 亿元 Pre-IPO 轮融资,投前估值达到 210 亿元。报道将其称为国内估值最高的量子计算公司。

本轮融资历时 30 天完成,由中国兵器集团领投,增资 5 亿元;中科育成投资作为老股东跟投,再次增资 3 亿多元,累计持股超过 5%,位列公司实控人之后,为第六大股东;华民投新增为股东单位,出资 2 亿元。

参与方还包括山东省、江西省、河南省等省级政府投资平台,青岛市级政府投资平台,以及上市公司等多元机构 LP。

💡 心理学家:把认知工作外包给 AI,会「失去对大脑的控制」

f08f261d c544 44cc 81da be79ff75fe01

据 MIT Technology Review 报道,加州大学欧文分校心理学家 Gloria Mark 在 SXSW London 接受采访时讨论了数字技术和 AI 对注意力的影响。她指出,人们已经在很大程度上「失去对注意力的控制」。

Mark 的长期实验显示,2003 年用户在切换到其他任务前平均能专注约 2 分半钟;2012 年降至约 75 秒;2014 年至 2020 年的研究中进一步降到平均 47 秒。她还在实验中看到,注意力快速切换与压力上升存在直接相关。

她对 AI 聊天机器人更担心的部分,是「深度处理」被外包。Mark 表示,当人主动评估、总结和理解信息时,会更可能学习、理解和记住它;

如果把写作、总结、评价交给 ChatGPT、Claude 或 Gemini,人就把认知工作交给了 AI。她还把问题延伸到合成陪伴产品,认为顺从型机器人关系会削弱人维持真实关系所需的情绪能力。

她建议人们重新思考与 AI 技术的关系:读完整本书而非只看摘要;能当面见朋友时尽量当面;在熟悉环境里减少对 GPS 的依赖。她认为,努力本身会带来更深层的满足感,这些例子也是对注意力、记忆和情绪能力的重新训练。

hao chan pin

小米 17T 系列今天发布

5a3c35df d9e2 4749 80c0 bbe3251eb5ca

小米 17T 系列国行版将于今日发布,包含小米 17T 和小米 17T Pro 两款机型,官方定位为「全能影像旗舰」。博主「体验 more」昨日曝光了两款手机的主要规格。

2350 元,加南 Kannan K2 智能眼镜发布

b08b7ff2 302a 48a8 b2ba 2e61d3447b76

加南科技发布 Kannan K2 智能眼镜,售价 2350 元。这款产品重 25.8 克,采用欧洲进口超轻尼龙材料,官方称镜框面向亚洲脸型设计,耳挂最薄 5.5 毫米。

配置上,Kannan K2 搭载 3200 万像素摄像头,光圈 f/2.4,支持 4K 30FPS 视频拍摄。

东风发布无人物流车品牌 OpenVAN

0bc7223e 5ca6 4c5f 9a78 6342482b8120

东风汽车周六正式发布无人物流车品牌「东风 OpenVAN」,同时亮相四款全场景无人物流车产品。

据悉,东风 OpenVAN 使用东风与九识智能自研的大模型智驾方案「九识智驾 Zelos Inside」,官方称已有 1.3 亿公里真实路况验证。车辆的刹车、转向和供电均配备双套系统,并通过 5G 低时延技术支持线上看管多台车辆、自动测算路线和全天候运维。

四款车型覆盖不同载重和场景:

曝本田 HRC 正开发更硬核的思域 Type R

4c9e0ca5 edec 4fdc 88ba 6874b55f4d71

据 Motor1 报道,本田赛车公司 HRC 总裁渡边康治透露,本田正计划把思域 Type R HRC Concept 概念车推向量产。他在 5 月的 Type R 车主活动上表示,新车距离推出已进入「100 天级别」倒计时,目前仍在开发阶段。

报道称,本田正在铃鹿赛道测试,岩佐步梦、佐藤琢磨和大津弘树等本田车手已经参与开发。测试车前脸伪装较多,报道称保险杠、翼子板、前唇、侧裙和尾翼都会变化,前翼子板采用类似 Super GT 的宽体方形轮拱。

底盘和悬架方面,佐藤琢磨提到测试车的车身刚性和悬架硬度,加宽前翼子板可能对应前后不同规格轮胎,以增强前轮抓地力。渡边康治还表示,概念车上的部分零件会在美国以官方后市场配件形式销售。

OpenCV 5 发布,原生支持 Transformer 与视觉语言模型

8163964b 32b1 49a2 ad41 b759a382bf7a

OpenCV 团队本周正式发布 OpenCV 5。这一版本对这个已有二十多年历史的计算机视觉库做了架构现代化,重点更新 DNN 引擎、ONNX 支持、硬件加速层、Python 集成和 3D 视觉能力。OpenCV 5 的主要变化包括:

pin pai

瑞幸回应拿铁去冰不满杯,点单页增加提示

6df17bbe b5a5 4b6c 8a01 5404a6fd4abd

第一财经报道,上海消费者反映瑞幸「超大杯拿铁去冰后仅半杯」后,瑞幸咖啡点单页面已增加「去冰可能不满杯」的小字提示。

报道提到,涉事消费者在门店询问后得到的答复是「公司标准配方」:去冰后不会额外多加牛奶或咖啡。

第一财经随后以消费者身份咨询北京西城区多家瑞幸门店,有门店店员表示,拿铁类去冰会补牛奶,出品标准是距离杯口 1cm,不应出现半杯有余的情况;如果遇到明显不满杯,可凭订单退款。

精品咖啡品牌 Seesaw 被申请破产清算,全国门店仅剩 34 家

据蓝鲸新闻报道,精品咖啡品牌 Seesaw 的运营主体上海西舍咖啡有限公司新增多例破产审查案件,申请人分别为上海琉璃工房玻璃艺术品有限公司与上海玛露实业有限公司。

两名申请人均以该公司不能清偿到期债务且明显缺乏清偿能力为由,向法院申请对上海西舍咖啡有限公司进行破产清算。

门店端也在收缩。窄门餐眼数据显示,截至 5 月 13 日,Seesaw 全国在营门店为 34 家,其中浙江 7 家、上海 6 家、江苏 4 家;这一数字较 2023 年 3 月高峰期的 135 家少了超过 100 家。

hao kan de

《玩具总动员 5》Taylor Swift 歌曲打破多平台首日纪录

4e5f3f15 9eb3 485d 9ef3 b8e1fe74b34e

据 Deadline 报道,Taylor Swift 为《玩具总动员 5》创作的歌曲《I Knew It, I Knew You》已经成为 Spotify 历史上女性艺人单日播放量最高的乡村歌曲。

这首歌还成为 Apple Music 2026 年播放量最高的乡村单曲,并打破 Apple Music 基于首日播放量统计的原声带单曲历史纪录。Deadline 提到,音乐视频只在 Spotify、Apple Music 等流媒体平台独家上线,推动粉丝集中前往这些服务观看以 Jessie 为主题的影片片段。

Amazon Music 方面,这首歌也创下 2026 年全球歌曲首个 24 小时最高播放首秀纪录。电影插曲已经先于影片本身形成独立宣发事件。

AI 起源纪录片《大概没什么可担心》将在 Tribeca 展映

197db28e 6091 461a 9d4a 3823a21e56c5

据 Variety 报道,导演 Nick Holt 的纪录片《大概没什么可担心》(AI: Probably Nothing to Worry About)将在 Tribeca 亮相。Holt 表示,影片讨论的范围超出单个产品,指向「一种物种的创造」。

这部纪录片把 AI 的早期发展、研究者、公司和社会想象放在一起,试图解释今天的 AI 系统为何会被描述成新型智能体。标题里的「大概没什么可担心」带有反讽意味,也对应公众对 AI 的兴奋和焦虑。

2026-06-06 10:17:50

13 亿美元:这是高通汽车业务 2026 财年第二季度(截至 2026 年 3 月)的单季营收,同比增长 38%。

年化算下来,高通从汽车上赚的钱已经超过 50 亿美元。高通 CEO 安蒙预计,到 2026 财年结束时,这个数字会突破 60 亿。

要知道三年前,高通的汽车年营收还不到 20 亿美元。

英伟达 2026 财年(截至 2026 年 1 月)全年汽车收入 23.49 亿美元,同比增长 39%。高通光一个季度就赚了英伟达大半年的量。当然,两家的计算口径不同,高通包含座舱、连接、ADAS 全栈,英伟达主要计入自动驾驶芯片和软件授权。

但趋势已经很清楚:在汽车芯片这条赛道上,高通正在拉开与多数对手的距离。

两天前,高通在无锡办了第四届汽车技术与合作峰会。60 多场演讲,70 多家供应商,50 多台展车。

目前,高通正在与上汽大众深化合作,与卓驭科技联合发布下一代舱驾融合域控制器,和诚迈科技、斑马智能、德赛西威、中科创达等六家公司共同启动「车端人工智能 Claw 生态计划」。

「智能体之年」,汽车芯片公司在说什么

高通中国区董事长孟樸在主论坛上说了一句话:「2026 年是智能体之年。」

这不是高通的独家说法。吉利副总裁李传海在 2026 年 5 月公开表达过类似判断:未来座舱不会有固定界面,不需要独立 APP,一个足够强大的 AI 智能体就能读懂用户需求。火山引擎在 2026 北京车展上也发布了 Agentic AI 架构方案。

但「智能体」这个词在汽车行业里到底指什么?

简单说,就是从「你问它答」变成「它替你做」。传统语音助手等你下指令,智能体会主动观察你的状态、判断你的需求、调用车上各种硬件和服务来执行。比如你上车时情绪低落,它不会问「你想听什么歌」,而是直接切到你常听的播放列表,调暗氛围灯,把导航设成回家路线。

要实现这些,芯片端的要求很明确:AI 算力要够大,能跑端侧大模型;传感器数据要能跨域调用,摄像头、麦克风、雷达的信息要打通;推理要在本地完成,不能什么都扔到云端去排队。

高通汽车事业群总经理 Nakul Duggal 在演讲中提到:智能体 AI 的构想在三到五年前还处于概念阶段,现在正逐步成为现实。他认为高通率先推动的舱驾融合架构,让统一的底层平台可以直接打通车内外传感器等硬件资源,智能体框架因此跑得更高效。

这是一个合理的技术叙事,前提是芯片确实有能力撑住这些需求。

img 6a2382eb99b7f

三颗芯片,三个价位段

高通目前面向汽车市场的核心产品线有三条,从定位到能力差异明显:

骁龙 8775(Ride Flex SoC) 是行业里第一颗同时处理座舱交互和 ADAS 计算的单芯片方案。一颗芯片取代过去座舱域控和智驾域控两套系统,高通称系统级成本可降低约 20%。主攻 10 万到 20 万元区间的车型。

8775 于 2023 年发布,到 2025 年底开始量产。目前已获 9 款车型定点,量产搭载的包括极狐阿尔法 T5、阿尔法 S5、东风日产 N6、别克昂科威 L7。峰会上展出的问道 V9 也基于这颗芯片。现场还开放了试乘,让参会者体验记忆泊车和城区 NOA 等功能。

骁龙 8397(座舱平台至尊版) 在峰会展区的存在感最强。斑马智行用它跑了全模态端侧大模型 AutoOmni 的实车方案,中科创达推出了 AquaClaw 车载 AI 智能体,诚迈科技展示了「萤火 Claw」,在端侧实现类似 OpenClaw 的智能体助理体验。东软智行基于 8397 打造的端侧 AI 智能座舱域控产品,已获得多家头部车企定点。

这些演示之所以成立,是因为 8397 和前代 8295 之间的跃升足够大。AI 算力从 30 TOPS 到 320 TOPS,接近 10 倍。CPU 和 GPU 性能提升 3 倍,采用了高通专为汽车定制的 Oryon CPU 架构。8295 时代端侧大模型只能跑 10 亿参数,8397 直接拉到 140 亿。

骁龙 8797(Ride 至尊版) 是当前高通汽车芯片的天花板。单片算力 1280 TOPS,定位 30 万元以上高端车型,支持端到端 Transformer 算法和 VLA(视觉语言动作)模型。目前已获 18 个车型定点,10 款车型已经或正在量产。

最具代表性的量产案例是理想 L9 Livis。这款车 5 月 15 日发布,售价 50.98 万元,搭载骁龙 8797 加两颗理想自研马赫 100 智驾芯片,官方宣称有效算力 2560 TOPS。座舱配了 29 英寸 6K 全景屏、48GB 座舱内存。

峰会上,高通还与卓驭科技联合发布了基于 8797 的下一代舱驾融合域控制器。车联天下基于同一芯片打造的新一代域控也在展区亮相,通过中央计算与分布式边缘计算协同,为驾驶辅助、智能座舱和端侧 AI 应用提供统一计算基础。

img 6a238307eb68f

战场上不止高通一家

高通在座舱芯片市场的份额据行业估计超过 70%,8295 几乎成了中高端车型的标配。但在 ADAS 和中央计算领域,竞争者并不少。

英伟达 DRIVE Thor 单片算力 2000 TOPS,在规格上仍然领先。极氪是 Thor 上车最积极的车企,2026 款极氪 7X、9X 已量产搭载。英伟达与奔驰、蔚来等也有深度合作。在自动驾驶芯片市场,英伟达估计占据约 40% 的份额。

联发科也在进入这个市场。Dimensity Auto CT-X1 是一颗 3nm 制程的座舱旗舰芯片,NPU 算力 46+ TOPS,支持 130 亿参数多模态大模型端侧部署,实测性能超 8295 约 30%。联发科还与英伟达合作开发下一代车用 SoC,首款合作芯片预计 2026 到 2027 年量产。

国内供应商的动作同样密集。地平线在 2026 年发布了星空(Xingkong)系列芯片,BPU 算力高达 650 TOPS,定位中国首款舱驾融合智能体芯片。配套的整车智能体操作系统 KaKaClaw 一并推出。

车企自研芯片的趋势也在加速。蔚来 2026 年初宣布全系换装自研神玑 NX9031 芯片,称单车成本降低 1 万元。小鹏推出图灵芯片,理想的马赫 100 已随 L9 Livis 量产。

2025 年中国乘用车前装舱驾一体计算单元达 156 万台,同比增长近 50%。这个增速说明舱驾融合不再是概念验证,而是进入了规模化部署阶段。高通、英伟达、地平线、联发科都在争夺这块市场,技术路线和商业逻辑各有不同。

img 6a2383189d83d

端侧大模型:从「能跑」到「好用」

端侧大模型上车是 2026 年汽车 AI 的核心叙事之一。

面壁智能的 SuperMate 是目前量产规模最大的方案。模型参数控制在 100 亿以下(MiniCPM 3.0 系列),已搭载在吉利、长安马自达等多款量产车型上。面壁智能 CEO 李大海预计 2026 年底搭载量达 30 万辆。这家公司拿到了 ASPICE L2 级评估,是国内首家获得该车规认证的大模型企业。

地平线的征程 6 芯片平台上,座舱对话模型用了 28 亿参数,语音交互延迟低于 80 毫秒,断网状态下可连续交互 100 轮。自动驾驶使用 70 亿参数多模态感知模型,推理功耗控制在 12W 以内。

工具链的选择对延迟影响很大。地平线的实测数据显示,从 PyTorch 切换到 SNPE 后,推理延迟从 300 毫秒降到 50 毫秒。

高通的 8397 把端侧大模型的天花板推到了 140 亿参数。到了 140 亿参数,车载 AI 够得着多轮对话、多模态理解和任务规划,已经超出语音指令识别的范畴。

但端侧模型和云端模型之间仍然存在能力差距。目前云端的旗舰模型参数量已达千亿甚至万亿级别。车上的 140 亿参数模型更像是一个「够用的本地助手」,复杂推理和知识密集型任务仍然需要云端协同。高通与谷歌合作,将 Gemini Enterprise for Automotive 的云端 AI 与端侧 Snapdragon 方案结合,就是为了弥补这个差距。

汽车芯片的下半场

从 2021 年到现在,骁龙数字底盘解决方案支持中国车企推出超过 300 款智能网联汽车。合作名单涵盖大众、宝马、奔驰、丰田、Stellantis、蔚来、理想、零跑、极氪、长城、奇瑞、东风。

这些数字说明高通在汽车芯片领域的地位已经很稳固。但「稳固」和「不可替代」之间还有距离。

车企自研芯片的动力很充分:降低成本、掌握数据、减少对单一供应商的依赖。蔚来、理想、小鹏都已经在这条路上走出了实质性的一步。联发科和地平线的产品逐渐成熟,也在给车企提供更多选择。

高通的应对策略是把自己从芯片供应商升级为平台公司。覆盖座舱、ADAS 和连接全链路,硬件之上还叠了 AI 框架和开发工具,单芯片和中央计算两条路线都押。「车端人工智能 Claw 生态计划」联合六家企业一起推,也是在试图把生态做厚。

安蒙在 Computex 上提出「计算连续体」的概念:AI 后台持续运行,随时感知、调度资源、做出响应。汽车是这个连续体中最重要的移动节点之一。

这个构想能走多远,取决于两件事:端侧模型的能力爬坡有多快,以及车企自研芯片会走多远。

从这场高通峰会来看,至少供应链这一端已经准备好了。



https://feedx.site

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram