🚀
OpenAI GPT-5 确认夏季登场
👾
OpenAI CEO 回应 Meta 挖人:他们不擅长创新
🎨
余承东:鸿蒙对比其他系统有三大优势
💸
消息称马斯克的 xAI 每月烧掉 10 亿美元
🚗
奥迪回应「取消全面电动化」传闻
🐂
刘强东:京东一年半涨薪七次,去年发了1161 亿工资
💡
亚马逊 CEO:公司将用 AI 代替人类员工
📱
小米多款新品信息公布
🎥
Midjourney 正式公布视频生成模型 V1
🎬
曝三大运营商将全面重启 eSIM
📱
网易云音乐回应邓紫棋重录版歌曲下架
🎶
京东正式宣布进入酒店行业
昨晚,OpenAI 首档官方播客正式上线,CEO Sam Altman 与前 OpenAI 员工 Andrew Mayne进行了深入交流,其中 Altman 还透露了部分新品的发布节奏。
备受期待的 GPT-5 发布时间在本次播客中再次变得明了——Altman 在对话中表示,「可能在今年夏天某个时候发布」。
本月初,Altman 在个人账户上发布过夏季新品的预告信息,称「这个火热的夏天,都给我冲」。据 AI 工程师 Tibor Blaho 和投资者「Chris(chatgpt21)」消息透露,OpenAI 或将在 7 月发布一个大规模模型而该模型有望为 GPT-5。
今年 2 月,Altman 还曾公布了 GPT-5 的发展路线,并表示未来 OpenAI 旗下产品将简化分类:
在 GPT-4.5 发布后,OpenAI 将会推出集成化模型系统,来统一 O 系列模型以及 GPT 系列模型。据 Altman 透露,GPT-5 将作为一个集成了 OpenAI 多项技术的系统进行发布,其中包含 o3 模型,同时 o3 模型将不再单独进行发布。
🔗 原播客链接:https://x.com/OpenAI/status/1935357512011890815
昨日,OpenAI CEO Sam Altman 在和他弟弟 Jack Altman 的对谈中,分享了关于他对未来 5 到 10 年 AI 发展的预测与见解,并对 Meta 挖人做出回应。
Altman 表示,目前推理能力的提升让 AI 逐渐能够像博士一样进行专业领域的复杂思考,而科学家们已经通过 AI 提高了研究效率。因此 Altman 认为,在未来五到十年,AI 将具备更多自主科研能力,甚至能发现新的科学。
对于近期有消息称,Meta 开出 1 亿美元的薪酬挖 OpenAI、Google 等 AI 公司的人才。对此,Altman 回应称,「开心的是,到目前为止,OpenAI 最优秀的那些人都没有接受他们的邀约。」
Altman 表示,自己尊重他们这种有侵略性的态度,以及不断尝试新方法的精神。同时他还预测,如果本次挖人行动不成功,Meta 之后还会继续尝试。
同时,Altman 也对 Meta 这种「公司重心偏移」的行为表示否定,直言「不认为这种方式能建立起一个好的文化。」Altman 强调,「Meta 有很多尊重的地方,但并不认为他们是一家擅长创新的公司。」
对此,Altman 还不忘把 OpenAI 与 Meta 进行对比:「我觉得 OpenAI 的特别之处在于:我们成功建立了一种以创新为核心的文化。」
6 月 18 日,华为终端 BG 董事长余承东发布视频,称「华为鸿蒙系统与其他系统有三大优势」。
余承东表示,鸿蒙拥有「全场景、智能、安全」三大优势:
余承东还表示,鸿蒙从十年前的「小种子」,长成今天的「大树」,离不开大家的支持。
另外,华为将在 6 月 20 日至 22 日举行「华为开发者大会 2025」(HDC 2025),主题为「共建鸿蒙蓬勃新生态」。
据彭博社报道,马斯克旗下的 AI 初创 xAI 目前正以每月 10 亿美元的速度「烧钱」运营,具体原因是其构建的 AI 模型成本已远超有限的收入。
知情人士透露,为了弥补每月「烧钱」导致的资金缺口,xAI 目前计划通过债务和股权融资 93 亿美元,并且据 xAI 的内部人士称,公司计划在接下来的三个月内花费超过一半的资金。
对于上述报道,马斯克则在个人账号上发文称「彭博社的报道在胡说八道」。
报道提到,xAI 旗下的 AI 聊天机器人 Grok 预计在 2025 年将会花费约 130 亿美元。
据分析,目前所有 AI 公司都在为训练 AI 模型而付出巨大的资金投入,并且各公司之间的竞争十分激烈。而 xAI 在收入方面远不及头部公司——OpenAI 预计今年收入将达 127 亿美元,而 xAI 预计仅有 5 亿美元,明年收入或能突破 20 亿美元。
值得一提的是,在 xAI 与 X(原 Twitter)合并后,xAI 将使用 X 的资源进行训练,从而减少数据集的购买。因此 xAI 也乐观地预计其能在 2027 年实现盈利。而据报道,xAI 在今年第一季度末的估值,从 2024 年底的 510 亿美元,增长至 800 亿美元。
日前,据 Autocar 报道称,奥迪 CEO Gernot Döllner 日前表示,公司重新审视了燃油车的生命周期,并计划取消原定 2033 年全面电动化的计划,未来 10 年将继续生产和销售燃油车型。
昨日,奥迪方面发布声明称,公司坚信电动出行的未来,并正致力于达成全电动化产品阵容这一明确的长期目标。
奥迪表示,其注意到全球市场的发展存在明显差异。也因为市场的这种波动性和多样性,要求奥迪在未来几年内,尽可能灵活且稳定的方式提供差异化的产品组合,涵盖纯电动车型(BEV)、插电式混合动力车型(PHEV)以及内燃机(ICE)车型。
奥迪强调,其将持续致力于积极的车型矩阵维护,在 2026 年之后继续让奥迪的内燃机车型对客户保持吸引力,直到它们各自的产品生命周期结束。
奥迪方面还表示:
在当前规划基础上,我们并不排除其他可能性,以确保产品组合始终具备市场所需的灵活性,同时我们也将始终牢牢把握全电动产品组合的长期目标。
值得一提的是,Gernot Döllner 在讲话中透露,内燃机在短期内仍将发挥重要作用,尤其是作为混动车型的基础。
据彭博社援引知情人士消息,国内大模型「六小龙」之一的 MiniMax 稀宇科技计划赴港 IPO。据悉,MiniMax 计划最早于今年上市,并且公司目前已聘请了财务顾问为 IPO 做准备。
值得一提的是,目前 MiniMax 估值约为 30 亿美元(约合人民币 215.6 亿元)。
据信息显示,MiniMax 成立于 2021 年 11 月,于去年 3 月获得 6 亿美元的 A 轮融资,当时估值约为 25 亿美元(约合人民币 179.7 亿元),该轮融资由阿里巴巴集团领投,红杉中国、高瓴资本参投。
近期,MiniMax 还开启了新品发布周,目前已发布全新推理模型 MIniMax-M1 和视频模型「Hailuo 02」。
据快科技消息,刘强东近期在一场分享会中表示:
去年京东净收入 11588 亿,但净利润只有 400 多亿。
刘强东解释称:因为去年京东仅工资就发了 1161 亿,给兄弟们交的五险一金是 180 亿。
刘强东强调:「2007 年至今,京东的五险一金交了上千亿,这些都可以合法地成为我刘强东的财富,可以成为京东的净利润。」
刘强东还称,外包员工是合法的,但京东从来没做。其也表示,自己不想压榨员工,但是行业正常的拼搏精神要有,那他自己一点办法没有,「但是我会给兄弟们涨薪」。
他透露,一年半的时间,京东涨薪七次,再差的人也都涨 50%,P5 以上的员工基本上就是翻倍。
另据新浪财经消息,日前京东集团 CEO 许冉通过采访,公开披露了京东外卖业务的相关信息。
其中,许冉在采访中透露了京东外卖骑手目前的情况:外卖全职骑手已突破 12 万人,预计这个季度末会超过 15 万人;工资待遇方面,北上广深等一线城市,京东全职外卖骑手的人均收入已经接近了 13000 元。
日前,火山引擎 Force 大会公布,字节跳动 Seed 及火山引擎,将与比亚迪锂电池深化合作,通过联合实验室等形式,共同探索 AI for Science 结合高通量实验,加速锂电池研发。
据悉,比亚迪近期发布了兆瓦闪充电池,实现「充电 5 分钟,续航 400 公里」,引发高度关注。
据字节 Seed 方面表示,比亚迪团队在「兆瓦闪充电池」研发初期就引入了字节跳动 Seed 团队打造的电解液 AI 模型框架 BAMBOO,帮助对电解液配方进行快速筛选。
官方介绍,相比于传统试错方法,BAMBOO 能结合实验数据,准确预测电解液的密度、粘度、离子电导率等关键性能,在兆瓦闪充电池研发过程中,快速缩小了实验配方空间,加速了研发进程。
未来,字节跳动 Seed 团队与比亚迪锂电池将共建「AI+ 高通量联合实验室」,并针对动力电池的快充、寿命和安全等问题进行攻关。同时,双方也将探索 AI 技术在电池研发中的更多场景。
另外,字节 Seed 还公布了 BAMBOO 框架相关研究内容:
《BAMBOO-MLFF 机器学习力场》研究论文:https://www.nature.com/articles/s42256-025-01009-7
Github 代码:https://github.com/bytedance/bamboo
《BAMBOO-Mix 配方性质直接预测与生成模型》预印本:https://arxiv.org/abs/2504.18728
近日,亚马逊 CEO Andy Jassy 发布全员信,并在信中大胆地预测了未来几年内,AI 将逐步替代企业员工。
Andy 表示,公司坚信 AI Agent(智能体)将会改变所有人的工作、生活方式。尽管目前很多领域的 Agent 仍未被构建出来,但 Andy 相信,这些未诞生的 Agent 会以十分快的速度来到人类面前。
对于「AI Agent 对于亚马逊的吸引力从何而来」,Andy 则回答道:
Agent 能够让大家减少对基础工作的关注,从而能将更多精力投入到改善用户体验和创造新的体验中。并且 Agent 强大的学习能力、学习速度都能够提升大家的工作效率。
据 Andy 透露,亚马逊目前已有超过 1000 个正在研发或已建成的生成式 AI 服务和应用,同时其还表示,这只是公司最终目标的很小一部分。
而在信中,Andy 大胆表示,未来几年内,亚马逊将会在全公司范围内广泛使用 AI 来提升工作效率,同时还会减少企业员工的总数。
但 Andy 强调,随着越来越多的 AI 和 Agent 诞生,公司将不再需要那么多人力从事现有的部分工作,而更多的人将会去负责其他类型的工作内容。
昨晚,小米集团总裁卢伟冰开启新品剧透直播,与 REDMI 品牌总经理王腾一同,公布了多款新品的具体信息。
小米平板 7S Pro 12.5:
REDMI K Pad:
REDMI K80 至尊版:
卢伟冰还在本次直播中透露,本次发布会还将带来小米手环 10、XIAOMI Watch S4 41mm 版、XIAOMI 开放式耳机 Pro 三款智能穿戴新品。
另外,本次发布会也将发布备受期待的小米 YU7、小米 MIX Flip2等一众新品。
今日凌晨,Midjourney 正式公布旗下视频生成模型 V1,价格为 10 美元/月,并向所有人开放。
据 Midjourney 官方介绍,V1 基于此前的图像模型生态进行打造。
Midjourney V1 操作分为自动和手动两种模式:自动模式下,平台会根据用户生成的图片,自动创建「动作提示词」并让画面运动起来;手动模式则是由用户提供提示词。同时,Midjourney V1 也分为「低动态」和「高动态」两种运动模式。
Midjourney V1 支持最多 4 次的视频内容扩展,每次扩展时长为 4 秒。
目前,Midjourney V1 仅提供网页端使用,每次任务支持生成 4 个 5 秒视频。另外,Midjourney 还将为专业版和超级套餐版用户提供无限生成次数的「放松」模式。
官方表示,在视频模型之后,Midjourney 还将计划进一步开发用于生成 3D 渲染的 AI 模型和用于一切的实时 AI 模型。
日前,荣耀手机正式宣布将在 7 月 2 日正式发布旗下 Magic V5 折叠屏产品。
据此前博主「数码闲聊站」消息,荣耀 Magic V5 代号为「Maybach」。
新机性能方面,配备 4.47GHz 的满血骁龙 8 至尊领先版,支持 66W 有线充,采用 6100mAh 新硅电池(典型值)。
其他方面,新机支持北斗卫星短信,采用侧边指纹,内屏为 7.95 英寸 2K LTPO 屏幕,采用后置 5000 万影像组合。新机配色方面提供绒黑、暖白、曙光金、丝路敦煌四款配色。
另外,本次发布会还将发布荣耀 MagicPad 3、荣耀 MagicBook Art 14 2025 等新品。
6 月 18 日,MiniMax 稀宇科技正式发布旗下视频生成模型「Hailuo 02」。
官方介绍,Hailuo 02 能够生成 1080p 原生视频,并拥有极限物理表现。MiniMax 方面表示,通过邀请测试的艺术家们发现,类似体操这种高度复杂的场景,Hailuo 02 是目前全球唯一一个可以做到的模型。
据悉,Hailuo 02 采用名为「Noise-aware Compute Redistribution(NCR)」核心架构。在同等的参数量级下,新架构使 MiniMax 团队的训练和推理效率提升了 2.5 倍。最终团队把模型的总参数量扩大到了上一版模型的 3 倍。
性能表现上,Hailuo 02 在 Artificial Analysis Video Arena 上排名全球第二,超越 Google Veo 3、快手可灵 2.0、Runway Gen 4 等视频生成模型。
目前,Hailuo 02 已上架海螺视频的 Web、App 以及 MiniMax 的开放平台 API,提供 768p-6s、768p-10s 和 1080p-6s 三个版本。
据新浪科技援引知情人士消息,已经暂停两年的 eSIM 业务,三大运营商将于今年下半年全面放开。
2023 年,三大运营商先后发布公告,暂停受理 eSIM 手表一号双终端业务及独立 eSIM 卡的办理申请。给出的理由是业务维护升级,已办理的用户可继续使用,一旦取消无法再次办理。
知情人士分析称,暂停背后的原因还是因为三大运营商之间有一些利益问题需要解决,如随意切换运营商。据其透露,eSIM 业务预计今年下半年三大运营商会重新放开,「他们正在制定一些行业规范,解决这些问题」。
据报道消息,目前已经有一些运营商在部分城市重启 eSIM 业务。
我们曾在 3 月报道,中国联通 eSIM 专区的 iPhone 专用 eSIM 页面曝光。但目前业务办理的相关网站已空白,无法查看相关信息。
值得一提的是,据此前多方爆料称,苹果将在今年推出超薄的 iPhone 17 Air 产品线,该产品由于采用纤薄机身设计,很有可能取消实体 SIM 卡槽,转而采用 eSIM 设计。
另外,苹果每年的新 iPhone 都会在下半年进行发布,时间节奏与上述爆料的 eSIM 业务重启时间有所重合。
近期,歌手邓紫棋发文称,「与前公司(蜂鸟音乐公司)打了超过六年的官司,期间六年的版税一分没有」,同时还宣布通过合法手段,将专辑进行重录与发行。
而在 6 月 18 日,蜂鸟音乐公司发布声明,称邓紫棋在各大在线音乐平台发布重制版本的行为存在「复制权改编权侵害、信息网络传播权侵害」的法律问题,要求各大音乐平台立即下架涉事重制版歌曲,并要求邓紫棋及其团队 48 小时内删除所有渠道传播的侵权内容。
据《读秒财经》消息,网易云音乐的客服回应上述事件表示,「若歌曲存在侵权的版权方维权的会被下架,同时会积极洽谈版权合作事宜。」
另据天眼查显示,蜂鸟音乐有限公司曾注册多枚「邓紫棋」「G.E.M.」商标,国际分类涉及广告销售、教育娱乐等,其中部分「G.E.M.」商标已注册成功。值得注意的是,目前多枚「邓紫棋」「G.E.M.」商标状态为撤销/无效宣告申请审查中。
6 月 17 日,京东创始人刘强东首次透露公司将要进军「酒旅」行业。昨日,京东方面正式发布公开信宣布,开启「京东酒店 PLUS 会员计划」。
公开信称,京东希望通过新通路的方式为酒店行业提供供应链服务,优化供应链成本,共同把握增长机遇、携手并进,推动酒店行业的健康可持续发展。
计划具体方案方面:
据刘强东 17 日的讲话内容透露,京东还成立了新通路部门,专注发展酒店、餐饮业务。
刘强东称,京东一直以来定义的体验就三个——产品、价格、服务:「我们所有商业模式都比拼的是产品比你更好、价格比你更便宜、服务比你更好」。
昨日,滴滴出行宣布,旗下滴滴顺风车业务已在部分城市试点「顺风车在线真人安全员」功能。
据悉,顺风车安全员在原有「安全专家」基础上进行优化升级,将滴滴安全专家从幕后转向台前,以安全 AI 接力在线真人的方式,全程关注行程安全风险隐患,简化安全工具使用步骤,使行程安全提醒、安全检测更精准,进一步提升行程安全守护能力。
本次功能上线后,车主与乘客双方均可以在滴滴顺风车页面看到并使用顺风车安全员功能。在乘客方面,通过顺风车安全员卡片,可清晰浏览并使用平台一键求助、行程报备、紧急联系人等安全功能。
据新浪电影消息,电影《聊斋:兰若寺》公布「画皮」篇海报。
从海报来看,画面中一面古朴铜镜中映出陈氏与丈夫王大郎相拥的身影,海报上方,画皮妖眉毛微垂,眼中含泪。
据悉,影片改编自中国最杰出的文言短篇小说集《聊斋志异》,由追光动画最强制作。该片将于今年 7 月 12 日中国内地上映。
日前,电影《当哒当:邪视》正式定档 6 月 29 日上映。
该片讲述了小桃的青梅竹马寺仁因为家中发生的一系列谜团前来向其求助,小桃一行人陷入寺仁家的地底神秘空间,一系列的危机与大战也随之而来的故事。
影片改编自日本人气 IP 漫画《当哒当》,由山代风我、阿贝尔·贡戈拉执导,濑古浩司编剧,并由若山诗音、花江夏树等担任主演,已于今年 6 月 6 日在日本上映。
据守望好莱坞消息,电影《时光留声》定档 9 月 12 日北美上映。
据悉,该片改编自本·沙特克创作的同名短篇小说,该片讲述了两个年轻人 Lionel 和 David 在一战期间开始记录同胞的生活、声音和音乐的故事。
影片由奥利弗·赫曼纽斯执导,乔什·奥康纳、保罗·麦斯卡主演;该片入围第 78 届戛纳电影节主竞赛单元入围名单,并在该电影节上进行首映。
大多数想认真阅读的人,都栽在了 PDF 第三页。
剩下的,只能躺进收藏夹,成为「留着以后读」的文件。而随着豆包昨天上线 AI 播客功能,现在,它们终于有了一个更实用的去处。
只要上传 PDF、网页链接、单词或论文,就能快速生成一段双人对话播客:AI 提问,AI 解读,把原本晦涩难啃的内容,讲成一场有逻辑、有节奏的对话。
信息轻了,理解快了,豆包 AI 播客也更贴近当下的生活节奏。我们也将本文用豆包制作成了播客,边听边看体验更佳。
使用方式很简单,打开豆包,点击或者 @ 就可以使用 AI 播客功能,接着上传 PDF 文档,或者添加网页链接即可,不过,遗憾的是,目前还不支持直接输入纯文本生成。
比如我上传了一份最近爆火的苹果英文论文:The Illusion of Thinking。
整篇论文结构复杂、论点犀利,普通人容易被各种术语绊住节奏,读完至少得花上小半天。但豆包播客能够提炼逻辑、编排结构、模拟对话、生成语音,最后还自动配封面、全流程几分钟搞定,完全不需要插手。
响应速度也很快,即传即播,体验主打一个丝滑流畅。
豆包 AI 播客最打动人的地方还在于,它不是一段单向朗读,而是模仿播客中典型的 A/B 双人角色,一人提问,一人回应,不时带点幽默吐槽,节奏灵动,不呆板。
多听几段你会发现,它的内容节奏就很有「播客」范。
开场会有一段快速摘要,提炼要点,接着切入对话,展开解读,通过「疑问—解答」「吐槽—科普」的方式,把本来抽象晦涩的长文本变得鲜活易懂。
让 AI 对话本身不难,但没有人想听两个机器人机械化地聊天。这里面还有很多微妙的细节,除了声音要像人,还得模拟人讲话时常出现的口吃、停顿和插入语等不流畅的表达,才会让我们感到是两个聪明亲切的朋友在对话。
这种互动式的语言表达方式,在心理学上有个名字:Social Presence(社会临场感)。当声音有互动,有节奏、有情绪,你的大脑会更自然地调动注意力,形成参与感。
这也是豆包 AI 播客比传统朗读工具更容易「听下去」的核心原因。
除了论文,我更喜欢把它当成读书工具用。
比如我最近被朋友推荐一本《基督山伯爵》,但纸书太厚,时间太紧。
我随机上传了前六章左右的内容试试看,没想到豆包 AI 播客给了我不小的惊喜,原本我以为它会干巴巴朗读章节,没想到它迅速筛选出开头提到的人物关系,几分钟就带我进入这个庞大的故事世界。
你别说,听完之后,顿时就觉得这本书值得好好花时间精读。
有意思的是,豆包 AI 播客还支持追问书籍的相关内容。
比如听完生成的播客之后,我萌生了想知道这本书结局的念头,只需输入一句「结局是怎样的」,豆包便能结合我之前上传的文档内容章节,判断用户可能没有读过全书,然后自动控制剧透比例。
既交代结局,也不过度透露细节,还会补上一段升华的主题。
值得一提的是,豆包 AI 回答用户提出的问题之后,通常支持二次追问,而在播客的场景下,这个功能设计反而派上了大用场。底下这几个引导式的问题,能够帮助我进一步发散思考,深入理解这本书籍的内容。
哪怕是《道德经》这种晦涩难懂的文本也能讲得明白。聊到原文的时候,可以很明显察觉到,豆包 AI 的语气是带有情绪的,语调会刻意放缓,听起来不那么艰深,反而多了一点真实交流的温度。
互联网打工人的高频痛点,就是报告太多、时间太少。
前不久,互联网女皇 Mary Meeker 发布首份「AI 趋势报告」,长达 340 页,引发业界围观,于是我们也上传了这份报告,试图看看它能不能讲清楚重点。
由于整份报告信息量巨大,以及图表密集,这对豆包 AI 播客的解读能力提出了不小的挑战,但尽管如此,它还是很好提炼出主要的趋势与发展脉络,原本埋在文档里的干货,被转化为通俗易懂的口语内容,既节省了阅读时间,也让复杂信息变得更易吸收。
如果你备考六级还会拼错「Abandon」,那是时候该换种学习方式了。
你还能把豆包 AI 播客当成语言学习工具。我上传了一份英语六级高频词汇 PDF,它没有照本宣科,而是选择重点词讲解,并结合用法、语境、出题规律等角度,像良师益友逐层讲透,也更容易代入。
将播客作为六级备考的辅助材料,实在是再合适不过了。
最近,《李白》这首改编歌曲在舆论场上爆火,评价至今褒贬不一。
我也很好奇,这首歌词如果交给 AI 会得到怎样的解读。结果来看,豆包播客的处理方式相当克制,不情绪化,而是拆解每段歌词的结构和隐喻,这种解读方式,倒是有些像翻书讲故事,反而听出了点新鲜感。
20 年前,乔布斯在斯坦福大学的演讲让人记忆尤深。
在上传公众号网页链接后,豆包 AI 播客功能将这篇精彩的演讲转录成了播客,重述没有套用「鸡汤式」的语言,也没有过度煽情,反而同样是采用提问的方式,更聚焦核心信息本身。
解读过程有条理,也能察觉出 AI 主播里的情绪层次。乔布斯的演讲,我们早就读过、背过,但以这种对话形式重新听一遍,反而有了新的理解。
你只需上传,剩下的交给豆包。
如果你还不知道从哪开始,现在,不妨随手找一份 PDF、歌词、网页、教材扔给豆包试试看。讲真,这可能是你打开 AI 播客的第一个理由,但绝对不是最后一个。
语言,是比阅读更早诞生的能力。医学期刊《神经影像》一项研究显示,爱阅读的人,恰恰对声音也更敏感。
我们可以一边听一边走路,一边听一边做饭,注意力的结构,决定了「听」这种信息传入方式,比看更轻量,也更贴近生活节奏。
但我们每天眼睛盯屏幕的时间已经接近生理极限,将冗长文字信息快速提炼并转换为轻松易懂的形式,正是用户所渴望的,这也是播客这种产品在近几年快速增长的背景。
豆包 AI 播客这类音频产品,实际上是试图用 AI 的拟人对话,去触及我们作为人类最深层、最古老、最根本的部分。用曾打造 NotebookLM 的产品经理 Raiza Martin 的话来说:
这种技术是「人性化」的,就是当你意识到它与你非常相似,以一种不同的方式引起共鸣。
根据 Cartesia 的数据,在最新一届 Y Combinator 创业营中,22% 的 YC 新创公司都在做语音 Agent,从底层模型到垂直 SaaS 形成完整堆栈。语音是极佳的切入点,落地快、连接场景多,更能横向扩张为全栈 AI 产品。
这个趋势在播客领域也已显现。以往优质播客/有声读物需要人工录制生产,写稿、录音、剪辑、发布,一个小时的节目可能要花十几个小时,而现在生成式 AI 可以大幅提升音频内容的生产速度 。
豆包 AI 播客只需要几分钟,能从文档自动生成一段完整流畅的播客 ,语音不露痕迹,逻辑还很顺畅。低门槛、零剪辑、全自动。
播客的门槛,从来没这么低过。但 AI 播客的意义,其实不在于和现有的播客生态竞争,而是让内容以更合适的方式来进入我们的大脑。
不久前我们对话了小宇宙的 CEO Kyth,他提到 AI 生成内容注定会越来越多,用户会更想要独特的、不一样的、有活人感的内容。
所以说,AI 播客要复刻的不只是人类的声音,更重要的是再现人类主播的陪伴感与身份认同。现在,豆包 AI 播客作为一个工具,其实是可以让更多人制作并触达这样的内容。
你听不出它是 AI,却能被它说服,大大降低了收听长篇内容的疲劳感,也就更能理解、记住并集中注意力。
内容没变,姿势变了,效率也就上来了。
上班族可以把行业报告或竞品分析链接发给豆包,瞬间获得一段通俗易懂的播客摘要,在忙碌间隙就能快速抓取关键信息;学生也可以把课程教材要点交给豆包,能听懂的知识,才是真正用得上的知识。
归根结底,所有 AI 产品的长期命题,都是成为用户的使用习惯。
答案或许不是更强的模型,而是越不被察觉的交互。屏幕打断注意力、键盘需要操作,不打扰、不打断、不需要被注意,却一直存在,成了语音作为 AI 「外壳」的独特价值。
作者:李超凡、莫崇宇
今天,Sam Altman 在和他弟弟 Jack Altman 的对谈中分享了关于他对未来 5 到 10 年 AI 发展的预测与见解,谈话内容涵盖 AI 科研、人形机器人、超级智能、OpenAI 设备、供应链等话题,并对 Meta 挖人做了回应。
这场兄弟对谈轻松、温情且充满洞见,也让我们看到了Sam Altman「CEO 模式」之外的另一面。
AI 不止是「科研助手」和效率工具,更能自主发现新的科学:
推理能力的提升让 AI 逐渐能够像博士一样进行专业领域的复杂思考,科学家们已经通过 AI 提高了研究效率。Sam Altman 认为在未来五到十年,AI 将具备更多自主科研能力,甚至能发现新的科学。
人形机器人存在技术难题,但未来乐观:
目前 AI 在物理操作领域有所进展,但真正的人形机器人在机械工程方面仍存在技术难题。不过 Altman 对此持乐观态度,他认为当能在现实世界中自由行走和执行任务的机器人出现时,人们能感受到切实的「未来冲击」。
超级智能时代,人类的自适应能力将超越想象:
人类有能力构建出极其强大的超级智能系统,但到那时,给技术给社会带来的震动可能并没有想象中那么大,人类会很快适应。同时,Altman 认为我们也无需过于担心 AI 给人类造成的就业威胁,因为人类会适应并很快创造新的工作角色。
无处不在的「AI 伴侣」是 OpenAI 的理想产品形态
Altman 描绘了 OpenAI 为消费者构建的终极产品形态——「AI伴侣」。与传统计算设备相比,未来的 AI 可能通过更直观的设备形式融入人们的生活。
打造「AI 工厂」,完善供应链是未来关键:
AI 将成为跨行业的核心技术,未来可能涉及太空探索等领域。能源问题可能通过核裂变等新技术得到解决,为 AI 提供支撑。
对 Meta 的看法:
Altman 对 Meta 在 AI 领域的竞争态度表示尊重,但他认为 OpenAI 更具创新潜力,并且其团队文化比 Meta 更加注重创新,而不是复制现有成果。
原视频🔗:https://www.youtube.com/watch?v=mZUG0pr5hBo
以下是对谈实录,编译略作调整。
Jack Altman: 我想从 AI 的未来聊起,尤其是中期的未来。短期的我兴趣不大,长期的谁都说不准,但五年、十年这个区间,我觉得最值得聊。我想让你大胆预测一些具体的东西。
我们先从软件聊起吧——目前看来最有效的应用场景是编程,或者说是聊天和编程。那接下来呢?就是「聊天+编程」之后,你觉得会出现哪些新的 AI 使用场景?
Sam Altman: 我觉得接下来会出现很多令人惊叹的新产品,比如会有一些非常疯狂的社交体验,还有类似 Google Docs 的 AI 协作流程,但效率会高得多。你会开始看到类似「虚拟员工」的东西。
但我认为,在未来五到十年的时间里,最具影响力的还是 AI 真正能发现新的科学。这听起来像是个很大胆的说法,但我认为它是真的。如果这个判断正确,随着时间的推移,它带来的影响将远远超过其他所有事情。
Jack Altman: 你为什么认为 AI 能发现新的科学?
Sam Altman: 我觉得我们已经在模型中实现了「推理能力」的突破。虽然还有很多路要走,但我们大致知道接下来该怎么做。而且你知道,o3 已经非常聪明了,你会听到有人说,「哇,这就像一个优秀的博士」。
Jack Altman: 「推理能力的突破」具体指的是什么?
Sam Altman: 就是说,这些模型现在可以在特定领域中,进行你期望一位博士能做到的那种推理。某种意义上,就像我们已经见过 AI 达到了世界顶尖程序员的水平,或者能在世界最难的数学竞赛中拿到高分,或者能解决一些只有该领域专家博士才会做的问题。
我们可能没表现出多惊讶,这其实挺疯狂的,但它确实是一件很了不起的事情。在过去一年里,模型的推理能力取得了很大的进展。
Jack Altman: 你对此感到惊讶吗?
Sam Altman: 是的。
Jack Altman:你原本以为它只是「下一次的 Token 提升」?
Sam Altman: 我原本以为我们达到现在这个水平还需要再花点时间,但过去一年的进展比我预期的快得多。
Jack Altman: 这个「推理能力」的实现过程,是你原本预想的那种方式吗?
Sam Altman: 就像 OpenAI 发展史上经常发生的情况一样,很多时候一些看起来最「笨」的方法反而奏效了。我本不该再为这种事感到惊讶,但每次发生时还是会有点意外。
Jack Altman: 所以你觉得推理能力会让科学发展得更快,还是说会带来全新的发现,还是两者都会?
Sam Altman: 我觉得两者都会。
你已经能听到一些科学家说,借助 AI 他们的研究效率更高了。虽然我们现在还没有让 AI 完全自主地进行科学研究,但如果一个人类科学家使用 o3 后效率提升三倍,那也已经是非常重大的变化了。
随着技术发展,AI 会逐渐具备一定的自主科研能力,甚至能发现新的物理学规律。
Jack Altman: 这些事情现在是在类似 Copilot 的辅助状态中发生的吗?
Sam Altman: 是的,现在的确还没到那种你能直接对 ChatGPT 说「帮我发现新的物理学原理」,然后它就真能做到的程度。目前更多还是类似「Copilot」这种辅助角色。
但我听到一些生物学家的非正式说法,比如说 AI 真的提出了一个很有潜力的想法,然后他们再进一步发展,结果真的带来了一个基础性的突破。
Jack Altman: 你觉得是让 AI 帮你创建一个完整的电商业务更容易,还是让它去完成一项高难度的科学研究?
Sam Altman: 我一直在思考这个问题——比如说,如果你给 AI 建一个价值一千亿美元的粒子加速器,然后让它负责做决策、分析数据、告诉我们该做哪些实验,我们再去执行,这是一种方式。另一种是你花同样的钱建立一个可以与现实经济系统对接的 AI 基础设施。
哪个方向更容易让 AI 实现突破性成果?我觉得物理是一个更「干净」的问题。如果你能获取新的高能物理数据,再给 AI 实验能力,我觉得这是一个更清晰、更可控的问题。
我听过一些人说,他们预计 AI 首个能自主做出科学发现的领域会是天体物理学。我不确定这说法是否准确,但原因是这个领域数据量巨大,而我们没有足够的博士去分析这些数据。
也许要发现新东西没那么难,但我也不敢说得太肯定。
Jack Altman: 好吧,所以科学会变得更强,编程和对话功能也会持续进步。那在商业方面呢?你是否也能通过一个提示词就让 AI 帮你构建一个完整的公司?比如说「我要创建一个这样的业务」,然后它就能开始操作——这种事真的会发生吗?
Sam Altman: 现在确实有人在小规模地这么做。你会听到一些故事,比如有人用 AI 做市场调研,发现一个新产品,然后发邮件找制造商生产这个东西,在亚马逊上卖,再投放广告。
这些人确实找到了在非常「草根」的方式下,用 AI 启动一个玩具规模的业务的方法,而且真的有效。所以说,确实已经有人在一步步「爬坡」了。
Jack Altman: 那如果是涉及现实世界中的「实体动作」呢?比如搬运实物这些。因为在软件方面你讲得很清楚,科学方面我信你,但关于现实中物理操作这一块呢?
Sam Altman: 确实,在这方面我们还稍微有点落后。但我觉得我们终究会做到的。
比如说,我们现在有一些新技术,可能就能实现标准汽车上的自动驾驶,效果远远好于目前任何一种方法。虽然这可能不是你说的那种「人形机器人」,但如果我们的 AI 技术真的能自己去开车,那也已经非常厉害了。
当然,人形机器人仍然是终极目标,我对这个非常关注,我相信我们最终会实现它。不过,这一直是一个非常难的机械工程问题。
Jack Altman: 所以难点更多在这方面?
Sam Altman: 也不完全是,两个方面其实都很难。即使我们现在已经有了「完美大脑」,我觉得我们还没有「完美的身体」。
OpenAI 早期其实也做过一个机器手臂的项目,困难的地方不在我们想象中的那种「技术难题」,而是设备老是坏,模拟器也总是有点不准。
但你知道,我们总会解决的。我相信在未来五到十年里,我们会拥有非常厉害的人形机器人,真的非常惊艳,可以在街上自由行走、做各种事情。
Jack Altman: 是啊,我觉得那将是技术飞跃真正开启的时刻。
Sam Altman: 我也这么想。那不仅会在现实世界中解锁很多新可能,而且我觉得那种体验会非常「陌生」。我们对很多技术其实已经习惯了,比如现在 ChatGPT 能做的事情,如果放在五年前听起来像是奇迹一样,但我们已经适应它了。
但如果你走在街上,看到一半是机器人在行动,你会立刻习惯这种场景吗?我不确定,也许最终你会,但那肯定是个很大的转变。
Jack Altman: 那种感觉就像是出现了一个新的物种,开始取代我们。
Sam Altman: 对,我觉得那时候的感受……可能未必真像是一个「新物种」或者说在「取代」人类,但一定会让人感觉到「未来已经到来」。而现在即便是像 ChatGPT 这么强的技术,还是没给人那种「未来已来」的直观感受。
我觉得如果我们能发明一些全新的计算设备,可能会带来这种「未来感」。虽然 ChatGPT 和这些新一代代码智能体确实非常惊艳,但它们依然局限在传统的「计算设备」形态中。
Jack Altman: 是啊,它们还是被困在电脑里。
Sam Altman: 是,这确实有点意思。AI 现在只能在电脑上做事情。但我在想,全世界的经济价值中,有多少其实是「认知劳动」——就是可以在电脑前完成的?大概有一半吧。
Jack Altman: 我本来想说大概四分之一。
Sam Altman: 我也不确定,但肯定是个很大的比例。
Jack Altman: 是啊,一旦我们拥有真正具备实体能力的智能系统,风险就会高很多。因为它们的力量也会远超人类。
Sam Altman: 我不确定是不是「风险大很多」。像制造生物武器,或者瘫痪一个国家的电网,其实都不需要「实体」智能,也能造成极大的破坏。所以从这个角度看,不一定更危险。
反倒是有一些「更荒诞的」风险,比如说我会担心一个类人机器人走来走去的时候会不会不小心摔到我家孩子,除非我真的非常信任它。
Jack Altman: 那如果我们设想,十年后我们再坐在这里聊天,我们会问:AI 有没有实现我们当初的预测?你期待的衡量标准是什么?比如说 GDP 增长曲线有没有出现明显拐点?人类寿命有没有延长?贫困减少了吗?还是说会是一些完全不同的指标?
Sam Altman: 过去每年——至少直到去年之前——我都会说:「我觉得 AI 会走得很远,但我们还有很多难题要解决。」
但现在,我对 AI 的发展方向前所未有地有信心。我现在真的觉得,我们已经大致知道该怎么做,能打造出非常强大、极具能力的 AI 系统。
如果最后结果并没有带来我们期待的巨大改变,我会认为,可能是我们真的建出了超级智能,但它并没有让世界变得更好,也没有产生我们想象中的那种巨大影响——这听起来很荒谬,但确实有可能发生。
就像,如果我在 2020 年告诉你:「我们会做出像 ChatGPT 这样的东西,它的聪明程度相当于大多数领域的博士生,我们会发布它,而且世界上有很大一部分人会频繁地使用它。」也许你会相信,也许你不会。
但如果你相信这个情景真的发生了,那你大概率也会预期:「那样的话,世界一定会变得非常不一样。」可现在看来,世界的变化并没有那么剧烈。
Jack Altman: 确实如此。
Sam Altman: 所以我们现在拥有了一种非常惊人的技术。
Jack Altman: 是啊,就像图灵测试这个事一样,大家原本很关注,结果真到了那一步,反而没人太在意。我也不知道这背后的原因到底是什么。
Sam Altman: 是啊,或者说,哪怕你已经拥有了这个能为你做出惊人成果的系统,但你的生活方式其实跟两年前没什么两样,你的工作方式也差不多还是老样子。
Jack Altman: 你觉得有可能出现一种情况:我们拥有了一个超级智能,智商可能高达 400,但我们人类的生活状态却还是和以前一样?
Sam Altman: 我完全觉得这是可能的。比如它在帮我们发现新的科学,那最终社会会慢慢适应这个变化,但过程可能会非常缓慢。
Jack Altman: 有趣的是,如果这个超级智能的表现形式像一个 Copilot,那外界可能还是会把功劳归给那个实验室里的科学家,而不是背后这个「400 智商」的智能体。
Sam Altman: 我觉得这大概率就是会发生的。无论情况怎样,人类的本能都是更在意「人」本身。
我们讲故事需要有「人」的参与,我们想说的是「这个人做了某件事」、「他做出了某个决定」、「犯了某个错误」或「他经历了什么」——我们天生就需要这样的叙述方式。
Jack Altman: 这也是我感到惊讶的原因之一。我原本以为,如果我们真的拥有一个外形和动作都非常逼真的人形机器人,我们可能会开始把这些「人性化」的情感投射到它身上。
Sam Altman: 也许你是对的,我们以后会知道。我可能判断错了。我也相信,随着这些机器人越来越具备「实体感」,我们和它们之间的关系会比现在更紧密一些。
但我觉得,我们在本能上就是非常关注人类同类,这种倾向可能深深植根于我们的生物本能里。如果你知道它只是个机器人,不管它在其他方面多像人,你可能终究还是不会真正「在意」它。当然,这只是我的推测。
Jack Altman: 推理能力是智能的一部分,现在似乎已经有突破了。那还有没有其他类似「关键能力」的主题,比如说「自主性」或者「目标导向性」?这是研究方向之一吗?
Sam Altman: 我想你说的是那种:一个系统能在很长时间里坚持一个目标,并在过程中完成很多复杂步骤的能力。如果是这个意思,那我觉得确实是个重要方向。
Jack Altman: 对,我就是想表达这个意思。
Sam Altman: 是的,这确实是我们目前正在研究的方向之一。
Jack Altman: 那你怎么看未来技术发展的路径?哪些部分你觉得已经是不可逆的趋势?又有哪些你还不确定会怎么发展?
Sam Altman: 我认为我们肯定会打造出非常聪明、非常强大的模型,它们能够发现重要的新想法,能够自动化完成大量工作。但与此同时,我对如果真的实现了这些,社会会变成什么样,完全没有头绪。
我自己最感兴趣的还是模型能力的问题,但我现在觉得,可能更多人应该开始讨论的是:我们怎么确保社会能真正从中受益?这些问题反而变得越来越难回答,也越来越模糊。
就是说,这种说法听起来挺疯狂——我们可能真的解决了「超级智能」这个问题,但社会可能还是一团糟?这让我觉得有点不安。
Jack Altman: 是啊,有时候我也分不清,为什么大家对这些说法反应平平,是因为他们其实只是「半信半疑」?可能这也是原因之一。
但我同意你的看法。很多技术的发展历史都是这样:刚开始提出时大家不太相信,等真的实现了,大家又迅速习惯了。所以我也说不清这一切到底意味着什么。
Sam Altman: 我有一种感觉,就是我们在技术预测方面一直非常准确。但奇怪的是,当这些预测真的变成现实后,社会的变化却没我想象中那么剧烈。不过,说到底,这也不一定是件坏事。
Jack Altman: 那在短期内最显而易见的影响之一,应该就是就业问题吧。我们甚至不需要相信什么疯狂的未来,像客户支持这样的岗位,现在就能看到明显的变化。
Sam Altman: 是的,我的看法是:很多工作会消失,也有很多工作会发生巨大改变。
但人类一直都很擅长为自己找到新的事做——无论是谋生方式、社会地位竞争,还是为他人提供价值。我不认为这种「新角色」的创造能力会枯竭。
当然,从现在的视角看,未来这些角色可能越来越「荒谬」。
比如说,不久前,「播客博主」并不是一个「正经工作」,但你找到了变现的方法,做得很好,大家也都为你高兴——你自己也很开心。
但如果一个「靠种地为生的农民」来看这一切,他可能会觉得:这算什么工作?这不就是你在玩个自娱自乐的游戏吗?
Jack Altman: 我觉得他们可能会订阅这个播客。
Sam Altman: 我敢打赌他们会订阅。
Jack Altman: 他们会喜欢的。但我确实觉得,短期内这会是个很大的问题。至于长期,那就不好说了。
我很好奇的一件事是:过去人们都靠种地为生,而我们现在所做的很多事在当时根本没有意义。现在社会变化这么大,这一次会不会不一样?如果资源真的足够丰富了,会不会有个临界点,人们就不再创造新工作了?
Sam Altman: 我觉得这里「相对性的视角」很重要。在我们看来,未来的人们可能确实是在享受极大量的闲暇时光。
Jack Altman: 其实我们现在就已经像是在大量「休闲」了。
Sam Altman: 看看你穿着那件漂亮的、两千美元的羊绒衫。
Jack Altman: 这只是件普通毛衣啦。
Sam Altman: 哈哈,所以我觉得「相对性」这个角度真的很重要。现在我们的工作让我们觉得非常重要、压力大、也有成就感。但也许将来我们都只是在互相创造更好的娱乐内容。说不定这就是我们现在某种程度上正在做的事。
Jack Altman: 我们聊聊 OpenAI 吧。目前 OpenAI 这边已经有了一个面向消费者的业务,显然也有面向企业的 B2B 模型,还有跟 Jony Ive 合作做的一些硬件项目,另外还有一堆潜在方向,好像也在逐渐成形。
你能不能谈谈这个「完整的体系」可能会是什么样?或者说在某个阶段它至少会是个什么样子?
Sam Altman: 我觉得,消费者最终会希望我们提供的是一种「 AI 伴侣」(目前还找不到更合适的词)。
它存在于「虚拟空间」中,通过各种界面和产品,在多个方面为他们提供帮助。它会逐渐了解你、了解你的目标、你想实现什么、你的各种信息。
有时候你会在 ChatGPT 里打字跟它互动,有时候你可能在用一个更偏娱乐的版本,有时候你会在其他集成了我们平台的服务中使用它,有时候你会通过我们新的设备来接入它。
无论在哪种形式下,这个「存在」都会帮你完成你想完成的事:有时候它会主动推送内容给你,有时候你主动提问,有时候它只是默默观察、学习,以便将来做得更好。
最终,它带来的感觉就是:「这是我的……」我们现在还没有一个完全准确的词来形容它,「AI 伴侣」只是目前最接近的说法。
Jack Altman: 你觉得我们现在使用的这些计算设备形态是不是其实是「错误的形态」?
Sam Altman: 「错误」这个词可能有点太绝对了,但我确实觉得目前的形态并不是最优解。
其实从形态变革的角度来看,计算机发展史上真正重要的变革只有两次。早期当然也有一些变化,但那时你我都还没关注这些事。
在我们有记忆的年代里,有两次重大变革:一次是像我们现在使用的这种电脑——键盘、鼠标、显示器,非常强大、用途广泛;另一次是触屏设备,随身携带的那种手机和平板。
这两种形态在诞生时都没有 AI,所以你只能基于当时的技术构建用户体验,依赖不同的交互逻辑。而现在我们有了这种全新的技术,也许可以更接近科幻小说里那种理想的计算设备。
Jack Altman: 那就是,同样的智能体,在一个全新的形态中使用方式会完全不同。
Sam Altman: 没错,而且设备的形态真的非常重要。
Jack Altman: 比如说它能一直陪在你身边。
Sam Altman: 对,这就是它重要的一个原因。如果这个设备能随时跟着你走、带有各种传感器,真正理解你周围发生了什么,并能持续跟踪各种信息,同时你又能非常轻松地通过一句简单指令让它执行复杂操作——那你就可以想象出完全不同的设备形态了。
Jack Altman: 那你现在还在思考的其他组成部分是什么?比如现在我们看到:消费者在使用聊天功能,创业公司大量使用 API,还有你们正在做的设备项目。除此之外,还有哪些「关键支柱」是你在考虑的?
Sam Altman: 我觉得最重要、但目前世界还没真正意识到的一点,是把 AI 作为一个「平台」的意义——它不仅是你去接入的东西,同时它也可以被无处不在地整合进其他系统里。
比如说,当你在车里、或者使用其他网站或服务时,它都能无缝衔接。这种「持续一致性」的体验将变得非常重要。
此外,我们还有机会去创造全新的事物,比如全新的生产力工具、新的社交娱乐方式。
但我认为,「无处不在」的普及性会是这个平台最核心的特征之一。
Jack Altman: 考虑到智能技术对各个领域都有巨大影响,而且智能本身也包含很多子模块,还有很多「堆栈之上的层级」。你之前也提到过能源问题,显然你在能源领域也很投入。其实从智能到能源之间,还有很多层,包括硬件等等。
那么你觉得,对 OpenAI、甚至对整个国家来说,这整条「技术链条」到底有多重要?是关键的吗?
Sam Altman: 我认为国家应该开始思考这个问题,或者说,世界也好、国家也好,都应该从「电子」到 ChatGPT 查询这整个过程来思考这个体系。
中间有很多环节,我现在开始把这称为「AI 工厂」。我觉得我们可以叫它「元工厂」(meta factory),因为理论上它可以自我复制。
无论叫什么,关键是我们、我们整个世界,必须构建完整的供应链。
Jack Altman: 那对 OpenAI 来说,有必要亲自参与这整条链条吗?
Sam Altman: 我觉得纵向整合在某些方面是有益的,但我们并不一定非要亲自做完全部。如果我们能确定这整件事在足够大的规模上确实会发生,那就没必要全包。所以在很多环节,我们可以通过合作来推动重大的进展。
Jack Altman: 那也就意味着不会面临「我们失去了某个关键环节」的风险。
Sam Altman: 对,正是这样。
Jack Altman: 在能源方面,我们是不是最终会消耗巨量的能源?这是最终的走向吗?
Sam Altman: 我当然希望如此。历史上,生活质量的提高最强的相关因素之一就是能源的不断丰富。我没有理由认为这一趋势会停止。
Jack Altman: 那你对气候问题有没有担忧?还是你觉得这些问题迟早都会被解决?
Sam Altman: 这是我们最不需要担心的部分了。裂变会实现,新型的裂变技术也会出现。
Jack Altman: 那你对聚变就没那么有信心吗?还是说你已经很有信心了?
Sam Altman: 我从不说「百分之百确定」,但我可以说我很有信心,非常有信心。
Jack Altman: 而它将成为未来能源的大部分来源?
Sam Altman: 我觉得是的。不过,下一代的裂变技术也真的很厉害。我了解的一家公司叫 Oklo,他们做得不错,还有其他一些公司也在做很棒的工作,这是一个巨大的突破。
太阳能和储能系统看起来也不错,但我真心希望人类未来的能耗远远超过地球上目前能产生的能源。即使我们完全转向聚变能源,一旦地球的能耗被放大十倍、一百倍,最终也会因为废热把地球加热得太厉害。但好消息是,我们拥有整个太阳系。
Jack Altman: 你不觉得我们聊的这些事情,实际上意味着「太空」不仅非常重要,而且我们进入太空的可能性也越来越大了吗?
Sam Altman: 从整体来看,是的。我们会进入太空吗?我希望会。如果最终没有,那就太遗憾了。
Jack Altman: 挺有趣的,我是不是该去创办一家火箭公司?我之前就跟你说过,我觉得你应该去做点什么新公司项目,其实有一大堆方向你都能试试。
Sam Altman:
我还是有点喜欢专注于一件事,而且我现在已经挺忙的了,还有家庭要照顾。
Jack Altman: 其实我能问问你关于 Meta 的事吗?就关于他们的动态和你们之间的关系。
Sam Altman: 可以啊。我听说 Meta 把我们视为他们最大的竞争对手。我觉得他们继续努力是理性的选择,虽然他们目前的 AI 进展可能没有达到预期。
我尊重他们这种有侵略性的态度,以及不断尝试新方法的精神。而且既然这是理性的,我也预期如果这次不成功,他们之后还会继续尝试的。
我记得有一次听 Zuck 说,早期 Facebook 刚起来时,Google 开发社交产品是理性的,虽然当时 Facebook 内部都很清楚那是行不通的。我现在有点类似的感觉。
他们最近开始向我们团队中的一些人开出非常高的报价,比如说开出 1 亿美元的签约奖金,甚至年薪还要更高,简直疯狂。
但我真的很开心的是,到目前为止,我们最优秀的那些人都没有接受他们的邀约。我觉得人们在比较这两条路时,会认为 OpenAI 在实现超级智能上有更大的可能性,长远来看也可能成为一家更有价值的公司。
我觉得那种「开出大量前期保证薪酬」作为说服人才加入的策略——他们居然把重心放在这个,而不是工作本身、使命本身,这真的让我很惊讶。我不认为这种方式能建立起一个好的文化。
我希望我们能成为全球最适合做这类研究的地方,而且我认为我们确实为此打造出了一种非常特别的文化。
我们目前的设定是:如果我们成功了——我们研究团队的所有人都相信我们有很大的可能成功——那么大家在经济上也都会获得丰厚回报。
而且我觉得我们现在的激励机制,是跟「使命优先」相一致的,经济回报和其他一切都顺其自然地从使命出发,这样的机制是健康的。
Meta 有很多我尊重的地方,但我并不认为他们是一家擅长创新的公司。与之相比,我觉得 OpenAI 的特别之处在于:我们成功建立了一种以创新为核心的文化。
他们可能擅长「可重复的创新」,但我认为我们理解了很多他们尚未掌握的东西——比如要实现真正的技术突破,到底需要什么。
不过说实话,这段经历对我们的团队来说反倒是一种「澄清」——让我们看清了方向。我们祝他们好运吧。
Jack Altman: 是啊,我想这也涉及到一个核心问题:你认为迄今为止的 AI 成果是否足够让别人通过「复制」就能成功?还是说,真正的创新还在前方?
Sam Altman: 我不认为「复制」就足够了。
我看到很多人——包括 Meta ——他们在说,「我们就去复制 OpenAI 吧。」真的就是这种心态。
你看看现在很多其他公司的聊天产品,它们和 ChatGPT 长得几乎一模一样,甚至连我们当初犯过的 UI 错误都照搬,简直让人难以置信。而他们在研究上的目标也只是想赶上我们当下的水平。
这是我在 YC(Y Combinator)时期就学到的一课:这种策略基本上从来行不通。你只是在追赶竞争对手过去的成果,但你没有建立起一种「持续创新」的文化。而一旦你陷入这种状态,要再爬出来就比大家想象的难得多。
Jack Altman: 你们是怎么做到这两者兼顾的?就是既是一家高度商业化的公司,同时又是一家非常重视研究的公司?这种模式其实没有太多成功的先例。我理解你们在商业化之前是怎么做的,但现在你们已经兼顾了商业和研究,而且看起来还运转得不错。
Sam Altman: 我们在产品这块其实还是比较「新」的,我们还需要不断努力,来真正配得上「运转得不错」这个评价。
我们确实在不断进步,也做得越来越好。但你看大多数科技公司的发展历史,通常是一开始就是一家产品导向、运营良好的公司,然后后来再「附加」一个运营不善的研究部门。
我们正好相反,我们是我所知道的唯一一个反过来的例子:我们一开始就是一家非常优秀的研究机构,后来「附加」上了一个最初运转不太好的产品部门,现在越来越成熟。
我相信我们最终会成为一家伟大的产品公司,而我也为团队在这方面所做的努力感到非常自豪。但你看,2 年半之前我们还只是一个研究实验室而已。
Jack Altman: 真不敢相信那才刚过去两年半。
Sam Altman: 是啊,我们这两年半里要把整个大公司搭建起来,真的是很不容易。大家做的事简直太了不起了。ChatGPT 是在 2023 年 11 月 30 日发布的。
Jack Altman: 确实如此。而且显然,组建一个会做公司的人要比找一群能搞顶尖 AI 研究的人容易得多。
Sam Altman: 但依然很难。大多数公司要建立这样规模的产品体系,花的时间都比 2 年半多得多。
Jack Altman: 那你觉得为什么 Meta 会把你们当作那么强的竞争对手?我理解他们可能觉得 AI 是整个未来的关键,但仅凭这一点就够了吗?
Sam Altman: 这可能就已经足够解释了。有个以前在 Meta 工作的人跟我说过一句话:「在外界,大家把 ChatGPT 当成是 Google 的替代品;但在 Meta 内部,大家把 ChatGPT 看作是 Facebook 的替代品。」
Jack Altman: 因为人们现在把大量时间都花在和它对话上了。
Sam Altman: 是啊,他们跟 ChatGPT 聊天的方式,原本是会在其他地方进行的,而且他们更喜欢这种方式。
Jack Altman: 这其实就是在抢「注意力资源」了。
Sam Altman: 这其实不是单纯的「时间竞争」问题。
当然也有时间上的竞争,但更重要的是,人们在网上「末日刷屏」(doomscrolling)的时候,会感觉自己变得更糟——虽然当下可能有点快感,但从长远来看,那是在让你感觉越来越糟,尤其是对自己越来越不满意。
而我们特别自豪的一点是,当人们谈到 ChatGPT 时,他们会说:「它让我感觉自己更好」,它在帮我实现目标,它在真正帮助我。这可能是我听过关于 OpenAI 最暖心、最好的评价之一:有人说,「这是我用过的唯一一家不会让我觉得它在‘对抗我’的科技公司。」
Google 会展示一些很糟糕的搜索结果,还强塞广告(虽然我很喜欢 Google,也喜欢这些公司,我不是说他们一定错了);Meta 会试图「入侵我的大脑」,让我不停地往下刷;Apple 做了我喜欢的手机,但它不停地发通知,分散我注意力,我还戒不掉。
而 ChatGPT 给人的感觉就是:它只是想帮我完成我想做的事情。这种感觉真的挺好的。
Jack Altman: 那有没有可能做出一种「社交产品」,既有互动性,又保留这种能量和正面体验?
Sam Altman: 我好奇的一种版本——虽然我还不确定这意味着什么——是这样一种「信息流」:它默认是空的,不会主动推送什么,但你可以提示它,比如说「我最近想健身,你可以推一些对这个有帮助的内容吗?」或者「我想多了解一些时事新闻,能不能给我一些中立、不过度煽动情绪的信息?」
这样的系统显然不会像现在的算法推荐那样让人沉迷、花更多时间,但我觉得这会是一个很酷的方向——一个真正「对齐」的 AI,帮助你实现你长期真正想要的社交体验。
我感觉自己每天早上醒来的时候,就像是一个被充满能量重启的人,知道自己想要什么,有很好的意图,也愿意对今天做出承诺。但随着一天展开,生活的节奏就开始疯狂袭来。到晚上 10 点,我可能会想:「我本来不打算喝酒,但就喝一杯威士忌吧。」或者「我不想刷 TikTok,但刷个两分钟应该没关系。」我同意,不该把自己逼得太紧。但如果我能一直保持「早晨的自己」,如果技术能帮我实现那些我真正想做的事情,那我想我会变得很棒。
Jack Altman: 我十年前还跟你住过一段时间。当时你还在管理 YC。我那时就觉得你很有「掌控力」(agency),你想做什么就去做,完全不受条条框框限制。但我觉得,从那之后,尤其是最近几年,感觉你真的是「完全没有规则」了。
你看你做 Stargate 项目,和 Jony Ive 合作……这些事都非常大胆。我好奇,你是不是在思维上有什么转变?有没有什么你能明确指出来的东西,促使你变成现在这样运作的人?
Sam Altman: 我觉得我们奶奶以前常说的一句话很对:「变老最棒的一点就是,你会越来越不在意别人怎么看你。」我现在真的有这种感觉。我也经历了很多风口浪尖,但确实,年龄增长让你更自由,更少顾忌他人的评价。这是一种释放。
Jack Altman: 你现在还有一些事情是会犹豫不决的吗?或者说,你觉得你还有更高一层的「行动力」可以发挥出来吗?有没有一些想法你会想:「我其实想做这个,但某种原因让我暂时放下了」?
Sam Altman: 这是我本来想说的第二点:随着 OpenAI 拥有越来越多的资源和潜力,我们确实能做的事情也越来越多。当然,还是有很多我想做但现在做不了的事,比如我想在太阳系建一个「戴森球」,把整个太阳的能量输出都用来建一个超级巨大的全球数据中心。
但显然,这事现在还做不了,可能得等几十年。但整体来看,我们确实已经有能力去做更多、更有野心的事情了。
Jack Altman: 那当你面临很多选择时,你是怎么做决定的?这其实就是「选择过多的困扰」吧。你现在可以去做火箭、搞社交网络、玩机器人……你可以为所欲为。那你是怎么从这么多选项中做出取舍的?
Sam Altman: 说实话,我现在的时间已经完全被榨干,根本没有多余的精力去做别的事情,这一点怎么强调都不为过。
而且我本来就没打算经营哪怕一家公司,更别说一堆公司了。我原本只是想当个投资人而已。
Jack Altman: 你会说,整体上你是真的喜欢现在这份工作吗?虽然它可能远远超出了你最初的预期。
Sam Altman: 我觉得非常感恩,非常幸运。毫无疑问,将来我退休以后一定会想念这段时光,到时候我可能会说:「唉,现在真是太无聊了。」
Jack Altman: 而且这段经历真的很酷,也非常重要,对吧?
Sam Altman: 是的,这份工作带来极大的满足感。我觉得自己能做这件事真的超级幸运。我确实非常喜欢,几乎大多数时候都很享受。
但老实说,这段时间确实非常非常激烈,有点压倒性。我经历了比我原本想象中更猛烈、更多的「风口浪尖」。
Jack Altman: 这其实也不是你一开始设想的路径。大多数人创业做软件公司的时候,预期的就是做一家软件公司。但我觉得你当初肯定没预料到会变成现在这样。
Sam Altman: 这本来应该是我「退休后的工作」,只是想经营一个小型的研究实验室而已,是这样的。
Jack Altman: 而且在很多平行世界里,这一切根本不会发生,对吧。
Sam Altman: 对,没错。
Jack Altman: 抛开你是不是喜欢它,也不谈你花了多少时间,你在体验这份工作的时候,是觉得它很「沉重、重要」,还是像一个有趣、好玩的谜题?
Sam Altman: 这两种感觉我都有,而且是同时存在的。
从社会影响力的角度,或者说它的潜在影响来看,这很可能是我一生中接触过最重要、最具影响力的工作。
我不想显得太自我陶醉,但也许这份工作确实在某种程度上是具有历史意义的。当我有时间静下来思考时,我能意识到这一点。但在日常工作中,更多是处理一些「琐碎的事情」,而我其实很享受这些琐碎。我很喜欢和我共事的人,做这些事情本身也很有趣。
当然,有些部分确实压力山大、甚至挺痛苦的,但整体上说,它更像是一个「有趣的谜题」,而不只是「重要的工作」。
近日,石头和三丽鸥联名,推出了迷你洗烘一体机 Q1 Hello Kitty 限定版,定价为 1999 元。
整机采用了 Hello Kitty 契合的复古粉配色,舱门上贴满了 Hello Kitty 的面容和文字 Logo,还有各式各样相关的标志。
限定版还提供一个 Hello Kitty 面盖,能够直接磁吸在舱门上面。配合略带粉色调的复古白机身和粉色字体,看着就一体性很强,很萌很 Hello Kitty。
另外,石头还提供了正式授权的 Hello Kitty 礼盒,里面包含了印有 Hello Kitty 的脏衣收纳箱和净渍球收纳包,还有滴胶贴纸。不仅能贴到洗衣机上,还可以贴到自己喜欢的地方。
Q1 很小巧,一个人就能够搬动。机器采用了上排水设计,而且占用的空间很少,不管是放入柜里面还是嵌入在家里的角落都很合适。柔和的配色也方便它快速融入家中。
机身配置方面,Q1 搭载了 Fresh Gale 滚筒柔烘技术,支持洗烘一体。机器内置石头自研的 RR Mariner 全域精控算法,可实现阶梯式提升水温,特渍洗模式配合净渍球可以清洁 6 天血渍。
机身内搭载了 DD 直驱变频电机,噪音更少,夜里洗衣也不打扰休息。
Q1 内置 UVC 深紫外线和高温煮洗功能,提供了「高温煮洗」、「除螨」和「防过敏」等模式,清洁贴身衣物能更干净。
机器内配备三个热敏传感滩透,可以精确感知机内温度,实现烘干即停不过烘的效果。烘干时也支持毛絮风道自清洁,毛絮能够自动带走。
小尺寸的机身下容积为 0.8kg,除了能够洗贴身衣物,还能兼容毛绒玩具、口罩手套枕巾、睡衣和瑜伽背心等。
价格方面,石头迷你洗烘一体机 Q1 Hello Kitty 限定版定价 1999 元,目前支持国补,国补后售价为 1599 元。
最近重温《速度与激情》系列,看来看去最喜欢的车还是这辆银色的雪佛兰克尔维特 Grand Sport #002。
Roadster 样式的车身造型看上去确实是一眼的精致,颇给人一种「西装暴徒」的感觉,作为电影道具使用的它搭载了一台 6.2L 排量的 V8 发动机,最大马力 550 匹,0-100 公里加速则仅需 3.8 秒。
只可惜为了配合范老大和布莱恩跳河的镜头,12 辆道具车损失惨重,最后只有 3 辆幸存。
克尔维特虽然在中国的知名度不如法拉利、兰博尼基等超级跑车品牌,但它在美国却算是家喻户晓的品牌,甚至一度被喻为「国宝级跑车,代表美国的历史、文化、精神,还有最高端的汽车技术。」
就在近日,克尔维特又推出了一款最大马力为 1250 匹的超级跑车—— 雪佛兰克尔维特 ZR1X。
这辆车并非专为赛道设计的,克尔维特强调 ZR1X 更侧重于公路性能,但估计没有哪条公开道路能够让这台车发挥出它 2 秒内破百的极速潜力。
这台性能怪兽 1250 匹马力中的 1064 匹源自于一台 5.5L 的双涡轮增压 V8 引擎,它通过 8 速的双离合变速箱来驱动后轮,另外的 186 匹马力则来自于升级版的 E-Ray 电驱系统,在一块 1.9 kWh 的电池驱动下,这台电机的转速上限来到了 17000 转,由此提供了 186 匹马力和 196 牛米扭矩。
不过大家都知道弯道快才是真的快,在这台 ZR1X 上,工程师彻底重构了 E-Ray 的 eAWD 底盘控制系统,宣称可以同步实现纵向与横向的 1.0g 过载,这个数值大致相当于你从 10 楼跳下时感受到的加速度。
雪佛兰也为新车开发了全新的制动套件,采用了前 10 活塞加后 6 活塞的卡钳,并搭配了 16.5 英寸的碳陶刹车片,官方宣称其最大减速过载可达 1.9g。标准版车型搭载的是米其林 PS4S 轮胎,选装包里则有更高刚度的弹簧、更硬朗的底盘设定以及米其林 Cup 2R 轮胎,当然也少不了前扰流板、底盘导流鳍、引擎盖扰流唇及冲浪板尺寸尾翼等各种碳纤维空气套件。
同步推出的还有全新的 PTM Pro 驾驶模式,该模式能够让车辆关闭牵引力与稳定控制,但保留再生制动扭矩矢量控制、前轴预控制系统及弹射起步功能。
尽管性能很「狂野」,但克尔维特 ZR1X 的内饰倒挺有氛围感,全车配备了一块 14 英寸的数字仪表屏、一块 12.7 英寸的触摸中控屏以及仪表盘左侧用来操作 HUD 以及 PTM 系统的 6.6 英寸触摸屏。内饰材质上则大量使用了各种碳纤维元素以及绒面革超细纤维。
这台有史以来最先进的克尔维特在其他地方都很完美,就是什么时候能把这个「五菱」标换一下就好了,重新设计一个大概也就 200 万美元。
在过往有关零跑的文章下面,总会有读者提出疑问,零跑凭什么能把价格做到这么低?
答案其实只有四个字——「全域自研」。
连车灯、座椅、摄像头这种零部件零跑都是自己搞。
因为全域自研,零跑少了一层利润差价,拉高了零部件的通用率,也提升了内部的适配和调试效率,所以零跑能把成本降下来。
这其中的逻辑链条比较复杂,在营销层面也不太容易宣传,但车价的降低却是实打实能感知到的。
比如零跑今天推出的新款 C16 的起售价就进一步降低来到了 15.18 万元起。
零跑在发布会伊始先分享了一个洞察:
大家庭对 SUV 的需求不再是单选题,SUV 设计是一道开放题,必须从一味的追求大空间转向精准匹配大家庭需求的差异化需求。
在这个洞察之下,零跑 C16 推出了全新的 5 座版本,这个版本既保留了 6 座车型的智能舒适配置,又拥有更大的车内空间和可拓展性。
5 座版本 C16 的后排拥有了更大的乘坐空间,其二排腿部空间为 961mm,坐姿高度为 345mm,最大座椅靠背角度可达 140°,500mm 的长滑轨设计也让座椅能够能灵活的前后移动,从而更灵活的分配前后排空间。
零跑还为 5 座版的 C16 特别设计了一个后备厢观影模式,用官方开发的床垫和撑杆,配合「一键成床功能」,可以让家人和小孩以更舒服的姿势和距离来观看后排屏幕。
新车在储物空间上也没有妥协,正常状态下的后备厢空间为 692L,二排折叠之后则可以拓展到 1663L。
如果说全新的 5 座版本是为了拓展用户群体和使用场景,那么 6 座版本则需要考虑的是如何在一个已经很成熟的产品上继续做加法来保持优势地位。
新款零跑 C16 6 座版在第二排座椅下面增加了横向滑轨,可以让座椅中央留出来最大 190mm 的通道来方便第三排进出。二排座椅靠背的最大仰角从 145° 提升到了 155°,第三排座椅的头部空间和腿部空间也分别增加了 20mm,并增加了 10° 的靠背自由调节。
老用户们呼声很高的冰箱这次终于也上车了,与 15.6 寸的后排屏幕一起实现了冰箱彩电大沙发的满配。
零跑在发布会上也宣布了一些五六座版本都会有的升级。
首先是 26 款 C16 的座椅和方向盘都升级了 Nappa 真皮,并且在主副驾以及 6 座的二排和 5 座的后排都增加了 10 点按摩以及二排座椅吸风。车辆的静音舒适性也得到了改善,新款 C16 升级到了 5 块全方位声学玻璃并针对低频路噪和胎噪进行了优化。
其次 26 款零跑 C16 升级了前后双 FSD 悬架,实现了 50%+ 的颠簸路面乘坐舒适性提升,车辆配备的博世 DP-EPS 智能转向系统和大陆 One-Box 制动系统也实现了 5.3 米的转向半径和 35 米级的百公里制动距离。在自研 LMC 一体化运动融合控制技术的加持下,新款 C16 在冰雪路面、爆胎稳定控制以及高速预稳定控制方面的表现都有了提升。
2026 款零跑 C16 纯电版升级到了 81.9 kWh的电池容量,CLTC 续航里程达 630km,依旧搭载全域 800V 碳化硅高压快充平台,30%-80%补能约需18分钟;增程版电池的容量为 38.7kWh,CLTC 纯电续航提升至了 280km,综合续航为 1150km,同时也优化了充电效率,30%-80% 的补能时间缩短至了 19 分钟。
新车的车机这次则升级成了 LEAP 3.5 高阶舱驾一体中央域控架构,在高通骁龙 8295 座舱芯片和 Leap 4.0 Plus 车机系统的配合下,新增了 3D 车模、语音增强、以及更多的 APP 应用。
除了全系标配激光雷达之外,2026 款零跑 C16 配备了 1 个 128 线激光雷达、3 个毫米波雷达、12 个超声波雷达、11 个摄像头、1 个车内摄像头,共 28 个智能感知硬件,支持端到端的智能辅助驾驶,可以实现全场景高速领航辅助 NAP、全场景导航辅助巡航 NAC 等功能。
在整车安全方面,新车使用了核潜艇级的 2000 兆帕的热成型钢,并对六座版本的第三排进行了安全优化,也使用了专门设计的超长贯穿式车身侧气帘和大体积正侧面气囊。
截止到 2025 年 6 月 18 日,零跑一共交付了 80 万辆车,在刚刚过去的 5 月交付了 45067 台车,前 5 个月的累计交付量和出口量都是造车新势力中的第一名。
同时零跑 C16 也成为了 20 万元以内大中型 SUV 的销量冠军,这个价位段每卖出 10 台就有 7 台就零跑 C16。
零跑对这次 C16 升级的定位是「冠军之上再进阶」,就是要用几乎没有短板的产品力在 70% 的市占率基础上再上一个台阶。
不久前,苹果前首席设计官乔纳森·艾维的硬件公司 io,被 OpenAI 以 65 亿美元的天价收购——而 io 甚至都还未推出自己的产品。
唯一能确认的是,这是一件可以随身携带的,手机以外的物件。
这只是 AI 硬件浪潮里的一朵浪花,事实上,生成式 AI 正在持续地改造一切——于是,在消费电子领域,我们能看到 AI 手机、AI PC,当然,更符合主流叙事的,是 AI 可穿戴设备。
作为一种全时佩戴,同时也是和人体最接近的设备,可穿戴设备是 AI 的理想载体。把 AI 硬件「戴」在身上,几乎已经是某种行业共识。
▲ 已经失败的可穿戴 AI 硬件 Ai Pin
市场上并不乏搭载 AI 技术的可穿戴设备,我们不时就能看到厂商推出的全新 AI 耳机、AI 手表、AI 眼镜,但这些产品离我们期待的,还有不小的差距。
性能、续航、准确度等,都是软肋,而更根本的问题是,大部分产品只是原有设备和 AI 模型的简单结合,而并非将 AI 融入底层设备,最后得出的结果只能是 1 + 1 < 2。
真正的 AI 可穿戴设备应该是怎样的形态,消费者难以想象,行业也在等解决方案。
先行者已经出发了,其中最引人瞩目的硬件公司,无疑还是华为,而这款 AI 可穿戴设备已经正式发布了——
华为WATCH 5,我想这就是 AI 时代,智能手表的新形态:
不久前,华为在技术沟通会上公布了华为WATCH 5 所采用的技术底座,这一代 WATCH 可谓是全面焕新,采用端、软、云协同的全新智慧架构,端侧搭载全新 AI 智能平台 + AI 处理算法和能力 ,HarmonyOS 5.1 深度协同 ,并由AI 融合大模型赋能,让华为WATCH 5 的智慧 AI 能力全面升级。
如果说行业里的大部分采用第三方芯片 + 定制系统的智能手表,是在毛坯房上自行装修的精装房,那么采用麒麟芯片 + HarmonyOS 5.1 的华为WATCH 5,就是从地基开始打起的自建房。
这两者之间的差距显而易见:「毛坯房」的房屋布局和管道都是定死的,而「自建房」的设计权和话语权完全由自己掌握,可发挥的空间要更大。
根据目前的博主拆机视频,华为WATCH 5 搭载了全新的麒麟芯片,因而能带来不同于以往华为手表的体验。
时间,是可以直接感受到的变化。在以往华为 WATCH 系列上,需要足足 2 分钟时间才能从全能模式切换至省电模式,而搭载麒麟芯片的华为WATCH 5,得益于全新的双核处理器架构,只要 3 秒。
更深层的进化是华为穿戴首次搭载的 NPU 处理单元,不仅带来足够的 AI 算力,更有端侧的 AI 处理算法,这是华为WATCH 5 成为一块「鸿蒙AI」智能手表的必要条件。
值得玩味的是,内置的 5G 模组意味着,华为WATCH 5 具有更强的无线通讯能力,这是全球首款 5G 智能手表,完全有能力独立于手机之外。事实上,作为一款 AI 手表,高速和独立的网络连接,也是其体验流畅可靠的前提。
华为WATCH 5 搭载了 HarmonyOS 5.1,这也是第一次,智能手表真正和智能手机、智能车机搭载了同一套系统,并且能一键实现腕上的全场景交互 ——小到耳机,大到汽车,都能通过手表来操控。
一个让人印象深刻的例子是,在星闪技术的加持下,华为WATCH 5 还能成为高精度的车钥匙,手表靠近车 3 米范围就能自动解锁。
软硬的全链路自研,无疑为进一步的产品创新扫清了障碍,就像是一手打造的自建房中,能更好地布置需要的家具。
华为WATCH 5 不是一个离不开手机的附庸,而是独当一面的新物种,二者最大的不同,既在于强大算力和独立通信能力,更在于其独特的 AI 融合大模型,让华为WATCH 5 的定位:从智能手表,到 AI 智能手表
制器者尚其象
创造的源泉和依据,应该是要出于对规律和关系的洞察,才能抓到问题的核心。
作为一种全新的技术力量,AI 的能力非常丰富,这既是机遇,又是挑战,需要厂商对 AI 技术和产品有深度的理解。
而对于智能手表产品而言,运动健康的监测和管理就是最重要的一种能力,因此 AI 技术也理应从这个切入点出发,重构相关的体验。
AI 模型和运动健康的相性极佳,几乎可以说是一拍即合。
除了我们熟知的 GPT、DeepSeek 大语言模型,其实不少垂直的专业领域都有专门的大模型,作为一种更底层的技术,提供更智能的体验。
华为WATCH 5 则同时运用了三种大模型:自研盘古大模型和 DeepSeek 双模型自适应,并且还另外搭载了一个专门的运动健康专业模型。
盘古大模型和 DeepSeek 模型我们并不陌生,但为什么又要额外单独配备一个「运动健康」的大模型?
智能穿戴设备的迭代,离不开传感器的升级,这意味着一个手表能测量更多维度的身体数据,能够检测用户更多垂直领域的生理状况。
但使用过智能手表产品的用户都知道,很多时候智能手表只能机械地反映身体的状况,简单地给出一个健康状况的结果,但却不能针对性地解答我们对自己身体状态的疑惑,这也是当下很多智能手表的困境。
人体的复杂和精密,决定了千人千面的身体健康状况。没有机器学习和 AI 的传统模式下,要对不同的指标进行大量穷举,才能对每个用户遇到的问题进行针对性地解答,这样的做法不仅不现实,也不能确保准确性。
为此,华为WATCH 5还接入了一个专门的运动健康模型。如果说 GPT、DeepSeek 是样样通但样样松的万事通,那么华为这个运动健康模型,则是深耕健康领域的专家,通过腕上小艺助手,随时给用户解答关于身体状况的疑惑,覆盖 22 种运动,以及健康领域接近 200 项指标。
通过传感器收集到的数据,都能和手表的 AI 智能能力紧密配合,提供兼具数据量深度和垂类广度的丰富数据,并通过 AI 能力深入浅出生成个性化的解答。
举个例子,在 WATCH 5 上,只要呼出小艺问一句「小艺小艺,我最近一周为什么睡不好」,小艺就能根据用户过往一周的睡眠数据,分析相关的影响因素,并提出针对性建议。
当然,小艺不仅更贴心,还变得更加聪明,当佩戴者用自然语言给一个指令,比如「带我去最近的地铁站」,或者「记录我刚刚吃了一碗米饭」,小艺都能理解,并且操控手表上对应的 APP 完成执行动作。
一些需要知识量的问题也难不倒小艺,不管是和运动健康比较相关的比如「高血压要如何注意饮食?」,还是一些常识性的问题例如「几月份去青海更合适?」。
上百种运动、健康功能的操控,一句话就可拉起;知识面更广,从通用百科到个人身体状况,即问即答,腕上小艺又何尝不是一个称职的 AI 健康管家呢?
运动健康是智能手表的重点,但不是全部,一块真正的「AI 手表」,还应该为用户提供全方位的智能能力。
有时候我们不是都能腾出另一只手,去触控手表屏幕上比较小的按键,针对这种场景,华为WATCH 5 推出了「手势操控」的全新交互方式,可以「敲一敲「完成「确认选择」,还能「划一划」切换选项,而这个功能实现的可能性,就是建立在 WATCH 5 的 AI 智能能力上的。
并且这个手势操控,还能够通过鸿蒙应用生态,集成在更多第三方应用当中。
这恰恰说明,华为WATCH 5 不仅是一个腕上 AI 健康管家,也具有解决用户生活挑战的智能助手。
除了 AI 智能能力,华为WATCH 5 的另一个创新就是 X-TAP 智感窗传感器。
对于健康问题,最好的应对措施不是「解决」,而是「预防」——预防,就少不了对风险的提前预知。
一直佩戴在手上的智能手表,就非常适合作为一个健康前哨站。
但问题在于,智能手表上要集成那么多的传感器并非易事,对于更多慢性病,很难做到及时预警,造成「有用,但不多」的尴尬境地。
华为WATCH 5 搭载的全新传感器「X-TAP」,可谓是智能穿戴的一次全新尝试。
这个看起来豆大的传感器,集成了 ECG、PPG 以及压感传感器。和一般位于表盘底部的传感器不同,X-TAP 位于 WATCH 5 的侧面,测量的是用户指尖而不是手腕。
密布毛细血管的指尖,更容易精确收集到一些身体数据,配合其他腕部传感器,WATCH 5 能够进行免气囊的高血压风险筛查。
这就是智能手表健康预警能力平常化的最佳体现。
更精确的传感器,允许用户用华为WATCH 5 进行一分钟的微体检,快速检测身体 17 项健康数据,让你轻松、全面、及时地了解自身的健康综合状况。
和手机、电脑等产品一样,华为对可穿戴智能手表的探索,经常另辟蹊径,敢为人先探索一些行业还比较少见的方案。
在丰富的智能手表产品线之中,WATCH 系列一直都是华为「黑科技」的探索者。
从华为WATCH 2 的 PPG 实时心率监测以及独立 GPS 定位,到 WATCH 3 的腕部体温传感器以及双芯架构,再到 WATCH 4 的血管健康研究能力,华为WATCH 系列不管是健康监测还是其他能力上,都是领先行业一个身位的创新设计。
而华为WATCH 5,可以说是 WATCH 系列的一个鲜明的里程碑,是第一块鸿蒙 AI 智能手表,刚好也是华为 WATCH 系列的十年之作。
对于华为而言,这款几乎相当于「重塑」的 WATCH 5,为华为智能穿戴,描绘了一个非常清晰的路径:
全面走向自研的「鸿蒙化」,并且为运动健康注入了个性化 AI 处理能力,让智能手表更加「智能」。
从软件到硬件全面自主化设计,让华为WATCH 5 实现与自家成熟生态的深度互通,既能借助独特的能力拿下市场,本身又是鸿蒙生态的护城河。
将目光放眼到整个行业,华为WATCH 5 又成了一位先行者,探索 AI 智能手表的方向,由此推动整个智能穿戴行业向前迈进。
在这个龙争虎斗的全面 AI 时代,各家都想破脑袋想推动 AI 大模型在具体产品层面的落地应用,但实际上整个行业的探索都在来回打转,需要有人身先士卒。
IDC 的报告显示,2025 年第一季度华为在全球腕戴市场上跃升第一,同时,在华为WATCH 5 的发布会上,华为官方也宣布了华为穿戴全球累计出货量已经突破 2 亿台。
就是这样庞大的用户存量,赋予了华为教育用户和市场的能力,以及敢想敢干的底气。
作为一种发展超十年的品类,智能手表的迭代举步维艰,一直饱受诟病。
AI,作为这个时代的新范式,可能也是智能手表,乃至整个智能穿戴行业穿越周期的新方向。
华为WATCH 5 作为一款 AI 智能手表,新形态的 X-TAP 智感窗能收集更丰富精准的体征数据,感知身体更细微的变化,而 AI 则带来了更个性化、更智能的腕上健康体验和腕上交互体验。
走前人的路不会出错,那为什么要自己走一条新的路线?
敢于打造「另类」产品,并从中受益颇丰的华为深知,星辰大海从来都是留给第一个抵达的人。
🚀
我国载人登月再获新突破
🤖️
OpenAI 与微软再「闹别扭」
👓
Rokid 上线全球第一个智能眼镜支付
🍔
刘强东:京东外卖很快就会跟美团不同
🚗
何小鹏谈小米股价:不能卖,长期看好
💻
MiniMax 开源全球首个「大规模混合架构」推理模型
💡
AI 教父 Hinton:AI 会替代人类职业,但还需时间
🎧
AirPods Pro 3 被曝推迟至明年发布
🎵
豆包「AI 播客」正式上线
📻
罗马仕召回「过热充电宝」近 50 万台
据央视新闻援引中国载人航天工程办公室消息,今天我国在酒泉卫星发射中心成功组织实施梦舟载人飞船零高度逃逸飞行试验,标志着我国载人月球探测工程研制工作取得新的重要突破。
据了解,这是继 1998 年开展神舟载人飞船零高度逃逸飞行试验后,时隔 27 年我国再度组织实施此项试验。
具体来看,下达点火指令后,梦舟载人飞船逃逸发动机成功点火,船塔组合体在固体发动机推动下腾空而起,约 20 秒后达到预定高度,返回舱与逃逸塔实现安全分离,降落伞顺利展开。返回舱使用气囊缓冲方式安全着陆于试验落区预定区域,试验取得圆满成功。
据介绍,逃逸救生是载人飞行任务重要的安全保障手段,发生紧急故障时,能将载有航天员的飞船返回舱带离危险区域,并确保航天员安全返回地面。
梦舟载人飞船是我国面向后续载人航天任务完全自主研发的新一代载人天地往返运输飞行器,飞船自身采用模块化设计,可搭载最多 7 名航天员,整船性能达到国际先进水平。
梦舟载人飞船未来将成为支撑空间站应用与发展、载人月球探测等任务的核心载人飞行器,此次试验成功为后续载人月球探测任务奠定了重要技术基础。
此外,执行载人月球探测任务的长征十号运载火箭、月面着陆器等航天器研制工作正在扎实稳步推进,后续也将按计划组织实施相关试验。
据《华尔街日报》消息,OpenAI 与微软之间的合作关系愈发紧张。
知情人士透露,OpenAI 高层近期在讨论所谓的「核选项」——指控微软在与公司合作的过程中,存在反竞争行为。这一指控可能包括要求联邦监管机构审查合同条款是否违反反垄断法,甚至会引发舆论战。
报道指出,上述举动可能会威胁到 OpenAI 与微软长达 6 年的合作关系,而这段关系曾被视为「科技史上最成功的合作之一」:多年来,微软为 OpenAI 的崛起提供支持,而 OpenAI 也将自身技术赋予微软访问权限。如今,双方已成为竞争对手,寻找对方的共同点变得难上加难。
据悉,OpenAI 与微软近年来摩擦行为不断,如 OpenAI 以 30 亿美元的价格收购 AI 编程创企 Windsurf,而后者的 AI 产品与微软的 GitHub Copilot 为竞品;微软还在不断促使 OpenAI 转型成为公益性公司,并要求在新公司中获得比 OpenAI 更大的股份。
而据 The Information 消息,OpenAI 允许微软在重组后拥有其约 33% 的股份,但作为回报,微软要放弃在 OpenAI 的未来利润分成权。报道指出,这也意味着微软不再从 OpenAI 新结构中直接获得收入分成。
同时,OpenAI 还希望修改与微软现有的合同条款,要求微软放弃对 OpenAI 模型的独家托管权。OpenAI 方面希望借助此次修改,将自己的模型能在其他云服务进行部署与托管。
值得一提的是,据路透社近期报道,OpenAI 向 Google 云服务发出合作邀请,希望让后者为它提供云端算力。
另外,OpenAI 也打算收回 Windsurf 的访问权限。报道提到,OpenAI 在收购 Windsurf 时,原合同赋予了微软对 OpenAI IP 的访问权,而 OpenAI 现在打算将收购从现有合同剔除,以阻止微软获取 Windsurf 的核心知识产权。
6 月 17 日,Rokid 宣布实现全球第一个可支付的智能眼镜——Rokid Glasses 内置支付宝「看一下支付」。
据悉,Rokid Glasses 是一款围绕全天候佩戴使用而设计的全功能智能眼镜,该设备具备上述支付功能后,用户只需要将眼镜对准收钱码并说一句「乐奇,付钱 XX 元」,即可进行付款操作,无需操作手机。
与此同时,Rokid Glasses 结合支付宝的多维度风控系统来确保每一笔交易的安全性,立体保障智能眼镜设备、用户支付过程,确保设备安全、「本人支付」,并承诺支付「被盗即赔」。
下一步,Rokid 与支付宝还将进一步拓展更多的便民生活服务。例如,驾车驶离停车场时快速「看一下」即可缴费;语音快速完成手机充值、水电煤缴费等生活缴费以及语音打车、点餐等相关支付场景,还可随时将用户的购买需求加入日程提醒。
据《晚点 LatePost》消息,6 月 17 日,京东集团创始人刘强东首次分享了京东做外卖、酒旅的逻辑:「京东做所有业务只围绕供应链。」
刘强东开篇就提到商业上的「对手」王兴,其表示京东在做外卖之前,自己就跟美团 CEO 王兴吃了顿饭,并向王兴透露自己要进入外卖市场。
刘强东还表示,计划在今天(6 月 18 日)宣布进军酒旅行业,并且强调「做外卖、做酒旅」这些业务的逻辑都是供应链。此外,他还透露京东成立了新通路部门,专注发展酒店、餐饮业务。
刘强东称,京东一直以来定义的体验就三个——产品、价格、服务:「我们所有商业模式都比拼的是产品比你更好、价格比你更便宜、服务比你更好」。
对于京东与美团的外卖大战,刘强东则透露称,一个月之后,京东外卖很快就会出来一个跟美团完全不同的商业模式。
另据三言 Pro 消息,刘强东认为该模式能够彻底解决食品安全问题,而且能让消费者买到高性价比且安全的食品。
刘强东还回应了外卖大战背后的逻辑:生鲜供应链。其表示,前端卖饭菜永远不赚钱,自己靠供应链赚钱就可以了。
日前,小鹏汽车董事长何小鹏面对「是否在小米股票上赚了很多钱」时,其通过「凤凰网 K 说联盟」回应称:
(小米股票)我都没有卖,我觉得还有很高的空间。
何小鹏强调,中国需要一些科技的制造业,「小米是、小鹏是,华为是」。其认为中国汽车行业需要更多的科技,少一点内卷,「只有靠科技,大家最后才可能有更好的利润」。
此前,何小鹏曾接受采访时透露,当年小米股价破发时,他花费 1 亿多美元购买小米股票;而在 2024 年,他终于在小米的股票上赚到了钱,并表示「特别开心,所以坚持很重要」。
据悉,小米集团于 2018 年 7 月在港股上市,发行价为 17 港元/股。2019 年,小米股价最低时跌破 9 港元。而截至昨日(2025 年 6 月 17 日)收盘,小米股价为 54 港元,总市值达 1.4 万亿港元。
昨日,月之暗面推出专为软件工程任务解决的全新开源代码大模型 Kimi-Dev-72B。
Kimi-Dev-72B 拥有 72B 参数,支持 BF16 精度。Kimi 团队表示,Kimi-Dev-72B 通过大规模强化学习进行优化,它能够在 Docker 中自主修复真实仓库,确保了解决方案的正确性和稳健程度,且符合现实世界的开发标准。
据官方介绍,Kimi-Dev-72B 在 SWE-Bench 编程基准测试中获得 60.4% 的性能表现,超越参数量达 671B 的 DeepSeek-R1 (0528) 版,在该排行榜中,登顶成为开源模型第一。
值得一提的是,在闭源模型排行榜中,Kimi-Dev-72B 也超越了 OpenAI o3、GPT-4.1 等模型,排在 Google Gemini 2.5 Pro(0605) 版后面。
目前,Kimi-Dev-72B 已上架 HuggingFace 和 GitHub。
HuggingFace:https://huggingface.co/moonshotai/Kimi-Dev-72B
GitHub:https://github.com/MoonshotAI/Kimi-Dev
日前,数据分析机构 Counterpoint 研究显示,2025 年 4 月与 5 月,iPhone 全球销量年增 15%,创历年同期新高。
具体来看,本次 iPhone 全球销量实现两位数增长,得益于美国和中国市场增长推动:中国与美国市场的回暖进一步推动了整体增长,其中美国部分消费者为规避关税提前购买手机,也推动了销售表现。研究透露,日本、中东与印度市场的年增长幅度也较为强劲。
Counterpoint 还指出了 iPhone 市场表现的两大趋势:产品增长动力来自多元市场的贡献;Agentic AI 尚未显著影响消费者的换机决策,为苹果争取更多准备空间。
昨日,MiniMax(稀宇科技)开源旗下大规模混合架构推理模型「MiniMax-M1」,号称「世界上第一个开源的大规模混合架构的推理模型」。
模型信息方面,MiniMax-M1 参数大小为 456B,单 token 激活参数为 45.9B。其中最亮眼的是,M1 原生支持 100 万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一致,是 DeepSeek R1 的 8 倍。
M1 采用 MoE 与「闪电注意力机制」双结合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。官方称,M1 在用 8 万 token 深度推理的时候,只需要使用 DeepSeek R1 约 30% 的算力。除此之外,MiniMax 还提出了更快的强化学习算法 CISPO。
结合上述技术,M1 实际上整个强化学习阶段只用到 512 块 H800 三周的时间,租赁成本只有 53.74 万美元。
测试结果上,M1 在软件工程、长上下文与工具使用等面向生产力的复杂场景中具备显著优势。其中,M1 在长上下文理解任务中,超越所有开源权重模型,甚至超越 OpenAI o3 和 Claude 4 Opus,仅次于 Gemini 2.5 Pro。
目前,MiniMax-M1 已上架 HuggingFace、GitHub,同时技术报告也已公开。
HuggingFace:https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094
GitHub:https://github.com/MiniMax-AI/MiniMax-M1
技术报告:https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf
据彭博社消息,Meta 日前正在计划使用 AI 生成的广告,降低营销开支,并且更简单地制作此类内容。
据悉,当地时间周二,Meta 宣布推出了一款图片转视频广告的 AI 工具。该工具允许营销人员使用 AI 将最多 20 张图片,转化为多场景视频广告,并且视频内容支持添加音乐和艺术字添加。
报道指出,Meta 的广告服务中,AI 已经成为关键项目——AI 业务已在广告收入中,占据高达 98% 的比例。Meta 大多数广告商为中小型企业,因此营销成本更低,也意味着其能在 FaceBook 等 Meta 系媒体平台投放广告的资金变得更多。
值得一提的是,不仅 Meta 紧盯着 AI 广告这块「大蛋糕」,TikTok 也在近期推出了面向广告商的 AI 工具,其中包含了广告视频生成功能。
6 月 17 日,腾讯元宝发布更新,上线 AI 编程模式。
目前,该功能现已在元宝电脑版 2.25 版本上线。用户在电脑版选择 DeepSeek 模型并关闭深度思考后,输入「@AI 编程」后,即可通过双栏界面,在左侧对话生成代码,右侧实时展示并支持预览运行。
据介绍,除此前已支持直接运行 HTML 外,在腾讯云代码助手 CodeBuddy 的技术支持下,现在元宝还能在线运行 Python、Java、C++、JavaScript、Go、Fortran 等多种语言的在线运行,均无需部署环境。不仅元宝 DeepSeek-V3 模型支持双栏编程,其他模型也支持一句话写代码。
目前,元宝的混元与 DeepSeek 两大模型均具备代码能力,支持多种主流编程语言,支持用户上传和解析多达 36 种格式的文件,适用于日常开发、代码评审、文档校对等多类用户需求。据介绍,元宝后续还会持续打磨提升代码能力,并支持解析更多格式的文件。
日前,AI 教父 Geoffrey Hinton 接受了《The Diary Of A CEO》采访,并在本次专访中分享了不少 AI 的发展、应用,以及十分吸引人的「AI 会替代什么」。
对于 AI 的风险,Hinton 表示自己认知得比较「迟缓」。他表示,自己是从 ChatGPT 身上意识到,人类正在创造的数字智能具有某种特质,使它们远远优于人类拥有的生物智能。同时,Hinton 也表示,AI 也如同具象了人类大脑的运作模式,让人类学习到更多不可思议的东西。
具体到风险内容上,Hinton 则指出了两方面——一是人类滥用 AI 带来的风险,二是 AI 变得超级智能并决定不再需要我们。Hinton 也指出,现在很多人都对第二种风险半信半疑,但他很明确地表示,「这是真实的风险」。
AI 是否会因为不需要人类而对人类构成威胁,Hinton 表示「难讲」,他解释道,因为我们不知道风险有多大,换句话来讲,我们还未处在风险情况,因此也没办法直接具体地知晓风险是什么样的。
对于风险,Hinton 依然保持「立规矩」这个理念,并且他认为,AI 的边界不应该只限制个人和公司,而是需要全范围覆盖。
在大家关心的「AI 会替代什么」上,Hinton 则表示「AI 在很多特定领域已经比我们强了」。Hinton 表示,超级智能在所有领域超越人类只是时间问题,但这个时间依然没能很好的明确,因为取决于人类对 AI 的态度,他本人则预测「10-20 年内会出现超级智能」。
在未来超级智能的世界里,Hinton 做出了自己的预测:AI 会很快替代掉像法律/律师助理这类工作,而物理操作方面的工作需要人形机器人的普及才会被替代。
对于上面的情况,Hinton 也表达了自己内心的想法——跟着自己的内心走,做自己觉得有趣的事情,而这也是保持生存、行动的动力。Hinton 强调:
「专注于你觉得有趣、有意义,并且能为社会做贡献的事情。」
🔗 采访原链接:https://youtu.be/giT0ytynSqg?feature=shared
据博主「Jukanlosreve」援引分析师 Jeff Pu 消息,备受期待的 AirPods Pro 3 或将推迟至 2026 年发布。
今年 2 月,彭博社记者 Mark Gurman 曾透露,配备心率监测功能的新款 AirPods「还有几个月到来」,暗示 AirPods 新品可能最早在今年底推出;另据 MacRumors 消息,近期有网友在 iOS 26 系统代码中发现了 AirPods Pro 3 相关的代码内容。
值得一提的是,分析师郭明錤曾在 5 月发文称,AirPods 可能要到 2026 年才会迎来重大更新,Gurman 所透露的「心率监测版」AirPods 将在明年开始大规模量产。据悉,该款 AirPods 将配备红外摄像头。
Gurman 此前曾透露,苹果计划将 AirPods 打造为下一个 AI 入口产品,其将为 AirPods 配备摄像头,通过该硬件结合 Visual Intelligence 功能感知,从而进行分析周围环境。
另外,Jeff Pu 的消息还透露了,传说中的「带屏版」HomePod 将会在今年发布,而 Vision Pro 将会在 2026 年、2027 年进行新品更新。
昨晚,Google 正式更新 Gemini 2.5 家族,其中 Gemini 2.5 Pro 和 Flash 的正式版均与预览版保持一致规格,同时还推出 Gemini 2.5 Flash Lite 预览版。
官方表示,Gemini 2.5 Flash Lite 拥有 2.5 家族中最低的延迟和成本。该模型依然为推理模型,允许通过 API 参数动态控制思考预算。并且 Gemini 2.5 Flash Lite 支持 Google 所有原生工具。
基准测试上,Gemini 2.5 Flash Lite 在思考模式下,多项测试中超越前代 2.0 Flash;而在未开启思考的情况下,也能在多项测试中媲美 Gemini 2.0 Flash。
价格方面,Gemini 2.5 Flash Lite 定价为输入 0.1 美元/百万 tokens,输出 0.4 美元/百万 tokens(其中音频输入为 0.5 美元/百万 tokens)。
另外,2.5 Flash 定价也有所调整:输入从 0.15 美元涨至 0.3 美元;输出从 3.5 美元下调至 2.5 美元。(单位:美元/百万 tokens)
近期,三星 Galaxy 正式开启旗下 Galaxy Z 系列新品预热,号称「薄到超乎想象」「影像实力,如拥有身临其境的魔力」。
而据 SammyGuru 消息,三星本次所发布的新品——Galaxy Z Fold 7 将拥有 4.54mm 的超薄厚度(展开厚度),折叠状态下厚度为 8.9mm。报道还称,本次 Galaxy Z Fold 7 还有望在折痕表现有所进步。
影像方面,Galaxy Z Fold 7 将搭载与 S25 Ultra 同款的 2 亿像素的主摄镜头,超广角规格有望与 S25 Ultra 看齐——配备 5000 万像素的传感器;长焦镜头上,Z Fold 7 则配备一枚 1000 万像素的 3 倍镜头。
值得一提的是,三星将在 Z Fold 7 上保留 Z Fold 系列的内屏 UDC(屏下摄像头),有望配备新的镜头模组。
6 月 17 日,字节旗下 AI 产品「豆包」宣布,正式上线「AI 播客」功能。
目前,用户打开豆包网页版(doubao.com)并选择「AI 播客」,上传 pdf 文件或网页链接,即可生成一段双人对话播客。
官方介绍,豆包播客的语音效果十分自然,可以模拟真人播客口语习惯,停顿、附和等细节恰到好处,去除了生硬的机器感。
豆包团队表示,AI 播客提高了创作效率,也拓宽了接收信息的方式。无论是上班路上,还是健身跑步,都可以随时打开豆包,收听专属于自己的播客。
日前,北京多所高校学生发帖称保卫处下发通知:接上级主管部门提醒,近期发现 20000 毫安的罗马仕牌充电器在充电时,相较其他品牌型号充电器,更容易发生爆炸现象。并建议师生立即舍弃,以防发生危险。
随后罗马仕方面发布声明回应称「任何经权威机构鉴定存在缺陷的产品,其将依法承担全部责任」。其还强调,旗下充电宝均通过国家强制性产品认证(3C 认证)或国际 CE/FCC 等安全监测,符合多项「GB」标准。
6 月 16 日,深圳市市场监督管理局发布公告,深圳罗马仕科技有限公司按照《消费品召回管理暂行规定》的要求,向深圳市市场监督管理局报告了召回计划。
具体来看,召回产品制造日期覆盖 2023 年 6 月 5 日至 2024 年 7 月 31 日,共计 491745 台,共三个型号:PAC20-272、PAC20-392、PLT20A-152。
深圳市市场监督管理局表示,本次召回的移动电源产品,由于部分电芯原材料来料原因,极少数产品在使用过程中可能存在过热现象,在极端场景下可能产生燃烧风险,存在安全隐患。
据新华社报道,中国作家协会于 6 月 17 日发布的《2024 中国网络文学蓝皮书》显示:
我国网络文学用户规模达 5.75 亿人。核心阅读群体为 26 至 45 岁读者,约占全部读者的 50%;「00 后」读者占比近 25%。
据悉,截至 2024 年底,网络文学作品总量超过 3300 万部,年新增 200 万部,同比增长 7%。其中现实、科幻、历史等多类型涌现精品,中短篇创作强势崛起,网络文学逐步形成独特的审美特征,丰富并拓展了当代文学形态。
收益方面,据全国 50 家重点网络文学平台数据统计,2024 年网络文学营收规模约 440 亿元。另外,网络文学海外传播数量、质量、效能进一步提高,约 4 万部作品被翻译传播。
日前,《洛克王国:世界》开启预约活动。
据悉,在 WeGame/官网预约《洛克王国:世界》,并在上线后通过 WeGame/官网下载并首次注册游戏,即可获得官方专属奖励「精灵果实-布瓜蝌家族」。
据介绍,《洛克王国:世界》是由魔方原班人马打造的「洛克王国」正统续作。游戏承袭「洛克王国」的世界观和剧情故事,以精灵收集,养成、陪伴,冒险为核心,支持多人同玩互动。
值得一提的是,该游戏支持 PC/安卓/iOS 三端游玩,服务器数据互通。
昨日,电影《魔法蓝精灵》定档 7 月 18 日内地上映。
影片讲述蓝精灵村庄每日载歌载舞一片欢乐,直到蓝爸爸被格格巫绑架打破了平静,蓝妹妹带领蓝精灵勇闯现实世界,用魔法和智慧开启冒险。
该片由克里斯·米勒执导,帕姆·布雷迪编剧,欧美音乐天后 Rihanna(蕾哈娜)献声蓝妹妹,另外汉娜·沃丁厄姆、娜塔莎·雷昂、库尔特·拉塞尔、约翰·古德曼等担任主要配音,将于 2025 年 7 月 18 日美国上映。
据新浪电影消息,由曹保平导演的《蛮荒禁地》昨日揭晓首张概念海报,内容讲述了人与兽在悬崖边缠斗一团。
据悉,《蛮荒禁地》是由五段故事组成,讲述了十九岁那年的沈星,骑着小摩托穿越边境漫长的花海,误入一片荒蛮之地。他像当地人一样抹上蓝泥抵御着无处不在的花粉,也在这时真时幻的花粉中,经历着一个个斑斓、狂野而离奇的故事。
《蛮荒禁地》由曹保平执导并担任编剧,易烊千玺、张译、黄渤、段奕宏、闫妮、梅婷、欧豪主演。
据守望好莱坞消息,影片《去死吧,我的爱》定档今年 11 月 7 日北美上映。
据悉,该片改编自阿丽亚娜·哈维茨的同名小说,讲述在一个偏远、被遗忘的农村地区,一位女子因婚姻和育儿生活而濒临神经错乱,她与精神病作斗争的同时努力保持理智的故事。
影片由琳恩·拉姆塞执导,琳恩·拉姆塞,恩达·沃尔什,爱丽丝·伯奇编剧,詹妮弗·劳伦斯、罗伯特·帕丁森、勒凯斯·斯坦菲尔德、尼克·诺特等主演。
值得关注的是,《去死吧,我的爱》入围 2025 年戛纳国际电影节主竞赛单元,并在该电影节进行首映。
有了 AI 之后,语言的门槛好像被「踏破」了。翻译不再是问题,润色变得自动,仿写、改写、模仿各种文体更是轻而易举。
这些便利的确大大减轻了负担——我们不必再一字一句地啃,也不再需要那么多「死记硬背」的时刻。但也正因如此,它迫使我们重新思考:在所有这些「省力」之后,我们和语言之间,究竟还剩下些什么?
学一门语言的意义,是不是就变成了「工具性使用」?语言还是否是感知世界的一种方式,是我们进行自我叙述的媒介,是人与世界、与事物之间探索的路径?
或许答案没有那么快。但至少,我们可以先观察一些新的工具:这次专题中,APPSO 与Capwords、Read Easy、Para 翻译这几款英语相关工具的开发者们对话,它们都在 AI 的加持下各自开花——有的回到生活场景中寻找记忆锚点,有的在阅读体验中做出细腻设计,有的则干脆重构阅读流程。
更重要的是,它们都不约而同地指向了同一个方向:在语言的难度被技术削平之后,真正需要被重建的,是我们与语言之间的关系本身。
把这款刚刚斩获苹果设计大奖的产品叫做「英语学习工具」,显然太过局限。Capwords 更像是一件关于语言、记忆和生活场景的装置:拍照即识别,贴纸设计,搭配活泼轻盈的视觉风格,让人忍不住多看几眼,也顺手就多认识几个单词。
在 Capwords 近乎直觉般的设计背后,是一个简单却深刻的理念:语言的学习回归生活,它可以从一次指认、一次散步、一次「这个怎么说」的好奇心开始。
APPSO:最早是因为小朋友有一个很简单的需求,指着东西问「这个用英语怎么说」,这就是整个灵感的来源和项目开端是吧?
DTD:对,我女儿大概三岁左右,不到三岁。我经常在夏天带她出去玩,我们会去公园,或者一些写字楼前的广场上。在玩的过程中,她会问我一些问题,比如「这个植物叫什么?」「这个路牌怎么念?」我就会一边陪她玩,一边跟她解释,有时也会用一些识别类的产品帮她查。可能是因为在她好奇心爆发那个阶段,这样的场景其实非常多。
印象比较深的一次,是在一个写字楼的地砖缝里,长出了一种叫「狗芽根」的植物。她很偶然地指着说:「爸爸,那有个狗芽根!」类似的场景让我特别触动。再结合她之前也会问我一些「这个用英文怎么说」的问题,我就在想:这种「场景 + 图像 + 信息「的结合」,可能会让她的记忆更好。我自己本身也是一个设计师出身,所以对于图像或者信息的这种感受会更敏感一点。
▲图片来自:小红书@DTD.STUDIOS
所以跟女儿互动的这些场景,很多都会给我这样的感受:语言本身应该是在生活里的,我们能用什么办法能帮助到这件事。大概就是这样一个过程。
APPSO:你们当时有意识到类似的需求,并不只是出现在孩子身上,其实更广泛的用户群都有这种需求吗?
DTD:没有,因为我自己英语就不好,我不太擅长去背,或者把一个个知识点硬塞到脑子里。我也不是学教育的,所以对于语言学习,我的理解是发生在生活里。如果有一个环境,比如聊天时看到了、聊到了,看到一个东西和图像时,会有关联记忆。我会自己总结一些原则,比如为什么某个图像会吸引我,或者一个彩色的楼,或者我们城市里看到的有特点的建筑物,引起我注意的可能就是我脑海中图形的关联性,这一点非常重要。这也许是我作为设计师的个人总结,不一定完全科学。
▲ 图片来自:小红书@DTD.STUDIOS
APPSO:市面上大部分的查词软件都比较臃肿,但 Capwords 把路径做得非常简单,一拍就可以完成。但你们担心过对学习效果的影响吗?
DTD:这个 CLU 要不你来讲讲。
CLU:其实我们在产品立项的时候,出发点并不是语言学习。回到刚刚说的,我们就是为了给我的干女儿解答问题——这是一切的种子。慢慢我们会意识到,图像会跟我们的生活形成一种「摩擦」。也就是说,通过与现实世界中的物品产生摩擦,可以强化记忆点。这些记忆点结合当时所处的场景以及全新的单词或事物进入大脑时,我们对这些信息的记忆会更加深刻。
我们在日常生活中观察到,人从小时候起就有天然的好奇心,会自然地记住所有新鲜的东西。比如去到日本,尽管我们可能不会说一句日语,但会说「谢谢」这种简单的话和一些词。或者描述可爱的事物时,会用到「卡哇伊」这样的词,因为这些东西对我们而言有新鲜感。
所以,我们在立项开始就没有定位为一个单纯学习英文或者单词的产品。并且根据我们的观察、用户反馈,还有实际落地的情况来看,我们在做的一件事情就是把接触一个新的语言的这个门槛降低,让大家会更感兴趣。对一个语言的这种感兴趣程度提高了,然后慢慢的,大家自己会再去找到一个更加系统化学习的方式。
APPSO:目前接到过哪些印象特别深刻的用户反馈吗?
@61:这个我可以来说一下。我之前的一个 mentor 有个上小学的女儿。测试阶段我给了他一个兑换码,他就带着女儿用 iPad 玩 Capwords,把家里所有东西都扫了一遍,甚至还扫了他爸的光头(笑)。
第二天,他爸来跟我反馈,说女儿居然把昨天扫到的所有单词,都写在了自己的日记本上,还自己开始复习了。接下来几天,女儿每天放学回家的第一件事,不是玩蛋仔派对,而是拿着 iPad 在家里到处找「还有什么没扫过的」。
DTD:有一些用户的反馈我确实印象很深,我看过一个用户说这是他用过最不像 AI 的 AI 产品,还有一个说这是他今年用过最温暖的 AI 产品。这也就是我们想达到的效果。
APPSO:确实,模型完全融入到了使用过程中,AI 的存在感并不强。你们在研发的时候碰到过什么挑战吗?
CLU:其实我觉得 AI 还是有一些边界和条件,但是 AI 本身的这种判断力和我们人本身的一些常识,其实是差不多的。比如我们之前测试过,一杯棕色的液体,AI 会识别成为咖啡,但是如果我亲手做的这杯饮料,我就知道它其实是凉茶,那识别结果就跟我的认知不符。
但这并不是 AI 的问题,只是误认确实会出现。所以我们在设计的时候加了调整项,如果系统识别出来的结果和认知不符合,用户可以输入调整成正确的物品。
DTD:关于识别速度上的问题,其实大模型都需要时间。把图像传过去,再回传数据回来,整个过程其实是有五六秒时间的。去年我们第一个版本发出来,我们一起玩的时候感觉没什么问题,大家都觉得非常神奇。尤其是我老婆和女儿都觉得太厉害了。但是我自己在用的时候,还是觉得那个 6 秒钟很煎熬。
后来我们优化了一些提示词,调整了图片的大小,通过各种交互上的设计来减少用户的感知,把这个时间藏在不同的交互形式后面。所以我的理解是从体验层面,去解决一些目前模型本身解决不了的问题。
CLU:还有一个是你会看到当一个物品的识别完成之后,会有一个被撕下来的贴纸的效果,我们当时就想说做成一个把现实世界里的物品,从贴纸上抠下来的效果。在抠的过程中,其实已经在做完整的加载了,只是用户没有意识到,最后就可以有一个很丝滑的体验。
▲ 图片来自:小红书@DTD.STUDIOS
我相信到最后,AI 肯定是融入或者变成一个基建,不存在说要体现具体的技术实现,用户只需要关注 AI 带来的效果就好了,而且这个结果是用户所期待的,甚至超出期待的。
翻译和原文,就像果汁和果肉:前者入口即化,后者却保留了所有的纤维质地。用母语摄取信息当然更轻松,但总有些时候,我们想要靠近原文,体会那种语言本身的节奏和肌理。
Read Easy 提供了一种「第三种方式」:中英结合。它让信息提取变得轻盈,同时保留我们和原文之间的那层联系——你可以随时切换,也可以在原文上标记关键词。它不是「翻完就走」,而是像在译文与原文之间,搭了一座随时可折返的桥。
APPSO:现在很多工具都在比谁「翻得快、翻得多」,但 RE 反而保留了大量英文。你为什么想坚持「留在原文」的这个设想?
Zhijie:因为定位不同,一开始的定位是做一个学英语的产品,一是认为人们更愿意为教育产品付费,二是语言学习是 AI 的一大场景,虽然当时不知道具体做什么。大家都知道,学英语这个领域特别卷,于是就在想可以从什么方面切入。然后发现,在英语阅读这件事,没有做得特别出色的产品,就在想有没有什么新的解法。这就有了后面的设计,也自然追求留在原文。
在做的过程中,定位发生了一些变化,因为我还是希望做一个自己会用的产品。目前更像是在「获取信息 – 学英语」 这个光谱中间的位置。我自己不需要考试,学英语不算刚需,但我依然希望自己可以阅读更多英语内容。我想阅读译文和阅读原文的差异,就如同看一张照片和去现场的差异,去现场不是必须的,但会让你有别样的感受。
APPSO:阅读中最容易让人卡住的就是生词。在设计「文内注解」这个功能时,你怎么判断哪些词该被标出来、哪些该略过?
Zhijie:理想的情况是,能够根据用户的英语水平,把用户可能不懂的词标注出来,至少让用户不需要不断查单词,阻碍阅读的流畅性。另外一些是,虽然用户可以看懂,但是如果标注出来,有助于从视觉上快速判断一句话大概的内容,比如会把人名、地名等用不同颜色标注出来。
至于功能上的实现,目前完全是由 AI 生成的,所以标注哪个词并不是完全可控的。很大程度上,AI 是根据我给的训练数据来学习该标注哪些的。
APPSO:标注的部分有不同颜色、有加粗和不加粗,这些标记没有全部开放给用户,而是自动生成,是怎么考虑的?
Zhijie:其实在设计之初,我就希望可以让用户自定义视觉风格,为此我设计了一套类似于 Markdown 的「标注语言」,Markdown 本身就是不管视觉风格的,视觉上如何呈现是由软件本身实现的。只是由于精力有限,在产品上还没有加上这个自定义风格的入口。
目前默认的视觉风格,是我做了有限的尝试后确定下来的,它还不够好,但基本上可以用颜色来区分不同的视觉层级。
APPSO:批注的形态这样会不会打扰阅读节奏,怎么去平衡整个阅读体验?
Zhijie:如果用户的英语水平很好,标注确实可能会干扰阅读,就像我们阅读中文的时候,是不需要有这些标记。但对于像我一样,有一点英语能力,但读外文仍然吃力的人,标注就是有帮助的。视力正常的人,带上近视眼镜反而会头晕眼花,但眼镜却能让近视的人看得更清晰。
APPSO:「中英混杂」是一个挺大胆的设计,很多人第一反应是「这还能看吗?」——最初是怎么想到这个点子的?有没有什么具体的场景或阅读经验促发了灵感?
Zhijie:我做产品的时候喜欢去枚举各种可能性,这是一种刻意的思考。比如是不是可以改写原来的英语句子,把复杂句改成简单句,或者是不是可以加入一些互动,甚至是不是可以生成一张图。中英夹杂算是其中一个可能性,因为开发简单,就先做上去了。
APPSO:这个设计的优势是什么?是更轻松,还是更能留住语义层次?有没有担心它反而让人依赖母语,变得不愿去理解原句?
Zhijie:我觉得优势是可以让用户使用母语快速了解一个段落,并且从四处散落的单词中多少学点英语。前面提到的定位光谱「获取信息 – 学英语」 ,中英夹杂的功能会更靠近获取信息的端点。
用户想要做什么,是否愿意去理解原句,不是一个产品能决定的。用户永远都有选择权,即便这个产品不提供翻译,他想看翻译就去用其它产品了。RE 为那些原本就有意愿阅读原文的人,提供了一个可以让阅读英语变简单的可能性。如果能让更多人加入当然更好了,但没有的话也不能强求。即便一个愿意阅读原文的人,也不是时时刻刻都想阅读原文。不想喝美式的时候,喝喝拿铁也挺好的。
APPSO:技术上怎么实现的?
Zhijie:没有任何难点,就是一套 prompt 实现的:「你是一个语言专家,你现在的任务是将一段文本转成中英文夹杂的文本,但保持愿意不变。目的是让用户既可以看得懂段落的意思,又可以学习英文,所以请你认真一点,这非常重要…..」
APPSO:「让 AI 认真一点」效果真的会有所不同吗?(笑)
Zhijie:没有严格测试过,但经验上来看可以提高稳定性。如果没有这些 trick,可能处理十条里面就有一条要出问题,加上之后会好一点——以前还会写让 AI 加油的。
移动端的即时翻译一直是一个颇有挑战性的场景:原有任务不能被打断,一边又想获取尽可能精准的译文。许多厂商都在尝试解决这个全局性的问题,而 Para 翻译的方案出人意料地「巧」。
通过,以画中画的的形式,翻译加入了整个阅读流程。只需要一个悬浮窗,就能迅速调用翻译,无需跳出当前页面。没有打扰、不需切换,却总能「刚好出现在需要它的那一刻」。
APPSO:最早怎么想到做这样一个工具?跟你自己的习惯有关吗?
大鑫:确实如此,我经常看一些国外的社交媒体、论坛,但都是英语的。我每次要么截图,要么复制文案去翻译工具里面翻译,很麻烦。
去年,我的一个朋友制作了一个全局剪贴板,利用画中画功能读取剪切板内容的能力,而不需要读取用户选中的内容。我心想如果它能读取剪切板内容,那么也应该能显示剪切板中的文本。研究了一下可行性之后,就和我的开发团队一起做了一款便捷的翻译工具。
APPSO:原来那种切换最影响的是什么?影响对内容的理解吗?目前用户对这个新工具的反馈怎么样?
大鑫:主要是影响我的阅读体验,每次来回来去地切换,对于注重效率的我来说,极度难受,看一个帖子的时间被拉长。我希望能实现的效果是,看到一篇帖子,直接看完,然后下一篇。
做完这个工具之后,我发现用户群涵盖了各种行业。有两个比较特殊的群体是留学生和外贸从业者。留学生他们在国外,经常要跟他们的一些同事、同学、朋友聊天。而外贸、出海的用户,需要线上聊天,而这些聊天工具通常是没有翻译功能的,或者需要付费使用。Para 翻译正好对上了这个需求,而且价格相对友好。
APPSO:基座模型是怎么选择的呢?各个模型之间的差异是什么?
大鑫:目前主要的是 DeepSeek,不过国内外主流的模型都有接入。测试过很多模型之后,DeepSeek 的主要优点体现在准确性比其它更高。缺点主要是慢,而且会在翻译完之后加上自己的一些理解,对整段话做附加的润色,但也可能是我还没完全调试好导致的。
豆包则是速度快,但准确性差一些。我在一些英文论坛上尝试过,有一些口语化、本土化的表达,它只会根据字面意思翻译,即便我用 prompting 调整也不太理想。目前主要是 DeepSeek,不过也支持用户手动切换和选择。
APPSO:画中画这个设计非常有意思,你怎么找到这个切入点的?
大鑫:是去年有朋友做了一个产品。其实苹果本身没有开放全局悬浮窗的能力出来,我们通过把翻译结果渲染成视频,展示在画中画里面,也适配了它的流式输出,这样一来整个体验感是会提升的。
APPSO:真是非常有巧思的路径。
大鑫:我的一些技术宅朋友看到都说,你怎么能想到这个办法?但实际上画中画还是有很多功能限制的,所以我们也做了很多优化。比如翻译的文案过长时,通过点击播放按钮进行滚动,点击回退或者前进按钮,进行上下滚动,还有翻译结果写入剪切板,可以帮助用户一键改写文案。
我觉得苹果的交互是值得每位设计师学习的。用习惯苹果的朋友都知道,在桌面下拉可以进行搜索,我本这个操作习惯也加入到 app 来,在首页下拉也可以马上进入聚合搜索,相对来说,用户上手会快一点。
在添加大模型和配置风格这两个页面上,比如用户在配置的时候,输入框要填入一些变量,我参考了快捷指令,把它放在了输入法的上面,用户点击就能马上添加了。
APPSO:你之前还提过,自己的英语水平有限,现在却开发了一个英语辅助工具。从个人经验来看,你有没有因为开发这个产品,更愿意面对英语内容了?
大鑫:确实,我发现自己在手机上浏览外国帖子的时间比以前要多。过去我主要在电脑上阅读,我安装了一个翻译插件。但是,手机上的 app 相对封闭,无法像电脑那样使用翻译工具,但自从我开发了这个工具后,我发现自己在晚上睡觉前也会打开这些软件来看一下,因此我用手机刷帖子的时间增多了。
APPSO:你更希望它保留工具的形态而不是承担学习的功能。
大鑫:对,效率工具。我希望用户在需要翻译的时候,都能迅速打开并且操作。我希望用户可以无感知地就启动 Para,随时随地,任何时候。
今年上半年,最吊足胃口和期待的,莫过于 Agent 工具,饼画得都很大:日常中那些烧脑、重复、耗时间的任务,现在似乎只需要动动手指、敲几行 prompt 就能搞定。
大饼真的很诱人,但仔细想想:想要真的做到那么有用,需要的,是某种与你我类似的思考、规划,甚至还有能自己跟自己较劲、主动反思的能力。
带着这个想法,我们测试了最新的 MiniMax Agent 进行了一轮深度测试——不再满足于入门级的考察,而是把它丢进了一些充满趣味和挑战、又不失真实的工作场景,想看看它到底能聪明到什么程度。
对 MiniMax Agent 的期待,千言万语只有一点:玩着玩着,就把活儿干了。
MiniMax 本身就在多模态模型上积累深厚,这样的优势,对于想要出产创意型作品,可谓是信手拈来。
最近的 Labubu 简直火出天际,刚好就来给 Labubu 搞个宣传计划——听起来很复杂,这个 Agent 丝毫不慌,先制定一套完整的宣传策略计划,确定交付物清单,再有序生成海报,再按部就班地准备宣传海报。
全程看下来,MiniMax Agent 一边动脑思考,一边调用合适的工具,主打一个行云流水,有条不紊。
就交付的结果来说,还真是不小的惊喜:不仅视觉审美在线,介绍文案也讲得清清楚楚,主题海报画廊一套接一套,别说,MiniMax Agent 不只能做事,居然还有点「品味」。
类似的,还可以继续用 Labubu 做主角,让 MiniMax Agent 整一本 20 页图画书。
短短十几分钟,MiniMax Agent 就实现了画图 + 编故事 + 网页排版,三步走。
效果出人意料地出色,角色形象一致性比较好,每页图配文也不敷衍,读起来有内容,看起来不枯燥,还支持网页端部署,排版合理,细节讲究。
当然,我更喜欢它将 Labubu 改成了小兔帽熊熊的昵称,听起来软萌,看起来也确实养眼,图文兼备的情况下,适合小朋友,也适合大朋友。
这次更新中,一大亮点是能做漂亮的 PPT——职场打工人的刚需。
对于 MiniMax Agent 来说,PPT 也是多模态的一种。看上去只是图片和文字,但无论是排版、内容规划和组织,都得有主题、有思路、有逻辑,并且还要能自主补全内容。
比如面向初中生设计一份物理讲解的 PPT:
或者面向投资者,制作的商业报告:
简单来说,要做好 PPT,不仅是简单的信息查找,更是对信息的筛选、去噪和跨领域关联的能力测试。
成品的效果都很好看,不禁让人好奇:在制作的过程中,MiniMax Agent 都做了些什么?
我们用市场调研类别的 PPT 做了一个测试,这类 PPT 通常数据量大、信息密集,正好可以看看它在理解数据、选择合适图表以及呈现效果方面的能力到底怎么样。
首先它能准确地拆分任务,按照「页面布局 + 图表类型 + 数据样式」三层结构来梳理内容,页面规划很有一套。
可视化的呈现,不仅完整无遗漏地展示了关键数据点,还根据不同的数据特点,选用合适的可视化方式来展示。整个 PPT 的动画过渡也做得非常流畅,把重点自然地突出出来,连微调动画的工夫都省了。
最后交付时,除了要求的 PPT 文稿外,还额外提供了 Web 和 PDF 文件,以及 Markdown 文件。
总体来看,Minimax agent 在「理解-整合-推理-生成-表达」这一完整链条上的能力都很不错,尤其是在非代码、偏文案和商业分析方面,完全称得上「专业」两个字。
如果说图文都还不算进阶,那更考验 agent 实力的场景出现了:这个任务要求把上传过去的音频文件转换一遍格式,然后转成逐字稿,并且带时间戳。最后还要根据内容生成一个思维导图。
拆开来看,这些任务都没什么难度,但合在一起完成才是难点所在。
过去,要么熟练掌握转格式工具,或耗费时间寻找并尝试各种在线转换工具。而 MiniMax Agent 直接在内部完成了这一操作,大大节省了我们寻找、安装和操作外部工具的精力。
MiniMax Agent 在整个流程中展现出的高效与便捷非常值得一赞。最直观的感受便是格式转换的无缝衔接。从进程视窗里可以看到,MiniMax Agent 在生成逐字稿方面的快速、准确。
除了能把将音频内容转换为文本,还能对音频内容有深层理解,这些都体现在给出的思维导图里。
思维导图不仅能清晰地梳理出音频的核心观点和逻辑脉络,还能准确捕捉到内容的层次结构和关键信息点。
这远超简单的关键词提取,展现了 MiniMax Agent 将零散信息结构化、可视化的强大能力。
虽然是我给下的需求,但具体该怎么实现,其实我心里也没数。倒是它自己,主动给自己安排好了工作:从安装依赖包到启动服务器,自行完成了该做的工作,一点不需要操心。
真正回到日常工作中,一定会涉及的环节是:调研了解-学习领悟-上手实践。这是人类最最基本的作业流程。毕竟,没有调研,就没有想法。
那么,想要成为一个优秀的 agent,这个流程也必不可少——很复杂,但是很必要。
下面的案例中就是考察整个流程的实现:研究 Apple iOS 26 的液态玻璃的设计风格,制作一个类似的 UI。
显然,MiniMax Agent 也知道这是个相当复杂的任务,给自己制定了一整个作业计划。
接下来则是一步步的设计、部署和写代码。步骤很杂很多,但它自己有条不紊地执行,完全不需要人来操心——甚至还能想到要找「视觉冲击力强」的素材。
最终交付出来的,不仅有代码包,还有一个网站,来展示整个过程中调研获得的成果,视觉化地展示不同维度的成果。
甚至还专门留出了个交互体验的专区,可以简单体验效果——完全超出了原有 prompt 本身的设定,超额完成任务。
原有的 prompt 其实非常简单,对比最后交付的成果可以看到,MiniMax Agent 不仅仅是有调研、深入的能力,用代码完成任务的能力,更加是对任务有「自己的理解」。
资料调研是基本功了,难度不高,但是个细致活——尤其是根据最新的新闻做调研,信息获取要尽量延伸。
从思维链的过程,以及交付成果上来看,Agent 在完成这份研究报告的表现,远超预期:不仅完成了结构化的信息整合,还展示了自己的推理本领。
在报告中,MiniMax Agent 并不只是简单罗列数据,而是能识别了市场规模「自上而下」与「自下而下」的巨大差异 ,并将其作为「重要的市场洞察」提出。
显然,简单的信息罗列,称不上是真正的「深度研究」。Agent 需要识别数据背后的模式、趋势、因果关系,并在这些基础上,形成有价值的「洞察」和「核心观点」 ——这需要的,是超越文本匹配的推理能力。
Agent 是今年 AI 最火的赛道之一,大家都在谈论 Agent 的未来,但真正让 Agent 从炫技演示和「五分钟热度」的玩具走向能改变生产力的工具,其实寥寥无几。
拥有自研模型的 MiniMax 推出了自己的 Agent 产品,给我们展现出了不一样的打法。在测试后我们也对 Agent 有了新的理解:决定 Agent 体验的,不只是模型本身,还更多体现在那些看不见的基础设施上。
这里有个特别值得一提的细节——作为独立公司,MiniMax 几乎是唯一一家能够提供完整全模态能力的厂商。
▲ MiniMax 语音模型 Speech-02-HD 位列 Artificial Analysis Speech Arena 榜单第一
▲ MiniMax 视频模型 Hailuo 02 位列 Artificial Analysis Video Arena 榜单第二
Agent 大部分的能力都依赖于模型这个引擎,「模型即 Agent」的趋势也越来越明显。
在这一点上,模型公司做 AI 应用的优势就体现得淋漓尽致了。由于直接掌控模型底层,他们能更有效地优化调度逻辑、降低运行成本,并构建数据飞轮来自主迭代。
MiniMax 就是这样的典型代表——随着其自有模型能力的提升,Agent 的运行成本不断优化,性能也显著增强。
今天 MiniMax 开源全球首个大规模混合架构的推理模型 MiniMax-M1,原生支持 100 万 token 的输入长度和 8 万输出 token 的行业最长输出,推理算力生成 10 万 token 只需要 DeepSeek R1 的 25%,将推理模型的价格又打了下来。
当其他创业公司还在为高昂的 token 成本发愁时,MiniMax 已经能够通过提升自有模型比例来系统性地降低 Agent 运营成本,这对用户能持续稳定地体验十分重要。
这正是「Minimize Efforts,Maximize Intelligence」的极致诠释,简单来说,就是用最小的努力换取最大的智能。
MiniMax 这种「左手模型,右手 Agent」的布局,让他们能够在技术能力和用户价值之间找到最佳平衡点,确实具备了在这场智能体竞赛中脱颖而出的条件。
我们正身处一个前所未有的转折点:AI 正从工具进化为拥有「大脑、感官、手脚」的复合智能体,它为未来工作与生活,开启了更新、更酷的想象空间。
入门级价位的车型或许是令车企设计师相当头疼的存在,毕竟想要在成本、体验、配置之间找到一个平衡的解法并不容易。
但各家车企向来对入门级车型却都相当重视,除了能够更好在年轻的潜在用户之中建立影响力之外,低价位的车型开发也能让车企在供应链管理和成本控制方面积累经验。
奥迪 Q3 曾经就被称为「年轻人的第一台 BBA」,借助 A3 和 Q3,很多人第一次建立了对奥迪的品牌认知。
历经两代之后,奥迪 17 日在德国发布了第三代的 Q3 车型,在外观、内饰和配置方面都做了不少调整。
新款 Q3在社交媒体上被讨论最激烈的部分是——全新设计的拨杆。
新款 Q3 采用了怀档设计,将原本位于中央扶手的换挡杆转移到了方向盘后面,原先的部位保留了启动按钮、音量旋钮以及电子手刹,余下的空间则分配给了两个杯架、一个无线充电面板和两个 USB 接口。
新的拨杆并不是我们熟悉的样式,新 Q3 上的拨杆采用了双层设计,左侧拨杆的第一层上面放置了一个旋钮,用来控制前后雨刷的频率,第二层则可以上下拨动来控制转向灯。
由于在上面集成了太多功能,所以这个拨杆也显得格外宽大。
新的怀档之外,新款 Q3 的内饰也更换成了奥迪 Q6 e-tron 同款的设计,采用了全液晶的 11.9 英寸的仪表盘和 12.8 英寸的触摸中控屏设计,只是从目前奥迪发布的图片来看,数字仪表盘周围的黑边区域似乎有些过大了。
我们还注意到,奥迪传统的原型方向盘被更换成了新的上下平底的方向盘,方向盘上的按钮也从实体按键变为了触摸按键,同时中控台也经过了重新设计,上面的出风口被移到了屏幕下方。
新一代的奥迪 Q3 在内饰材质上有所改进,不仅在前侧的车窗上首次配备了隔音玻璃,还使用了更多的柔软材质,包括由 100% 回收聚酯制成的布料,以及由回收尼龙纤维制成的天鹅绒地垫。
在座舱内的其他配置上,奥迪表示新款 Q3 将提供多种选择,比如「带有 300 个激光切割孔的发光门板」和 420W 的高级音响系统。融入 AI 大模型的奥迪语音助手和辅助驾驶系统也将以选配形式提供。
新款奥迪 Q3 采用了全新的外观设计,与现款的 Q3 大相径庭,我们多少能从它身上看到新款 A6 Avant 的一些影子。
奥迪在新的 Q3 上面使用了分体式大灯的设计,上部的日间行车灯变成了更为纤细的形状,主体的矩阵式 LED 大灯组则被隐藏在一块熏黑的深色玻璃后面。据奥迪介绍,这个新的前照灯组包含多达 25600 个微型 LED 灯组,每个灯组的大小差不多是人类头发粗细的一半。
奥迪还在这个灯组中增加了一些安全功能,诸如当驾驶者打转向灯准备变道时,如果目标车道有车辆,灯组将会投射出一些提示信息。
新款 Q3 的尾灯由上部的可变 OLED 灯组和下方的 LED 灯条组成,车主可以从六种样式中选择尾灯呈现的样式,四环尾标也变成了可以发光的样式。
除了灯组之外,现款 Q3 也在前脸和尾部使用了和 Q5L 相似的大尺寸的蜂窝状格栅和扩散器造型。
此外,S line 运动套件将为新款 Q3 提供独特的保险杠样式和哑光银的包围装饰。
在动力部分,新 Q3 的低配版本配备的是一台 1.5L 的涡轮增压发动机和 7 速双离合变速箱,提供了 148 匹马力和 250 牛米的扭矩,其在日常使用中可以关闭四个汽缸中的两个来节省油耗。高配的版本的 2.0L 发动机则可以产生 261 匹马力和 400 牛米扭矩,并搭配有 Quattro 四驱系统。
此外奥迪 Q3 还提供了一台插混版本,此版本在 1.5L 的发动机之外搭配了一块 19.7kWh 的电池,在 WLTP 工况下的纯电行驶里程约为 120 公里,两者结合提供了 268 匹马力和 400 牛米扭矩,和燃油车型不同的是,混动车型搭配的是 6 速的自动变速箱。
奥迪还介绍了他们在新 Q3 上使用的自适应悬架和双气门减震器带来了「更好的驾驶体验」以及「车身与悬架的连接会更顺畅」,高配车型上也新增了「平衡」和「越野+」两种模式。
在安全方面,奥迪在驾驶辅助系统上增加了注意力和疲劳警告功能,在极端情况下,新的紧急助手会接管车辆,并将其停在路边。
新款 Q3 将在今年 9 月正式在欧洲上市,预计在 26 年年内由一汽奥迪引入国内,作为参考,目前在售的新款 Q3 车型国内起售指导价为 25.18 万元,实际终端价格约为 15.7 万元。
自第一代推出以来,奥迪 Q3 全球销量已超过 200 万辆,是我们最畅销的车型之一,在我们的产品组合中享有很高的地位。(奥迪 CEO 格诺特·多尔纳)
虽然目前国内市场的新能源渗透率已接近 50%,但是 BBA 们的燃油车销量也并没有想象中的少,奥迪目前在中国市场销量最好的车型是 A6L,5 月份销量为 13027 辆,Q5L 紧随其后,售出了 10982 辆,Q3 则售出了 2937 辆。奥迪 Q3 的主要竞争对手宝马 X1 5月份在国内的销量为 4780 辆,奔驰 GLA 和 GLB 加起来则售出了 3500 辆。
那么你觉得新款 Q3 这次变化如何,还符合你的想象嘛?
2025 年被视为 AI Agent 元年,包括 OpenAI 、Google、微软在内的科技公司都提出 Agent 将开始加入劳动力大军,甚至改变工作形态。
与此同时,Google 、OpenAI 这些以软件为主要产品的公司也纷纷开始推出更多智能硬件。
这两件事并非孤立的巧合,它们共同指向了一个清晰的信号。
在前几天火山引擎「Force 原动力大会」上,火山引擎大模型智能算法负责人吴迪认为,让 AI 能力变得触手可及,将助力 IoT 硬件和轻量级硬件的全面升级,整个硬件价值体系也将可能会被重新塑造。
在中国,火山引擎作为云和AI 服务平台,虽然并非传统的硬件制造商,但却用另一种方式参与到 AI 和硬件产品的融合中。全球前十的手机厂商中有 9 家都和火山引擎有深度合作,火山引擎的端云协同架构正在成为智能硬件的「大脑」和「神经」。
在我们跟从业者的沟通中发现,硬件厂商在和 AI 结合中普遍面临的挑战是,市场生态的碎片化以及高昂的开发成本。这也是一些 AI 硬件昙花一现,却始终无法成为用户常用设备的重要原因。
火山引擎在其智能硬件解决方案中反复强调的「原子化能力」和「端云一体化」理念,恰恰也切中了当前 IoT 设备AI化进程中的核心症结 ——如何打破端与云之间的壁垒,让 AI 能力更顺畅地流淌到每一个硬件终端。
海量的 AIoT 硬件已经成为 Agent 的重要入口,谁率先做好了设备端到端的响应,谁就能在这个方兴未艾的 AIoT 市场拔得头筹。
一个 3 岁的孩子抱着毛绒玩具,问它「为什么天空是蓝色的」,玩具立刻用童趣的声音回答,还能根据孩子脸上的表情调整语调——这不是科幻片,而是 Haivivi 这样 的 AI 玩具已经实现的场景。
这背后其实是火山引擎用「原子能力」组成的 AI 工具箱,这是火山引擎泛互联网行业解决方案负责人江南提出的概念。
江南认为,技术提供者应「以原子化和组件化的方式提供服务」,即把AI大模型的能力(如语音、语言、多模态等)拆分成标准化、可组合的API/SDK,供合作伙伴灵活调用。
原子能力不是孤立的功能点,而是「能力即服务」,不仅提升了合作的灵活性,也大幅降低了厂商的开发门槛,从而推动整个行业的创新和生态繁荣。
火山引擎这些原子能力就像乐高积木,为硬件厂商提供近乎「开箱即用」的智能化工具箱。
爱范儿梳理了火山引擎给智能硬件准备的「原子能力」:
▲一图看懂火山引擎原子能力「工具箱」
在 AIoT 领域,豆包大模型扮演的角色远远不只是聊天机器人。除了能够识别用户的意图,还有不断变强的逻辑推理能力,使得硬件设备在面对复杂场景时能够进行一定程度的自主判断。
同时,豆包大模型对多模态交互的支持,意味着未来的智能设备将不再局限于单一的语音或文本输入,而是能够综合处理图像、声音等多种信息 ,这为实现更自然、更接近人类交流方式的人机交互奠定了基础。
例如,豆包最新的 Seed 1.6 Flash 模型作为轻量级的语言和视觉合版模型,能做到 1 秒输出 100 个Token,大大提升了端到端的响应速度 。
至于扣子这个 AI Agent 开发平台,让没有深厚编程背景的产品经理也能零基础快速搭建 AI 应用。它就像是提供了一套「一站式」的开发模板,大大缩短了从创意到产品的周期。
扣子的端插件能力特别值得关注 。它能让智能体与物理世界直接交互——比如让AI助手不仅能回答”今天天气怎么样”,还能主动帮你开启空调并调节到合适温度。这种能力让硬件从被动响应转向主动服务 。
在交流环节,ASR 语音识别和 TTS 语音合成技术负责让设备「能听会说」。火山引擎的 ASR 即使在嘈杂环境下也能精准识别指令,而 TTS 技术让机器的声音不再冰冷,变得更有「人情味」。涂鸦智能接入后,语音识别准确率提升了超过 20% 。
还有一个关键的是 RTC 实时通信技术,它像是连接设备与云端的”高速公路”,确保音视频数据能够低延迟、高稳定传输 。
这对 AI 玩具至关重要——当孩子问问题时,如果等待 3-5 秒才有回应,体验就会大打折扣。火山引擎通过优化,将响应时间压缩到 1 秒内,让对话变得像真人交流一样自然 。
火山引擎大模型智能硬件负责人邢孝慈指出,端到端的实时性能是 AI 智能硬件落地的最大技术挑战,尤其是在云端推理场景下,响应速度直接影响用户体验。
火山引擎通过端云一体化优化,大幅提升 AI 语音交互的响应速度,已实现语音实时对话,最快只需1秒,平均时间小于 1.5 秒。
而为了让设备「看懂世界」,VLM 视觉-语言模型让摄像头不仅能「看到」画面,更能「理解」内容。比如识别孩子的手势表情,或者分析图片内容并回答相关问题 。移远通信的全系智能模组都已接入这项能力,让终端设备可以无缝融合多模态 AI 功能 。
Function Calling 函数调用则像是万能遥控器,让 AI 能够主动调用各种外部服务——控制家电、查询天气、设置提醒等连贯操作都能一键搞定 。
火山引擎的这套方案真正的竞争力不是「原子能力」本身,而在于如何将这些能力有机整合。
江南告诉爱范儿,原子能力的开放使火山引擎能服务于整个硬件生态链,包括芯片厂、整机厂、终端品牌等,形成「云+端」一体化的赋能体系。
这样一个完整的端到端服务体系,覆盖从设备数据采集,到边缘计算处理,再到云端大规模推理的整个链条, 这种「一站式服务」与传统云服务商提供孤立 AI 接口的做法截然不同。
同时通过与乐鑫科技、博通集成、移远通信、广和通等芯片模组厂商的深度合作,火山引擎提供「硬件+算法+平台」的全套支持 。这种合作模式让硬件公司能够更平滑地将 AI 能力嵌入产品中。
与其说火山引擎是技术供应商,不如说它更像是站在硬件厂商背后的「AI 军师团」。它不仅提供技术,更重要的是将字节跳动在抖音等 C 端产品中验证过的 AI 技术和运营经验,像搭积木一样自由组合,支持给 B 端硬件企业 。
当然,真正的考验来自始终市场第一线,技术架构的骨骼需要落地产品才会有鲜活的血肉。火山引擎一直强调的「更强模型、更低成本、更易落地」,是否能真的让这些 AIoT 产品在市场中掀起波澜。
Haivivi 不再是过去那种只会简单重复预设语音的「智能玩偶」,它能够根据与孩子的长期互动,更准确地理解孩子略显稚嫩、甚至有时不太规范的语言表达,学习孩子的兴趣偏好,提供个性化的陪伴内容,甚至在孩子情绪低落时给予安慰与鼓励,因此受到不少家长和孩子的欢迎。
这其中的关键,是音视频智能互动设备解决方案。Haivivi 通过深度集成火山引擎的豆包语音大模型以及「扣子」进行 Agent 构建,打造出了一套完整的 AIoT 互动系统。
据 Haivivi 联合创始人高峰介绍,为了达到自然的交互效果,Haivivi 团队与火山引擎的工程师们在多个层面进行了深度优化。
例如,在语音交互的响应速度上,通过优化端云协同的链路,将从用户发出语音指令到玩具给出反馈的端到端延迟控制在了行业领先的水平,部分场景下可以达到 300 毫秒以内。
▲Haivivi 联合创始人高峰
这款 AI 陪伴玩具能够声情并茂地讲述各种有趣的故事,还可以充当英语陪练陪伴孩子练习口语,与孩子进行成语接龙游戏,在这些备受青睐的使用场景里,保障儿童在对话过程中的沉浸感至关重要。
与 Haivivi 这类直接面向 C 端消费者的品牌不同,涂鸦智能作为一个全球化的 IoT 开发平台服务商,他们与火山引擎的合作则更多地体现在如何帮助广大的开发者。
今年年初,火山引擎与涂鸦智能达成合作,将豆包大模型全面接入涂鸦 AI 云开发者平台,共同推进AI大模型及云原生技术在多场景的规模化落地,这就有点像 AIoT 市场的 App Store。
双方合作的一个重要发力点恰好也是 AI 玩具领域。开发者可以在涂鸦的平台上更为便捷地实现音频、视频、图像和文本等多模态AI能力的一站式整合与调用 。
这意味着,即便是中小型的玩具开发者,也能够以更低的门槛、更快的速度,为其产品赋予先进的 AI 交互功能,有机会孵化出更多像 Haivivi 这样自然有趣的爆款产品。
旧品类因为 AI 对体验的重塑不只有玩具,这些年打开率不断走低的电视也开始有了变化。
用户想在电视上找到某个明星主演的电影,需要层层点击遥控器,在复杂的菜单中穿梭。
现在,你只需说出「我想看 xx 的电影」,电视不仅能瞬间找到相关影片,还能智能生成专属海报墙,整个过程的响应速度控制在 1 秒以内。
创维研究院院长、酷开 CTO 郭尚锋在「Force 原动力大会」的分享中,强调了一个朴素却关键的观点:实时反馈才是用户高频交互的核心。
▲创维研究院院长、酷开 CTO 郭尚锋
上述的电视交互体验,酷开称之为「超级智能体」。背后是利用豆包大模型的语义理解和个性化生成能力,更好理解你的用户观影偏好,然后深度融合火山引擎的语音交互技术,实现自然流畅的对话,简化电视依赖遥控器层层点击的复杂交互模式。
这种个性化服务延伸到了教育、健康、生活服务等多个垂直场景,郭尚锋透露酷开的 AI 绘本馆能在 12 秒内生成个性化故事,用户日活率因此提升 60%以上。
如果说智能玩具和智能大屏是 AIoT 在存量市场的智能化升级,那么 AR(增强现实)眼镜则代表了 AI 与硬件结合,在开创增量市场、探索下一代个人终端的巨大潜力。
灵伴科技(Rokid)副总裁、XR 中心负责人王俊杰认为,AR 眼镜有望成为下一代个人信息终端,它能在三维世界实现信息交互效率和体验的巨大提升。
这个愿景的实现尤其需要空间计算和多模态 AI 的深度融合,目前 Rokid 已经全面接入豆包多模态 AI 大模型。
▲Rokid 副总裁、XR中心负责人王俊杰
Rokid 作为国内AR领域的领军企业之一,其与火山引擎的合作,则为我们揭示了AI在空间计算时代可能扮演的关键角色。
据王俊杰介绍,与火山引擎豆包大模型的联合研发,Rokid不 仅优化了其 AR 眼镜内置AI助手的数据链路,提升了语音识别的准确率和自然语言理解的深度,更重要的是,能够结合豆包大模型的多模态理解能力,更好地将AI分析结果与用户所处的真实物理环境进行融合与叠加,从而提升AR应用的综合体验。
例如,用户佩戴 AR 眼镜看到一幅画作,AI 助手不仅能识别画作信息,还能结合用户偏好推荐相关的艺术展览;或者在工业场景下,AR 眼镜可以实时识别设备故障,并将维修指南以三维模型的形式叠加显示在工人眼前。
从会「读懂」孩子情绪的智能玩具,到能预测用户需求的客厅管家,再到将虚拟与物理世界无缝融合的 AR眼镜,成熟的硬件市场,开始兴起一股 AIoT 产品的新浪潮。
火山引擎在智能硬件上做的这些,在模型参数和算法迭代狂飙的今天,是一条有点不同的路线:它要做的,远不只是硬件的「技术供应商」,也不是单纯训练一个更会「考试」的模型,或者一个更会「聊天」的机器人。
在火山引擎的剧本里,AI 是要真正「动起来」,随着大量 AIoT 设备自然融入用户的生活,成为能感知、会思考、有温度的伙伴。
为了让 AI 融入更多低算力的终端设备上,他们甚至把端侧 SDK 压缩到仅 100KB 内存的低功耗设备里,让百元级硬件也能拥有「聪明大脑」 。
这背后,是对端云协同架构近乎苛刻地打磨,也是对成本控制的极致追求。当大模型推理成本被大幅降低,AI 才不再是少数巨头的「专属玩具」,而是真正有望「飞入寻常百姓家」 。
火山引擎最近也推出了 MCP 服务,那些在 AI 技术积累上还处于「新手村」的传统企业或初创团队,未来有望可以通过 MCP 服务,快速、便捷、低成本地为自家产品装上 AI 引擎,实现从「功能机」到「智能机」的一键升级 。如同邢孝慈在分享中提到的:
MCP 等新服务进一步降低整体开发门槛,并且提高智能化的上限,使得更复杂、更智能的 AI 体验能够广泛应用到各个行业
这种硬件和 AI 的融合,可不是简单地给个 API 接口就完事了,而是从「芯」到「销」的全链路服务:
从豆包大模型、RTC 实时通信这些底层技术「硬菜」,到扣子这样的 AI 应用「快手菜」开发平台,再到拉上博通集成、广和通这些芯片模组大厂一起优化,甚至还帮你对接电商渠道「带货」。
这种从底层技术到上层应用的完整生态闭环 ,这不是简单的业务延伸,更像是而是一次基础设施级别的重新定义。邢孝慈告诉我们,智能硬件正从「功能型」向「服务型」转变。
所以说,无论是软件还是硬件,火山引擎似乎都正试图构建 AI 时代的「新基建」。
在日新月异的 AI 洪流中,不只我们的工作方式会面临转变,在智能硬件市场很有可能也会迎来「重新洗牌」,开启一个全新的竞争格局。在这个崭新的赛道上,火山引擎已经在狂奔,更多厂商也正在入局。
我们或许也可以期待这些 AIoT 产品涌现后的新生活:多模态融合、端云协同的技术架构,以及基于 Agent 的自主服务能力,让智能硬件升级到下一个维度的「智能」:真正懂用户、更个性化、从被动转向主动服务。
不同以往使用悬浮窗同时打开多个 app,iPadOS 26 中的多窗口使用户能够任意调整应用窗口大小、精确放置它们,并同时打开更多的窗口,这意味着你可以像桌面电脑一样,开多个窗口,「左右开弓」。
在接受爱范儿的独家专访时,Apple 平台产品市场高级总监 Kurt Knight 表示,这一切并非一蹴而就,而是 iPad 长期以来的软硬件演进水到渠成的结果。
在桌面电脑上,我们习惯通过鼠标键盘操作窗口,对系统的微小延迟也能容忍。但在触屏设备上,哪怕是轻微的卡顿,都会破坏直观的交互体验。而在过去的技术条件下,iPad 的性能尚不足以在运行复杂多任务的同时保持触控体验的「零延迟」。
而今,iPad 性能显著增强,屏幕尺寸更大,用户的使用方式也发生了变化——越来越多的人连接外接显示器,或者用 iPad 处理高强度的任务。正是这些变化的积累,让 iPadOS 多窗口的真正形态得以实现。
在推进 iPad 的生产力演化上,苹果并非单纯地让 iPadOS 变成 macOS,而是在尊重其独特性基础上延展其边界。
Apple 系统体验软件副总裁 Sebastien Marineau-Mes 提到,Mac 是鼠标优先的操作设备,而 iPad 则是以触控优先。这也是为什么,在设计 iPadOS 的窗口管理时,苹果做出了一些有别于 Mac 的选择:
同样是分屏,iPadOS 上用户可以通过通过手指拖拽滑动,将窗口快速排列整齐。
而菜单栏也不像 Mac 上那样时刻常驻屏幕顶部,而是在需要时才会现身。用户可以通过下滑手势、或将鼠标光标移至顶边唤出应用的菜单栏,它的视觉样式和功能延续了 Mac 的传统,但不会长期霸占触控设备宝贵的屏幕空间。
iPadOS 的菜单栏也更像移动设备的逻辑,它针对当前活动应用显示:如果同时开着多个应用窗口,系统会根据用户当前正在操作的那个应用来展现其菜单栏。如此一来,在保持与 Mac 操作习惯相通的同时,又避免了在触屏设备上长期占据屏幕空间。
就连 Mac 上经典的红、黄、绿三色「信号灯」窗口按钮,也被重新设计成更适合触控的样式:三色按钮被收纳进一个椭圆形图标中,用户轻触后即可展开为适合手指点击的尺寸。
Sebastien 认为,iPad 体验的核心在于「灵活性」和「多用性」。
Kurt 说,Final Cut Pro 就是个很好的例子,虽然很多人非常习惯用键盘鼠标来进行操作,但仍然可以通过其他的触控形式完成移动工作站形式下的视频编辑工作,多种输入形式带来了这种自由度。
换句话说,一个基于触控的、低精度的设备,是比较容易去嫁接键鼠这套交互的,而像 macOS 这样高精度的设备,就不能粗暴地加上触控来保证良好的交互体验。
在生产力进化的路上,iPadOS 26 还新增了一系列面向专业用户的特性。其中一项关键功能是对后台任务(Background Tasks)的支持。当用户开始视频渲染和导出这样需要长时间运行的操作时,该任务会以实时活动(Live Activities)的形式在界面中呈现,方便用户追踪进度。
Sebastien 提到,iPadOS 系统会智能根据用户需求来调度前台任务和后台任务的计算资源。这个调度的核心是保证用户交互体验的流畅性。所以你无论如何都不会也不应该看到 iPad 上运行重型任务导致系统卡顿。
我问道,如何定义「生产力」?不同平台是否在生产力上有各自的侧重点?
Kurt 回答说,「生产力」并非固定不变的概念,而是随着时代和用户需求不断演化。每位用户都有不同的工作方式,也就对应着不同的生产力场景。苹果会持续为 iPad 注入新的能力,以满足这些不断浮现的使用需求。
「在我早些年的工作中,像录制播客、视频这样的一些需求几乎是不存在的」,Kurt 感叹道,「而现在,这些已经变成非常普遍的趋势和需要了。」
正因如此,苹果为 iPadOS26 带来了几个服务播客创作者的功能:新的音频功能,让用户可以在录音时手动选择音频输入设备,甚至为每个应用程序选择不同的麦克风,而通过本地捕获(Local capture),用户可以在任何视频会议应用程序中直接在 iPad 上录制屏幕,并生成高质量的录音。
关于「你的下一台电脑究竟是 Mac 还是 iPad?」这个旷日已久的问题,Sebastien 给出了他的看法:
Mac 和 iPad 之间并不是一个非此即彼的选择。虽然有很多只持有一个设备的用户,但也有非常多的用户同时使用两个设备,我们希望给他们更多自由去选择最契合当下任务的工具。
他举例说,在绘画创作领域,专业应用 Procreate 让 iPad 成为了无可替代的数字画板;而在航空航天等特殊行业中,iPad 因其便携的多点触控大屏,又成为飞行员电子飞行包等用途的重要设备。
这些都是 Mac 所难以完全胜任的。反之亦然。因此苹果更关注的是如何让两种设备相互协同、各展所长,而不是简单地看谁取代谁。
在多年前一篇文章里,我表达过类似的观点:
人们桌面上的办公用品——电脑、键盘和鼠标,已经几十年没有发生变化了。我们已经 365 天无数次地习惯,工作,就是坐在格子间里,翻开笔记本,用鼠标游走于一个个文档,一个个标签页,和一个个对话框。
而不管你是医生、记者、律师、还是音乐人、建筑师,PC 或 Mac 是多数人唯二的选择。但世界上仍然有一些人,有一些工作,在乡野稻田,在高山峡谷,在万丈高空。
世间行当三百六,那工具也不应该只有一种选择。
iPad 面世那年,还是一个纸和笔主宰大学课堂的时代。
乔布斯说,iPad 是手机和笔记本电脑之间的第三种设备。他坐在沙发上,向全世界展示了 iPad 的诸多价值:浏览网页、发邮件、看视频、玩游戏。
发售后,业界谈的最多的话题其实是数字出版,iPad 也一度带火了一批数字阅读工具和杂志,Flipboard、Zite,当然还有那个著名的先烈——The Daily,结果呢,娱乐至死,iPad 没能拯救数字阅读,也没能动摇笔记本电脑的位置,一度沦为老少咸宜的「沙发」设备。
几年功夫,手机屏幕越做越大,笔记本越做越轻,留给这个中间设备的夹缝越来越小了。
变化发生在 2015 年,这一年苹果发布了 iPad Pro,iPad 自此开始与生产力工具有关,于是有了更大屏幕、多任务、键盘外设,还配备了一支 Apple Pencil。
多年以后,iPad 成为大学课堂上几乎人手一台的学习工具,承载着教材和笔记的双重作用。
Apple Pencil 成为 iPad Pro 生态中最有趣的部分——第一代 Apple Pencil 问世的时候,它只是个可有可无的配件,今天这根笔已经是一根完整的输入设备,深受学生市场青睐。
Pro 的改进和投入是渐进式的。此后五年,我们在 iPad Pro 上看到更大的屏幕、更好的拓展性、跑分堪比 mac 的芯片、越发接近桌面端的交互,以及越发独立的 OS。
iPad 的复杂性在于——苹果用了十年时间,以难以想象的产品能力迭代,本质上要解决的是一个大于产品的问题:
它对标的一直是桌面级设备,是一台电脑,但究竟什么才是「电脑」?
博主 MKBHD 的评测中记录了这么一个场景:
他让自己上小学的弟弟,把电脑递给他,而此刻他弟弟,正趴在花园里,对着 iPad 上键指如飞,他弟弟从小玩平板电脑,压根没有开机关机、建文件夹这些传统电脑概念。
然后扭头问到:
什么是电脑?
我把这个问题抛给了 Kurt:究竟什么是「电脑」?
Kurt 指着手腕上的 Apple Watch 说,它其实也是一台电脑。今天的「电脑」早已不是局限于某种形态的设备,而是一种能力的体现。
天才从来都不按剧本出牌,在硅谷尤其如此。
比尔盖茨辍学创业的传奇故事早已家喻户晓,而伴随着 Meta 砸下 143 亿美元(折合人民币 1026.97 亿元)收购 Alexandr Wang 所创办的 Scale AI,这位 28 岁的华裔天才也再次用亲身经历验证了这条铁律。
▲Alexandr Wang
按照官方公告,Alexandr 一方面将继续担任 Scale AI 的董事会成员,一方面将打包嫡系团队加入由 Meta CEO 扎克伯格亲自组建的超级智能团队。
在 Llama 4 遭遇滑铁卢之后,Meta 及扎克伯格急需打一场翻身仗,这份迫切是真实的,但问题是,把如此大的赌注压在一个非技术背景出身的 Alexandr 身上,真的划算吗?
1997 年,Alexandr 出生于美国新墨西哥州洛斯阿拉莫斯。
这个听起来有些陌生的地方,是二战时期美国「曼哈顿计划」的主阵地,原子弹就诞生于此。在 Alexandr 的回忆中,这个小镇被国家实验室包围,日常节目也都是古典音乐会、讲解低温物理学的万圣节科普课,以及随处可见的科学遗产。
他的父母也都是中国移民,曾在洛斯阿拉莫斯国家实验室担任核物理学家。
从小,Alexandr 就展现出对数学的浓厚兴趣。童年时期,凭借赢得 MATHCOUNTS 数学竞赛,他得到了一次前往迪士尼的机会,那是他人生第一次出远门,也是在那一刻,爱上了解题的乐趣。
兴趣带来驱动力,他陆续参与更多竞赛,2013 年入选美国数学奥林匹克项目,2014 年入选美国物理奥林匹克国家队。这些经历或许也为其后来的成功打下了基础。
17 岁那年,他考入麻省理工学院(MIT),第一学期就选修了研究生级别的机器学习课程。
与此同时,他也没闲着,先是在 Addepar 担任软件工程师,几个月后加入 Quora。在 Quora,他很快升任技术负责人,带队推进基础设施团队各项指标落地。
2016 年,他从 Quora 离职,转到 Hudson River Trading 担任算法开发员。
但他心中真正的渴望的是创业,于是 Alexandr 作出了一个影响深远的决定,从 MIT 辍学,并加入知名创业孵化器 Y Combinator。冷知识,Y Combinator 那时的 CEO 正是如今 OpenAI 的 CEO Sam Altman。
▲ 左为Sam Altman,右为 Alexandr Wang
有传闻称,Alexandr 还曾与 Altman 做过几个月的室友。
他后来在一次采访中提到,当时对父母说:「我告诉爸妈这只是我暑假的一个项目,结果我就再也没回学校了。」
在 Quora 的经历,让他深刻理解了机器学习系统中基础设施与数据管理的难题,也正是这些难题成了 Scale AI 的突破口。2016 年,他拉上同为 Quora 前员工的 Lucy Guo 合作创办了 Scale AI,专注于 AI 发展背后最基础,但鲜为人知的关键工作:提供大规模、高质量的人类标注数据。
关于 Scale AI 的创立契机,还有一个流传已久的故事。
据说,Alexandr 很早就意识到 AI 和机器学习将会改变世界。用他的话来说,「最初我们造出了能做算术的机器,但让它们去执行那些更复杂、需要类人理解的任务,是一个令人兴奋的技术突破。」
有一天,他试图在家里冰箱里安装摄像头,用以判断牛奶是否即将喝完,几周后却发现,根本无法获得足够的数据来训练系统,准确识别冰箱里的内容,这让他意识到:未来 20 年的 AI 要想取得突破,数据 将是关键障碍之一。
由此,他创立了 Scale,目标是成为「推动 AI 变革的数据基础设施」。
2016 年,距离 ChatGPT 的爆火出圈,还有一大截时间,相比之下,自动驾驶的热度反而才是当时硅谷的香饽饽,Scale AI 初期便聚焦服务自动驾驶赛道,为车载系统提供图像识别数据,解决 AI 视觉训练的「数据荒」。
凭借精细化标注服务,Scale AI 逐步建立口碑,赢得早期客户信任。
作为一个年仅 19 岁的创业者,想要在这个赛道站稳并非易事。但 Alexandr 采取了相当务实的策略,带着笔记本和产品 demo,前往计算机视觉顶会 CVPR, 一个展台一个展台地推销产品。
2019 年,Scale AI 获得 PayPal 联合创始人 Peter Thiel 的 Founders Fund 投资 1 亿美元,正式跻身「独角兽」。几年后,Scale 再获 5.8 亿美元融资,估值达到 73 亿美元。
▲硅谷著名投资者 Peter Thiel
这期间,Alexandr 和 Guo 双双登上了《福布斯》「30 位 30 岁以下精英榜」中的企业科技类榜单。不久之后,Guo 因为在产品愿景和发展路线上的分歧离开了公司,不过,外界也有传闻是被驱逐。
冷知识,在 Meta 宣布收购 Scale AI 后,Lucy Guo 也因持有 Scale AI 的股份,超越现年35岁的流行歌手泰勒·斯威夫特,成为最年轻的白手起家女性亿万富翁。
Guo 走后,Alexandr 继续独挑大梁。
AI 发展三要素离不开算法、数据和算力,大型语言模型(LLM)需要庞大的数据集进行训练。大语言模型越卷,数据就越值钱。Scale AI 的数据外包工厂开始变得越发重要起来。
通过雇佣数以千计的合同工,负责筛选、标注和清洗数据,再将这些整理好的数据集提供给科技巨头进行模型训练,Scale AI 的客户名单也因此横跨技术公司和传统企业,包括 Waymo、丰田、本田、Alphabet、埃森哲、OpenAI 等。
当然,一路走来,Scale AI 并不全是高光。ChatGPT 爆火后,Scale AI 就频繁出现在国际头版头条上,除了天才少年的造富神话,更多曝光的却是他出格的言论以及压榨劳工等负面信息。
根据《华盛顿邮报》的报道,在全球最大的数字外包中心之一的菲律宾,至少有一万名工人通过 Remotasks 平台为 Scale AI 提供数据标注服务。
然而,通过数十位现任与前员工的证词,以及平台截图、支付记录、内部通知等材料调查发现,这些劳工的报酬极低、付款延迟甚至无故取消,已成常态。并且申诉渠道几乎形同虚设。
与之形成鲜明对比的是,2024 年,Scale AI 营收约为 8.7 亿美元,且在被收购前就预期 2025 年收入将翻倍至 20 亿美元,估值有望冲击 250 亿美元。
在 2025 年之前,Meta 一直是开源模型领域明面上的领头羊,直到年初天降紫微星 deepseek 的出现,打乱了 Meta 的节奏,甚至传出 Meta 员工爆料公司高管薪资比 DeepSeek 训练成本还高的地狱笑话。
仓促迎战的 Llama 4 模型,因为涉嫌作弊,遭到了舆论风暴上的抨击,推理班和最大参数版模型也迟迟不见踪影。技术迟滞,人才流失,产品难产,图灵奖得主 Yann LeCun 依旧挂帅 AI 科研路线,也难以挽回颓势。
很难不说,4 月份的 Meta 陷入了至暗时刻。
选择 AIl In AI 的扎克伯格自然不会收敛自己的野心,其目标是是将 AI 融入公司的所有产品中,包括 Ray-Ban 智能眼镜以及 Facebook、Instagram 和 WhatsApp 等社交矩阵。
而 AI 是这当中最重要,也是不容扯后腿的一环。
基于此,我们看到,Meta 最近在挖人方面动作频频,扎克伯格亲自打电话、发短信、发邮件联系 OpenAI、Google 等公司的研究人员,甚至不惜开出九位数的价格试图挖墙脚。
据 The information 报道,在遥遥落后于竞争对手之际,扎克伯格越来越频繁地向一个非典型的技术人物请教,没错,正是本文的主人公:Alexandr Wang。
这位 28 岁的年轻人给扎克伯格提出了很多实用的建议。
就连扎克伯格也开始在内部会议中引用 Alexandr 对 AI 问题的反馈意见,他认为,Alexandr 拥有与多个 AI 研究实验室合作的第一手经验,能准确掌握这些实验室在追求什么样的数据、在如何优化模型。
更重要的是,聘请 Alexandr 领导 Meta 的超级智能团队,也正是扎克伯格本人的提议。
过去一年,扎克伯格也曾接触过其他人选,诸如 Google 的首席 AI 科学家 Koray Kavukcuoglu,以及前 OpenAI 首席技术官 Mira Murati,但最终,他还是回到了 Alexandr 身上。
原因之一在于 Alexandr 与 Meta 的首席产品官 Chris Cox 以及其他高管关系融洽。尽管 Scale AI 并不直接参与最前沿的AI模型研发,但 Alexandr 对行业发展路径的理解、对基础能力的掌控,赢得了扎克伯格的信任。
更何况,Scale AI 去年 8.7 亿美元的营收,也充分证明了他出色的业务能力。
太阳底下无新鲜事,这次收购本质上就是一次标准的硅谷式的人才收购。大公司以收购为名,实际上是为了雇用一家初创公司的创始人和核心员工,而被收购的公司在交易后往往会停止原有业务。
硅谷对这种收购模式并不陌生,只是 AI 浪潮推动了这种模式的蓬勃发展。
▲ Mustafa Suleyman
微软曾以 6.5亿美元 的「授权费」收购了 AI 初创公司 Inflection,实质上是为了聘请创始人 Mustafa Suleyman 和其团队;Google 以 27 亿美元收购了 Character.AI 的「合作授权」,重点也是其创始人 Noam Shazeer 和关键技术人员。
Meta 这次对 Scale 的收购,本质上也是同一套剧本。
这笔收购是 Meta 有史以来第二大收购,仅次于当年 WhatsApp 的 220 亿美元,对于账上现金储备突破 700 亿美元的 Meta 来说,用钱换人才,实现千金买马骨的效应,似乎也不是一笔亏本的买卖。
毫无疑问,Meta 收购 Scale AI 的消息震动了整个行业。
一方面,此举为 Scale AI 股东带来丰厚回报——包括 Accel、Index Ventures、Founders Fund等在内的早期投资者都将在部分变现的同时保留剩余股份 。
另一方面,这种大公司的介入也引发了 Scale AI 其他客户的担忧,尤其是 Scale AI 被 Meta 收入麾下后,是否将失去平台的中立性,存在客户数据泄露给 Meta 的风险 。
根据最新的消息,Google 正在考虑全面中止与 Scale AI 的合作, 原计划用于其下一代Gemini 模型的训练,价值约 1.5-2 亿美元的数据服务,将转向其他供应商。OpenAI 的高管也公开表示,不希望巨头的此类收购破坏 AI 生态,如果各方相互排挤将减缓行业创新步伐 。
与此同时,竞争对手则趁势出击。
数据标注公司 Labelbox 的 CEO 公开表示,预计将在今年从 Scale 手中夺走大量客户合同;Handshake 的 CEO 更直言,在 Meta 收购消息公开后,客户需求一夜之间暴涨两倍
尽管有了 Meta 的加持,Scale 的估值创下新高,但如何安抚客户、维持数据服务平台的中立性,都将是这家公司接下来需要面临的重大挑战。
而作为收购方,Meta 是否真能靠这次收购翻盘,也同样尚未可知。
Llama 系列还未完全翻身,OpenAI、Google、Anthropic 等对手依然强势,Meta 要在社交矩阵中跑通 AI,在智能眼镜等新硬件上跑通推理能力,还得同时兼顾产品体验、人才招募与生态话语权。
Alexandr 的加入,可能是拐点,也可能只是又一次代价高昂却又失望的豪赌。
现在,一切都还只是下注。
🚗
小米 YU7 本月底发布
📺
广电总局:严控「互联网电视收费包自动续费」默认勾选
🧠
12306 回应「上高铁就睡觉是因缺氧」
📱
特朗普集团进军手机市场,推出「T1 Phone」手机
👓
新一代 Meta AI 智能眼镜将在本周五发布
⬇️
苹果 AI 部门高管或被降职
😠
广汽埃安回应员工股权风波:纯属恶意造谣
💡
Cursor CEO:五年内所有编程将用 AI 进行
📹
Midjourney 将入局视频生成
⛓️
微信灰测全新备份功能,支持 U 盘等多种存储设备
🪞
优衣库回应「试衣镜自带滤镜」
昨日,小米创始人雷军发文宣布,公司将在 6 月底举行新品发布会,届时将发布多款重磅新品。
小米 YU7:
预计新车将会在本次发布会进行价格等相关信息公布。此前,雷军曾在新车亮相时小小吐槽了一下:「还有人说 19 万 9 的,不可能。」
今年 5 月,小米 YU7 正式亮相。新车保持了小米 SU7 家族的外观主题,并新增多处新细节元素。内饰方面,小米 YU7 首发搭载的「小米天际屏全景显示」(Xiaomi HyperVision)。
新车提供单电机后驱的标准版、双电机四驱的 Pro 版和 Max 版,续航方面,标准版 CLTC 续航 836km,Max 版为 770km;本次小米 YU7 全系 800V 碳化硅高压平台。
辅助驾驶上,小米 YU7 全系标配了激光雷达、4D 毫米波雷达以及拥有 700TOPS 算力的英伟达 Thor 芯片。
6 月 16 日,据北京日报消息,雷军在北京亦庄的小米汽车工厂,向来访嘉宾介绍小米汽车所取得的成绩时表示:
小米汽车的成功离不开北京的营商环境和产业基础,也离不开智能制造与对核心技术和用户需求的把握。
REDMI K80 至尊版和小尺寸平板 K Pad:
昨日,REDMI 官方正式公布了 K80 至尊版和 K Pad 的外观信息。
REDMI K80 至尊版将采用 K80 系列设计语言,配备后置双摄;中框材质为金属。正面将搭载窄边直屏,配备超声波指纹识别。
REDMI K Pad 采用后置单摄设计,拥有一体化金属机身;正面采用 8.8 英寸四等边屏幕。
两款新机均采用联发科天玑 9400+ 处理器,其中 K80 至尊版还将首发独显芯片 D2。
小米 MIX Flip2、小米 AI 智能眼镜、小米平板 7S Pro:
据数码闲聊站消息,小米 MIX Flip2 号称「唯一满配旗舰小折」,配备高通骁龙 8 Elite 处理器,同时解决了小折发热续航的问题。
小米 AI 智能眼镜方面,其定位类似 Ray-Ban Meta,据此前 XR Vision 消息,小米 AI 眼镜将采用高通 AR1+恒玄 2700 的芯片配置,搭载了索尼 IMX681 图像传感器;新品整机综合成本约 1281 元。
小米平板 7S Pro 配备 12.5 英寸屏幕,提供柔光屏版本,搭载小米自研玄戒 O1 处理器,拥有 10610mAh 大电池和 120W 快充;支持 PC 级软件以及 PC 级悬浮键盘;厚度为 5.8mm。
另外,小米品牌总经理卢伟冰还将在 6 月 18 日举行直播,届时将透露更多新品信息。
据人民日报消息,近日,国家广播电视总局实施针对互联网电视自动续费服务的专项规范管理措施。
报道称,此次治理聚焦用户反映较为集中的自动续费「扣费前无提醒」「取消流程复杂」「投诉渠道不畅」等痛点问题,通过规范服务规则,全面优化互联网电视消费体验,在巩固治理电视「套娃」收费工作的基础上,构建更加公平、透明、便捷的互联网电视服务生态。
根据国家广播电视总局规定,互联网电视集成机构在提供自动续费服务时,必须严格遵循「用户主动选择」原则,禁止通过隐藏条款或强制捆绑其他服务的方式诱导用户开通。严格谨慎使用默认勾选「自动续订」功能,用户在首次订阅含自动续订服务的视听产品时,需通过二次确认的方式明确表达同意意愿,才可以进入支付环节。
新规定还明确要求:互联网电视集成播控平台在用户自动续费前 5 日,通过短信、App 推送、服务号信息等多种渠道发送扣费提醒,且提醒内容需包含续费产品名称、扣费金额、服务周期等关键信息,确保用户准确识别续订的产品信息。
另外,为解决用户反映的「投诉渠道不畅」问题,新规定要求互联网电视集成平台将「自动续费投诉」入口置于客户服务受理的一级菜单中,确保用户快速提交诉求,及时得到响应。
昨日,「难怪我一上高铁就睡觉」等话题登上微博热搜。有网友测评称,在高铁车厢内随着人流量增加车内二氧化碳含量逐渐增高;另外也有网友称,缺氧会让人感觉昏昏欲睡。
对于上述情况,中新经纬从铁路 12306 的客服处获悉,高铁车厢虽然是密闭空间,但在行驶过程中中央空调在保持恒温的前提下会实时更换空气和提供氧气,即便是长时间行驶乘客也不会出现缺氧的情况。
另有客服回应称,每趟列车在出发以及到站后都会做系统检查,空气方面肯定是没有问题的;而至于有乘客检测二氧化碳浓度变高可能确实是因为乘客密度变高。
昨日,特朗普集团宣布进军手机及消费通信市场,推出了「T1 Phone」手机和 Trump Mobile 移动网络。
其中 T1 Phone 通体金黄色,拥有后置三摄,主摄为 5000 万像素,相机模组采用圆角矩形设计。正面搭载了一块 6.78 英寸 120Hz 居中打孔的 OLED 屏幕,拥有屏下指纹识别。其他方面,T1 Phone 将配备 5000mAh 电池和 20W 有线充电。
值得一提的是,T1 Phone 需要等到 8 月份才会正式发布,售价达到了 499 美元(约合人民币 3582 元)。
而 Trump Mobile 移动网络方面,特朗普集团与美国三大运营商(Verizon、T-Mobile 和 AT&T)合作,并号称「为用户提供强劲的 5G 信号,贯穿全美」。
Trump Mobile 移动网络提供名为「The 47 Plan」的套餐,每月价格为 47.45 美元,用户可享受无限通话/短信/数据、完整的设备保护、基于 Drive America 提供的全天候道路救援服务、远程医疗服务、覆盖超 100 个国家的免费国际通话、无需合约。
昨晚,美国运动眼镜品牌 Oakley 宣布,与 Meta 合作的新品将在 6 月 20 日发布。
据彭博社此前爆料,本次 Meta 与 Oakley 合作的产品代号为「Supernova 2」,基于 Oakley 的 Sphaera 眼镜型号,旨在开发一款方便运动员使用的智能眼镜。
据悉,「Supernova 2」不带任何显示功能,基本等同于 Ray-Ban Meta 的运动款,对自行车骑行等运动进行了优化,眼镜的摄像头将会被放置在眼镜框中间。
彭博社记者 Mark Gurman 在 6 月 15 日的报道中提到,苹果 AI 与机器学习战略高级副总裁 John Giannandrea 已逐渐移出公司的核心管理层。
据此前多次报道,Giannandrea 此前因决策问题以及带领的团队在选择上犹豫不决,导致 Siri 没能得到很好的资源分配,从而促使了技术的落后。
因 Siri 项目的功能开发和性能表现未达预期,使得 CEO 库克对此很失望,决定大刀阔斧整改 AI 部门。而 John Giannandrea 也因此被剥离了手中大部分职责。AI Siri 的任务也交给了对这项业务兴趣浓厚的 Vision Pro 主管 Mike Rockwell,并开始向软件主管 Craig Federighi 汇报工作。
值得一提的是,去年苹果开发者大会(WWDC)上,Giannandrea 还公开露面,接受了媒体采访。而在今年 WWDC 上,苹果公关部门为了自家 AI 颜面,选择让 Giannandrea 保持低调,因此其也并未露面。
近年来,苹果因 AI 功能方面「画大饼」而备受消费者的诟病,升级版 Siri 也不断往后推迟。
日前,Mark Gurman 曾援引知情人士消息,苹果计划将新版 Siri 定在 2026 年春季发布,跟随 iOS 26.4 版本一同登场。
报道透露,新版 Siri 将接入用户个人数据和屏幕活动,以便更好地满足 Siri 获取用户需求。
日前有传闻称,某大型车企旗下的新能源品牌上市计划目前基本告吹,导致内部股票「爆雷」,数百员工拒绝还息,而不少消息都将上述品牌指向了广汽旗下的埃安。
6 月 16 日晚,广汽埃安发布《关于近日网络恶意谣言的声明》,对上述情况做出了正式回应:
此类言论毫无事实依据,纯属恶意谣言,有关广汽埃安员工股权激励计划,目前亦依法依规处于正常推进中。
广汽埃安方面强调,作为广汽旗下核心自主品牌,其发展得到了广汽集团全力支持,目前生产经营一切正常。
埃安还表示,为维护企业良性健康发展和有序的市场竞争环境,希望社会各界客观理性看待,切勿轻信不实信息。对于恶意造谣、传播不实信息者,公司埃安将依法追究其法律责任。
昨日,华为终端正式开启「华为开发者大会 2025」(HDC 2025)的预热。
从预告信息来看,本次 HDC 2025 主题为「共建鸿蒙蓬勃新生态」。活动将在 6 月 20 日至 22 日东莞市松山湖举行。
日前,华为终端 BG 首席执行官何刚在接受采访时,回应了「为什么不能等系统(HarmonyOS 5)再更成熟、生态完善了再出来」。其表示,目前 HarmonyOS 5 的确有部分功能不够完善,但在过去的时间里,华为和合作伙伴一直在努力。在 HarmonyOS 5.0/5.1 上,大家已经做了大量的工作。
何刚透露,华为与生态合作伙伴通过过去一两年的时间,让消费者的日常使用体验已经基本达到了满意的状态。其也表示,「这非常不容易」。何刚强调,其他系统通过十几年的积累做的功能,HarmonyOS 在短短一年时间里,基本上做到了一个相当的状态。
5 月,华为常务董事、终端 BG 董事长余承东也曾在演讲中表示,开发一个操作系统可能难,但也不至于「如登天」一样难;而在做(建立)生态方面,难度相当大。
据余承东此前透露,鸿蒙应用开发速度越来越快,已经有 2 万多个鸿蒙原生应用和元服务上架,鸿蒙学堂的学习人次也超过了 614 万。
另外,6 月 15 日,据华为应用市场(App Gallery)信息,微信鸿蒙版 App 安装量突破 600 万次。
据科创板日报消息,日前有消息称,字节人工智能实验室 (AI Lab) 负责人李航已经正式卸任,其在内部系统的身份变为劳务/顾问。
对于上述信息,字节相关负责人通过报道回应称:「李航是退休返聘,管理范围没有变化。」
据了解,字节 AI Lab 成立于 2016 年,最初由微软亚洲研究院前常务副院长马维英负责,直接向张一鸣汇报。2020 年年中,马维英离开字节,AI Lab 负责人一职由李航接任至今。
AI lab 目前有多个子团队,包括机器人、AI4S 等方向,几乎覆盖人工智能领域所有前沿技术研究。2018 年其团队规模达到 150 人,为字节跳动 AI 研究的核心部门。
AI Lab 主要研究重点是开发为字节跳动内容平台服务的创新技术,字节推荐算法、短视频特效等功能均脱胎于此。值得一提的是,随着抖音、TikTok 占据绝对优势的市场地位,流量商业化成为字节面临的首要问题,AI Lab 在字节内部重要性下降。
2023 年开始,AI Lab 下属负责大语言模型的 NLP 组及开发视频生成模型的 PixleDance 被先后转入 Seed 之下。
据此前报道,Seed 基础研究负责人吴永辉于今年 3 月在 Seed 内部新建虚拟小组、缩短了汇报流程,创建一个更扁平的汇报体系,而 AI Lab 将全部并入 Seed,同时也是吴永辉调整内部组织架构的一个重要举措。
昨日,字节跳动旗下 AI 产品「豆包」因 AI P 图功能而登上热搜。
从网友实测反馈,豆包仅需用户提供一句话、上传一张图,输入文字指令,即可完成对人像的各种风格转换、细节调整。同时有不少网友反馈「效果十分不错」。
今年 4 月,OpenAI 旗下 GPT-4o 模型集成了新版图像生成器,因其优秀的生图能力让不少网友为之着迷。不少网友通过 GPT-4o 的图像生成器生成了大量「吉卜力」风格图片,还因此开启了一次「吉卜力」图片风潮。
而本次豆包的 P 图功能也在抖音等社交媒体平台上,席卷了一波人像高 P 风潮,不少网友在视频评论区晒出经过豆包调整的生成图片。
日前,AI 编程产品 Cursor 的 CEO Michael Truell 做客 Y Combinator 的播客节目,分享了自己的创业经历,也提出了部分未来发展观点。
Michael 认为,在未来的 5 到 10 年里,有可能发明一种新的方法来构建更高水平、更高效的软件。其强调,大家使用 Cursor 的目标是到达那里。
同时 Michael 也表示,想要实现上述情景的途径是使用 AI 编程,然后不断发展,将其从普通编程发展到看起来非常不同的东西。
同时,Michael 也在对话中表达了自己对 Agent 的看法:其认为 Agent 在达到人类水平方面仍存在许多瓶颈。其中「上下文窗口限制」「持续学习能力弱」「用户交互界面需要革新」都是需要突破的重大瓶颈。
Michael 还表示,未来编程范式转变,而代码将变成可选项,逻辑设计与审美成为核心。其进一步解释表示,人类程序员未来更像是「逻辑设计师」,专注于构建意图而非语法细节。
他还强调,未来开发者的核心竞争力将会是「审美与判断」,其中包括代码结构美感、逻辑合理性、可维护性。Michael 认为,审美与判断是无法被 AI 替代的,并且「真正优秀的工程师不是满足已有标准,而是定义更高的标准。」
据数码闲聊站消息,联发科天玑 9500 在跑分平台 GeekBench 的跑分成绩公布:OpenCL Score 测试成绩为 15717 分。
信息显示,天玑 9500 将采用「1+3+4」共计 8 个 CPU 核心,分别为 3.23GHz Travis、3.03GHz Alto 以及 2.23GHz Gelas;该处理器将首发 X930 超大核的全大核架构。
GPU 方面,为全新 Mali-G1-Ultra MC12,频率仅 1MHz,数码闲聊站强调,更准确性能等下个月 CS。
至于正式公布,数码闲聊站则透露称「将在 9 月发布」,并且 OPPO、vivo 有望首发搭载。
日前,博主「trbdrk」公布了一段由 Midjourney 尚未发布的视频模型生成的内容。
公布的演示视频中,基本都为真实仿真类视频,在画面细节、物体物理关系、液体流动、人物肢体语言上都表现得很自然、丝滑。但依然会有部分逻辑上的瑕疵。
值得一提的是,相较于近期大火的 Google Veo3 视频模型,Midjourney 的视频模型似乎并不具备匹配音频功能。
目前,Midjourney 的视频生成模式还未正式发布,因此还可以期待一下正式版的表现。
日前,Bose 正式发布旗下全新 QC 消噪耳塞 Ultra II。
官方介绍,Bose QC Ultra II 传承 Bose 经典消噪技术,全新升级 ActiveSense 噪音动态感应性能,提供基于 AI 的背景噪音抑制功能。
音质方面,Bose QC Ultra II 将提供「沉浸空间音频」,配备 CustomTune 智能耳内音场调校技术。
续航方面,耳机续航可达 6 小时(Bose 沉浸空间音频开启状态下为 4 小时),耳机本体充电时间为 1 小时;耳机充电盒支持无线充电。
售价方面,Bose QC Ultra II 为 2299 元,提供黑色和雾白两款配色。
昨日,阿里通义千问团队宣布,正式开源旗下 Qwen3 全系列 32 款 MLX 量化模型。
据悉,MLX 是一个开源的机器学习框架,专为苹果芯片深度适配。MLX 框架可高效地训练和部署 AI 大模型,被越来越多的 AI 开发者采用。
为更好服务开发者,通义团队推出基于 MLX 框架深度优化的全部 Qwen3 系列模型,每款模型都有 4bit、6bit、8bit 和 BF16 等 4 种不同精度的量化版本,即共有32 款官方的Qwen3 MLX 模型一次性全开源。
通义方面表示,目前,Mac Pro、Mac Studio、Mac mini、MacBook、iPad、iPhone 均可轻松部署 Qwen3。
同时,Qwen3 的 MLX 模型已在魔搭社区和 Hugging Face 全面开源。
ModelScope:https://modelscope.cn/collections/Qwen3-9743180bdc6b48
HuggingFace:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
昨日,荣耀 PC 产品总经理朱臣才发文透露,2025 款荣耀 MagicBook Art 14 将升级顶部磁吸接口。
据介绍,2025 款荣耀 MagicBook Art 14 将提供多种玩法。从朱臣才公布的信息来看,新机将提供多款盲盒型磁吸配件。
另从朱臣才公布的图片来看,新机延续了上代设计,拥有完整的窄边框屏幕,保留日出印象配色,提供 HDMI 和 USB-A 接口。
日前,据我们实际测试发现,微信的备份功能进行了升级更新,能够支持更多存储设备连接进行备份。
本次全新的微信备份功能支持电脑、外部存储设备,并且新增了「自动备份」功能。
具体来看,更新后的微信备份在选择「外部存储设备」备份后,能够支持 U 盘、移动硬盘等有线传输设备;若备份被意外中断,可以在下次重新插入设备后断点继续备份;「自动备份」为次日同时间下,插入硬盘,打开微信开启该功能。
据悉,目前该功能更新仅覆盖一部分用户,并且为 iOS 客户端。
昨日,「优衣库 镜子」相关话题登上微博热搜第一。不少网友怀疑优衣库试衣镜带有「滤镜」,称在店里试穿照镜子觉得好看,但回家后差别较大。
也有网友表示,这可能跟店里灯光等环境因素有关。另有网友称,不只是优衣库,商场里服装店的镜子,拍照确实好看些。
而据极目新闻消息,优衣库线下门店方面客服人员回复称,优衣库线下门店的镜子都是正常的镜子,没有特殊的效果。针对网友反映的问题,他们也将记录向公司专员反馈。
报道还援引健康时报消息,镜子角度与曲率是影响「服装店的镜子照起来显高又显瘦」的关键原因。
6 月 17 日,星巴克中国首度联动迪士尼深受喜爱的「疯狂动物城」,以电影「打破偏见,勇敢追梦,实现自我成长」的精神内核为灵感,推出三款联名冰摇茶及惊喜联名体验,为这个火热的夏天带来全新的打开方式。
据介绍,本次星巴克中国将推出星星淘梨冰摇茶、全橙胡闹冰摇茶、仲夏蓝调爆珠冰摇茶三款新品,并与疯狂动物城的主要角色跨界碰撞。
新品冰摇茶精选两款潮汕凤凰单枞——果香型和蜜香型单枞,通过精妙比例拼配,并通过与真果汁的大胆碰撞,再经 10 次匠心震摇工艺,带来融合了花香、果香与茶香的丰富层次,呈现出酸甜平衡的醇爽滋味和口感体验。
此外,此次联名合作还打造了多元丰富的体验,涵盖饮品、食品、周边商品及星礼包等产品线,更有趣味周边和主题门店。
6 月 19 日起,顾客可以走进位于北京太古里的「疯狂动物们的星巴克旗舰店」,或是全国的 36 家主题门店,与朱迪、尼克、豹警官一起开启夏日狂欢。
6 月 16 日,饿了么官方发文宣布,将全面升级「优店腾跃计划」,再投入超过 10 亿元,加码抢滩品质外卖商家。
据介绍,本次计划旨在欢迎线下优质连锁品牌以及中小餐饮商家入驻饿了么,平台也将更好支持优质餐饮商家的数字化生意增长。
饿了么方面表示,平台将提供新店最高 3 个月免佣、增加最高 3 个月新店期流量扶持权益,以及联合阿里生态流量资源提高曝光和订单转化等系列升级举措。
其中,该计划核心将围绕费率优惠、流量资源及 AI 工具等做了进一步资源升级。
值得一提的是,AI 工具方面,饿了么正式推出「智能化商家经营体系」,上线包含智能开店助手、智能店装、智能发品、智能选品托管、智能美图、经营诊断、营销智投等在内一揽子 AI 产品工具。
饿了么表示,希望借助 AI 能力,帮助更多商家提升从开店、营业准备到日常经营全周期的生意经营效率。
6 月 16 日,哔哩哔哩(B 站)宣布,携手歌手宋雨琦,发布平台 2025 年毕业歌《我们都很棒》。
B 站方面表示,「希望通过这首歌告诉大家,每一刻的我们都很棒!」。歌曲由宋雨琦演唱,黄少峰作词作曲,薛晨作词,制作人为火星电台。
歌曲目前已上线 QQ 音乐、网易云音乐等流媒体平台,MV 也已上架 B 站。
据新浪电影消息,动画电影《西游记真假美猴王》于昨日亮相 2025「超级娱乐空间」万达电影战略发布会,并释出最新版概念海报。
本次公布的海报中,真假美猴王穿梭于画面之中,孰真孰假,难以分辨;该片将从人性善恶、真假本心的维度重新解构「真假美猴王」这一经典 IP;影片将由六小龄童、马德华领衔主演,赵霁、张科执导。
昨日,电影《恶意》发布「滨江恶母」版最新预告,影片将于 7 月 5 日上映。
影片围绕着滨江三院一起费解的双人坠楼案展开,资深媒体人叶攀始终秉持追寻真相的原则,她在调查中先后将护士李悦和母亲尤茜报道为嫌疑人,却因此引发舆情,事态逐渐失控。
该片由来牧宽、姚文逸导演,张小斐、黄轩、李庚希、梅婷等主演。
对谁拥有「全球最高热效率」的混动发动机这件事,比亚迪和吉利争了很久。
24 年 5 月 28 日,比亚迪发布了自己的第五代混动技术,号称实现了全球最高 46.06% 的热效率,百公里油耗 2.9L,满电满油 2100 公里。
吉利不服,在次日上午发微博说自家雷神发动机最高热效率 46.1%,而且获得了中汽中心的权威认证,自己才是全球最高的那个。
比亚迪则表示,「量产,量产,量产!重要的事情说三遍。不玩虚的,发布即量产!上市即交付!」
没辙,吉利当时确实还没量产,所以只能偃旗息鼓。
而且后来比亚迪的第五代 DM 混动技术已经形成了 DM-i、DM-p 等多种动力总成,吉利虽然在去年 10 月份发布了雷神 EM-i 超级电混技术,但还是有需要追赶的部分。
直到最近。
吉利在 6 月 13 日发布了雷神 AI 电混 2.0 系统,其 EM-i 系统搭载的专用电混发动机实现了 47.26% 的热效率,达到了全球最高水平,超越了比亚迪最新插混专用发动机的 46.06%。
只看名字也能发现,吉利这套新的电混系统最大的亮点是「AI 智能体」的加成。
据吉利介绍,在吉利近 23.5EFLOPS 的算力、超 200 万用户、超 200 亿公里行驶里程以及吉利先进工程化能力的加成下,吉利最新的「星睿 AI 智能体 2.0」成为了行业首个基于 AI 场景引擎的动力域智能体。
这个智能体主要能做到四件事。
第一件是它能够通过获取导航路线、平均速度、出行时间、拥堵状况、信号灯、限速等多维数据,在行程中进行实时运算并发送指令进行能量分配,可以提升 5% 左右的节能水平。
第二件是它可以根据仿真和试验数据,预测机油健康度等数据,用每位车主建立个性化的养护方案,最多可以延长保养里程达到50%以上。它也可以用 AI 算法精准控制小电流,让动力电池中的「死锂电」重新激活,让电池整体寿命提升 15%。
除了这两件之外,智能体还能够结合用户用车习惯和充电桩大数据,为车主智能推荐预约充电,也能够实现智能过弯辅助、智能防滑控制等功能。
具体到动力系统上,吉利推出了雷神 EM-i 和 EM-p 两套动力系统。
雷神 EM-i 主要是以节能为主,它将首发搭载在吉利银河 A7 上,在 CLTC 工况下,银河A7百公里馈电油耗约为 2.67L,综合续航可以达到 2100km 以上。这套系统还搭配了一台 175kW 的 P3 电机,为吉利银河 A7 带来了 7.1 秒的零百加速。
吉利也在雷神 EM-i 上首发了无图决策功能,系统可以通过轨迹算法,判断当前路线与历史惯用路线的匹配情况,自动调用云端预先计算的,最优油电策略执行。
老车主也能通过 OTA 升级雷神 AI 电混 2.0 系统,其新功能将在今年四季度推送升级。
即将搭载在吉利银河 M9 上面的雷神 EM-p AI 电混系统则匹配了独立三点式四驱系统,拥有更强的动力,在百公里加速约为 4.5 秒的速度下做到了百公里 4L 的馈电油耗,综合续航约为 1500km。
同时结合星睿 AI 云动力 2.0 的智能全地形识别功能,系统可以根据导航地图和辅助驾驶系统的相关信息,自动识别车外的环境、轮胎滑移率、车身姿态和用户意图等,动态分配四轮扭矩。
比如在遇到冰雪等湿滑的路面时,AI 可以对后轮双电机的扭矩方向和大小精准调节,快速抑制横摆,甚至可以做到全场景的爆胎稳定控制。
吉利银河 M9 还在原有 EM-p 的基础上搭载了 11 合 1 的双电机配置,P1、P3、发动机、后轮双电机互为备份,从而让动力输出更强劲。
同时,吉利还预告说他们在第四季度将推出搭载雷神醇氢 EF 的轿车和 SUV 产品,上面使用的第五代醇氢专用发动机的热效率可以达到 48.15%,每公里醇耗费用最低只要2毛钱。
这套系统支持多种能源形式,可以灵活匹配甲醇、汽油、电、混合能源等形式,特别是汽油和甲醇可以任意比例灵活加注。
结合车辆参数其实不难看出,吉利银河 A7 和 M9 的对标车型就是比亚迪的秦 L 和唐 L。
同时这两款车也保持了与吉利之前一致的,在配置和性能上多一点,在造型设计上年轻一点的竞争策略,如果能在价格上也能低一点话,确实会给比亚迪造成很大的市场压力。
但比亚迪自然不会束手就擒,在第五代 DM 技术已经很强的情况下,比亚迪又会从何处发起反击呢?
Apple Watch 从来不是那个最喧哗的产品。它没有像 iPhone 那样在发布之初就改变世界,也很少成为舞台上的主角。
但在过去十年里,这块小小的腕上设备,持续以自己的节奏调整方向——从计时工具、健康伙伴,到如今逐渐成为一套实时交互的计算系统。
在今年 WWDC 期间,Apple 的 watchOS 工程高级总监 David Clark 和 Apple Watch 产品营销高级总监 Deidre Caldbeck 接受了爱范儿的专访。
▲ David Clark
▲ Deidre Caldbeck
我们聊到了 watchOS 26 的新设计、新功能,但最让我印象深刻的,是 watchOS 团队用一个并不张扬的词汇,描述了新系统在信息呈现上的原则:
> High Confidence,高置信度。
这不是某种炫技的 AI 概念,也不涉及宏大的模型结构。它只是一道阈值,用来判断什么信息,值得被放在用户抬腕第一眼就能看到的位置。
在 watchOS 26 上,智能叠放功能更具主动性,将在合适的时机出现在表盘上——而在此之前,你需要在表盘上滑动,才能看到堆叠的小组件。这个细节或许容易被忽略,但它映照出 Apple Watch 一以贯之的产品哲学:一个反注意力设计的产品,如何谨慎地等待被需要的时机。
在采访过程中,David 举了一个例子:
智能叠放(Smart Stack)从设计之初就希望帮助用户快速获取信息或直接进行操作。在 watchOS 26 中,我们对智能叠放的预测算法进行了显著优化,它现在可以更精准地理解用户的日常习惯和场景。例如,当你在偏远地区没网时,系统会自动将「回溯」功能(Backtrack)提前显示到表盘,帮助你找到回去的路。
而在我体验 watchOS 26 的这几天里,「智能叠放」出现的时机极少,但确实相当准确,例如我在通勤步行时,总会开启户外步行的体能训练,此时,「智能叠放」就会恰到好处地弹出来。还有一位去国外旅行的朋友告诉我,在飞机落地日本后不久,她的 Apple Watch 表盘上就出现了「翻译」的按钮。
「高置信度」并不仅仅是一种算法标准,它贯穿在 watchOS 26 的每一个设计里——智能叠放、体能训练、翻腕手势、健康提醒……甚至是那些你注意不到却始终存在的工程边界。
正如前文所述,「体能训练」是我每天都会用到的功能。在 watchOS 26 上,「体能训练」得到了重新设计,最显著的变化,就是新增了四个角落按钮(视图、目标、提醒、音乐),这让整个「体能训练」变得简洁易懂,同时操作起来也方便快捷。
这是「高置信度」的另一种体现——截止到 2025 年,Apple Watch 的体能训练已经可以追踪超过 80 种运动类型,而如今还能为他们设置不同的训练歌单、目标和提醒,并自定义每一个训练界面,在手表这么小的屏幕里,如何塞进一套如此复杂的体能训练应用?又怎么样才能让用户操作时不感到迷惑?于是,在 watchOS 26 上,David Clark 带领着他的团队,帮助用户先做出了取舍:
当我们对界面进行这一轮更新时,我们的目标是把全新的体验打磨得足够细致,同时让过去逐步构建的功能变得更易触达。现在,无论是调用训练播放列表、定制训练项目、设定目标,还是调整数据指标,操作都比以往更简单。
与之相似的功能更新,是 watchOS 上首次引入的备忘录功能——手表上的备忘录,虽然提供了手写、全键盘和语音转文字,但默认是语音转文字输入,识别率相当高,回看、同步也非常方便。在十年前刚戴上 Apple Watch的时候,我就很希望手表上有这么一个功能,但长期以来只有「语音备忘录」作为替代。
但为什么「语音备忘录」和「备忘录」要分开呢?在 iOS 和 macOS 上,备忘录可是能添加录音的。背后的考量,依然是「高置信度」——Deidre Caldbeck 表示,这是深思熟虑之后的结果:
这正是我们在设计这项功能时需要反复权衡的地方。Apple Watch 是一个非常小巧、始终佩戴在手腕上的设备,有些功能在独立 App 中实现,可能反而更符合实际使用情境。我们也在持续探索如何让这些体验变得更自然,保持一致性,同时又不让系统变得冗余。
手势操作上也应如此。
在上一代 Apple Watch 更新中,双指互点两下(Double Tap)是一个不起眼但很重要的更新——我们每个人都有经历「情景性残障」的时刻,比如你一手拿着 Mac 赶往下一个会议,突然接到领导的紧急电话时,双手健全的人此刻也只能单手操作。这时候,双指互点两下就能接听电话,马上缓解燃眉之急。
但如果,打过来的是一个骚扰电话呢?
在 watchOS 26 中新增的轻翻手腕手势(Wrist Flick)就是为此而生的。当有来电或通知时,快速翻转手腕就能关闭通知、静音来电或挂断电话,甚至不需要动到手指头——通过 Apple Watch 内置的加速计、陀螺仪,就能感知用户的腕部动作,实现单手操作。
转动手腕是个无意识的常见动作,如何精准识别用户意图、提升动作精准度是关键所在。而苹果在这里调用了芯片中的神经网络引擎,使系统能够学习并分析用户的使用习惯,来降低误触率。
双指互点两下和轻翻手腕手势,构成了 Apple Watch 上这套一气呵成的单手操作交互,就算只能腾出一只手,也能完成许多动作——回消息、记笔记、挂电话、设提醒等等……而这一切操作的前提,是这套动作具备「高置信度」。
「高置信度」这个指标,几乎贯穿了每一代 watchOS——你不会,也不可能在这套系统上实现复杂的操作,而这套系统也从不急于表现自己,而是试图以更高的确定性,做出更少、更准的决策。
在 Apple Watch 的使用情境中,「高置信度」也意味着「高可用度」,也就对这套系统的「判断力」提出了更高的要求。
和大刀阔斧的 iOS 26 相比,watchOS 26 所代表的产品变化,无关功能堆砌,而是关乎判断、节制与默契——关乎如何让一个日常佩戴的计算设备,变得更安静,也更可靠。
🖥️
消息称 Mac 未来或会推出触屏产品
🧠
我国首例侵入式脑机接口临床试验成功
📱
小米高管回应「某高校禁用红米手机考试」
🤖
百度启动「最大规模」顶尖 AI 人才招聘
👍
华为高管:原生鸿蒙做到了用户在日常使用基本满意
🎨
ColorOS 设计总监回复「液态玻璃」设计跟进问题
💡
OpenAI CEO:2026 年将成为 AI 转折之年
💻
2026 款 MacBook Pro 或采用 OLED 屏幕
🚗
小米汽车固态电池专利公布
🎙️
罗永浩 AI 数字人直播带货,成交超 5000 万
💭
杭州一泡泡玛特开业 2 小时闭店
📽️
光线传媒董事长:《哪吒 2》没有太多借鉴价值
据彭博社消息,未来 Mac 设备会和 iPad 一样配备 OLED 触控屏。不同的是,iPad 会继续聚焦于触控输入,而 Mac 当然也会以键盘触控板为主要交互方式。
两者的形态将会在一款全新设备上融合。报道称,苹果计划在 2028 年推出一款约 19 英寸的大屏幕折叠设备,将会兼具 iPad 和 Mac 的特点,不过目前尚不清楚这款融合设备将搭载 iPadOS 还是 macOS。
和传闻中最早明年亮相的折叠 iPhone 一样,这款折叠 「MacPad」也将会采用 「无折痕」的技术。有不少已经披露的专利文件显示,苹果将采用特殊的聚合物以及铰链设计, 「填平」折叠设备上的 「坑洼」。
值得一提的是,苹果高管曾经在多个场合暗示不会为 Mac 产品添加触控屏。而与此同时,PC 阵营的大部份高端笔记本都标配触控屏,因此触控 Mac 或许更多是一种姿态上的对标,以及为 3 年后的大折叠设备铺路。
而苹果软件工程高级副总裁 Craig Federighi 日前在接受采访时也透露了「iPad 不提供 macOS」的原因。
Federighi 表示,目前 iPadOS 26 采用的类 macOS 设计,在生产力和易用性上得到了很好的平衡。Federighi 进一步表示,iPadOS 26 之所以更靠拢 macOS,是为了保持 iPad 的简单的同时,能够为用户提供一种更为深入的生产体验。
Federighi 也强调,iPad 使用 macOS 会失去「终极触屏设备」这一理念,但两个平台之间又不少能够相互学习的地方,同时也是苹果所极力追求的。
重新回顾下上周发布的 iPadOS 26:全新的 app 窗户管理系统让 iPad 终于有了电脑级的多任务能力,还有类似 Mac 的菜单栏等一系列新功能。
据央视财经消息,我国成功开展首例侵入式脑机接口临床试验,同时该成果标志着我国在侵入式脑机接口技术上成为继美国之后,全球第二个进入临床试验阶段的国家。
信息显示,本次试验由中国科学院脑科学与智能技术卓越创新中心,联合复旦大学附属华山医院,与相关企业合作完成;受试者为我国首例侵入式脑机接口临床试验的受试者,其曾因高压电事故截掉四肢。
报道表示,自今年 3 月植入手术以来,这位国内首位侵入式脑机接口受试者仅用 2—3 周的时间,就实现了在手机电脑上操控光标完成下象棋、玩赛车等功能。
据悉,下一步将利用 3—6 个月的时间尝试对机械臂、轮椅等智能设备进行意念控制。
此前,美国企业家马斯克旗下的 Neuralink 于 2019 年,宣布成功让一只猴子通过大脑来控制电脑,随后于 2021 年展示了一段「猴子通过自主意念熟练玩电子乒乓球游戏」的视频。
据了解,Neuralink 目前正在开发一项能够帮助患有运动、语言、视力障碍的人回复自主性的技术,该技术能够令他们使用意念控制电脑和机械臂,将口头思维输出成为文字信息,并生成视觉感知内容。
日前,有网友晒出某大学「2025 年本科综合评价招生面试考生须知」,其中截图显示,此次招生面试规定「不得使用红米系列手机参加考试」,而事件相关话题也随后登上热搜。
昨日晚,小米公关总经理王化发文回应了上述消息。其表示,经与相关大学以及相关 App 公司沟通,考试禁用红米手机,并非学校要求,而是提供在线考试技术支持的公司要求。
王化强调,「这其实是一个固有认知没得到刷新,REDMI 手机早已经不是早年主打百元机的时代,如今 REDMI 品牌已经升级」。
王化还表示,REDMI 主打的 Note、Turbo、K 系列都以质量和性能著称,尤其是 K 系列已经是豪华性能旗舰,完全足矣应付各种在线考试要求。
王化最后还称,欢迎各位提供在线考试技术支持的公司与团队取得沟通,验证 REDMI 手机的性能,相信亿万用户的选择和口碑定会刷新各位的认知。
近日,据百度官方消息,其 2026 届「AIDU 计划」正式启动,号称「百度最大规模的顶尖 AI 人才招聘」。
据悉,本届 AIDU 计划的岗位招聘扩增超 60%,覆盖百度 23 个核心业务和11类研究方向,包含大模型算法、大模型基础架构、机器学习、语音技术、智能体等。
信息显示,「AIDU 计划」是百度推出的一项精英招募计划,以培养 AI 技术领军人才为目标,期望候选人对技术有着纯粹的热爱。该计划自 2017 年启动,至今已有上百名技术博士深度参与自动驾驶、深度学习、大模型等领域的创新研究,推动技术突破与应用落地。
百度方面称,加入 AIDU 计划后,计划成员能够参与核心 AI 项目,拥有顶级资源与回报、完善的培养体系、海量学习成长机会。
6 月 15 日,据华为应用市场(App Gallery)信息,微信鸿蒙版 App 安装量突破 600 万次。
据此前报道,微信鸿蒙版 App 于 6 月 4 日时安装量已突破 500 万次,由此计算,微信鸿蒙版安装量平均速度约为 10 万次/天。
日前,华为终端 BG 首席执行官何刚在采访时,回应了「为什么不能等系统(HarmonyOS 5)再更成熟、生态完善了再出来」。
何刚表示,目前 HarmonyOS 5 的确有部分功能不够完善,但在过去的时间里,华为和合作伙伴一直在努力。在 HarmonyOS 5.0/5.1 上,大家已经做了大量的工作。
同时何刚称,微信、抖音、京东等多个合作伙伴都在不断的努力,快速地把功能做到消费者满意。
何刚透露,华为与生态合作伙伴通过过去一两年的时间,让消费者的日常使用体验已经基本达到了满意的状态。其也表示,「这非常不容易」。何刚强调,其他系统通过十几年的积累做的功能,HarmonyOS 在短短一年时间里,基本上做到了一个相当的状态。
5 月,华为常务董事、终端 BG 董事长余承东也曾在演讲中表示,开发一个操作系统可能难,但也不至于「如登天」一样难;而在做(建立)生态方面,难度相当大。
据余承东此前透露,鸿蒙应用开发速度越来越快,已经有 2 万多个鸿蒙原生应用和元服务上架,鸿蒙学堂的学习人次也超过了 614 万。
日前,小米汽车发文回应了「车辆刹车盘上有疑似生锈」现象,其表示:
刹车盘生锈现象属于正常情况,用户无需担心。
因大多数汽车使用的刹车盘是灰铸铁等材质,最近雨季来临,该材料在暴露于潮湿空气或雨水时容易生锈,这是很多车辆经常遇到的场景。
小米汽车方面还表示,旗下 SU7 车型搭载了优秀的动能回收制动机制,让液压制动系统使用机会更少,但也可能产生生锈的现象。
对于上述情况,小米方面还提供了两种「快速去除锈迹」的方式:
近期,苹果在 WWDC25 上正式公布了新一代系统设计语言「液态玻璃」,随后 OPPO ColorOS 系统设计总监陈希发文称:
iOS 26 这么一折腾,各互联网大厂设计师和不少视觉设计师又能折腾一番了。坏消息是「不跟进」。
文中的「不跟进」引发不少网友猜测:ColorOS 将不会更新「液态玻璃」这一设计想法。
在 6 月 14 日,陈希发文回应称:大家理解歪了,「不跟了」这一句指的是前面提到的第三方应用厂商。陈希还在文中表示,「至于 ColorOS 跟不跟,跟生态有关」。
其解释称,因为一直以来,第三方应用的苹果和安卓版本会共用设计语言,不会进行太多差异化的定制,这样能大幅度节省工作量并且提高迭代速度。所以在考虑生态一致性的情况下,一定会有部分设计是趋同的。
陈希还强调,对于设计工程技术的积累一直要跟进并学习的;对于设计语言还是根据整体应用三方生态以及产品定位来看,不能倒行逆施,逆潮流来。其通过「扁平化」设计举例:是趋势问题,如何做,需要系统性构思。
日前,OpenAI CEO Sam Altman 接受了彭博社《The Circuit》节目的采访,其在节目中探讨了 OpenAI 的 Stargate(星际之门项目)、AI 未来的走向等内容。
对于 Stargate,Altman 认为自己收获了在供应链、算力规模等领域的认识。其表示,通过软银集团 CEO 孙正义,他自己真正意识到,计算领域是一个错综复杂的供应链,需要众多合作伙伴共同参与,以及巨额的资金投入。
有趣的是,主持人提及「微软为何无法满足 OpenAI 所有需求」这一话题。Altman 也很聪明地表示,微软的确给了公司极大的支持,但 Stargate 的体量超过了任何单一公司所能承受的范围。他还强调,微软未来仍会为 OpenAI 提供海量算力,公司对此也很满意。
而对于 AI 的宏伟愿景,Altman 始终表示「AI 是科技发展史上的新篇章」。他对于 AI 最兴奋的点,则是 AI 在科学领域的应用,他认为那是「革命性的」,尽管人类目前还尚未完全达到 AI 科学的阶段。
结合 Altman 本次采访和他在 6 月 11 日发布的《The Gentle Singularity(温和的奇点)》,他对 AI 的未来有以下预测:
据外媒「hankooki」消息,三星显示位于忠清南道牙山市的 A6 工厂第 8.6 代 OLED 生产线(第一阶段),将于今年年底启动试运行,并将在明年第二季度正式量产。
报道指出,上述消息与苹果计划在明年下半年推出的 OLED 版 MacBook Pro 的发布日期相契合。据悉,苹果于 2024 年在 iPad Pro 上尝试了大尺寸 OLED 屏幕的应用,而在明年将计划将 OLED 应用到 MacBook Pro 身上。
据报道,三星 8.6 代 OLED 产线能支持更大尺寸的玻璃基板生产,因此能更好提供笔记本、平板电脑等大尺寸设备的屏幕生产。
而据今年 3 月消息,由于 OLED 版 iPad Pro 销量未达预期,苹果调整 OLED 产品发布节奏,推迟了部分产品的发布时间,其中备受期待的 OLED 版 iPad mini 也有望明年推出;而 OLED 版 MacBook Air 将会被推迟至 2028 年。
据国家知识产权局信息显示,6 月 13 日,小米汽车科技有限公司公布了一项「固态电池复合电极与制备方法及包含其复合电极的固态电池」的发明专利,申请公布号为 CN120149317A。
从公布的信息显示,该固态电池的复合电极有效缩短了金属离子在厚电极中的传输路径,加快了金属离子在电极之间的传输速率,同时还具有较高的电极载量和倍率性能。
据悉,相较于时下新能源电动汽车普遍采用的锂离子电池,固态电池更轻更薄,拥有更高的安全性、更高的能量密度、更快的充电速度等特点。
今年 2 月,长安汽车副总裁邓承浩曾在《电动汽车百人会》上表示,固态电池预计 2026 年进行规模化的装车验证,2027 年逐步量产,并预计 2030 年以后或许有机会规模化量产。
6 月 14 日,百度地图方面推出小度想想「司机智能体」。
据介绍,小度想想「司机智能体」能够实现全程语音指挥,「路线随意问」:支持自由指路、路名定制/偏好路线记忆、多点规划、路线查询、路过风景询问等功能。
值得一提的是,小度想想支持「最近出口下高速」「最近入口上高速」等便捷出入指令。
目前,小度想想「司机智能体」已上线百度地图最新版「V21」,手机版无需设置即可使用,车机版仍需等待。
近日,华为推出 Petal One 会员服务,价格为 29 元/月起,共分为「畅享会员/悦享会员/尊享会员」。
据介绍,Petal One 是华为针对 HarmonyOS 5 及以上设备用户推出的会员组合购买服务,旨在通过多种常用的华为自带 App(如华为音乐、华为视频、华为主题、华为阅读、云空间、运动健康)会员组合套餐为用户提供更优惠便捷的购买体验,套餐类型均为连续包月业务。
具体来看,最基础的畅享会员拥有 50GB 云空间、华为音乐超钻会员、华为影视会员、华为运动健康的活力人生会员;而悦享会员和尊享会员在上述基础提升了云空间存储空间和主题、阅读类会员。
昨日下午,罗永浩通过其个人数字人进行直播带货。
据悉,本次罗永浩的「数字人」由百度电商的「慧播星数字人解决方案」提供。
而据罗永浩透露,本次数字人直播,由 AI 生成的剧本式产品讲解高达 9.7 万字,由 AI 驱动的数字人动作高达 8300 个,其惊呼「如果没有数字人,这得把我累成啥样!」
在直播收益方面,罗永浩也表示「没令人失望」:GMV(商品交易总额)超 5500 万元。另据消息,罗永浩数字人直播间仅开播 26 分钟,GMV 就超过真人 1 小时带货金额。
据《中国蓝新闻》消息,6 月 15 日,原定于今天开业的泡泡玛特杭州某店,开业没多久就宣布闭店,有消息称仅开业 2 小时。门店方面表示,内部整改问题,开业延期,后期开业另行通知。
据报道,有现场顾客透露,排队 4 小时,开门后一批疑似黄牛的人冲进去「端盒」(盲盒的一种购买方式,指直接购买一整某系列的整盒产品),引发大家不满,没多久就闭店了。
日前,泡泡玛特旗下 IP「LABUBU」爆火,从一款小众设计师玩具跃升为国际潮流偶像。
在海外多地,新上市的 LABUBU 经常「几分钟内」售罄;而在国内市场,甚至出现了 LABUBU 租赁服务,价格从 30 元/天至 80 元/天。
据摩根大通研究报告中指出,泡泡玛特是中国 IP 商品市场领导者,旗下原创角色 Labubu 正加速成长为「超级 IP」,其 5 月搜索热度已超过 Hello Kitty。
据新浪电影消息,光线传媒董事长王长田日前在上海国际电影节开幕论坛上,回应了「如何看待好电影不仅等于好故事,如何看系统性供给」的问题。
王长田称,《哪吒 2》是电影发展到现在必然会出现的产品,但它也是一个个例,没有太多借鉴价值。其强调,「如果不能改变背后的系统性问题,可能会导致我们没有能力去应对问题,甚至像电视行业一样走向衰落。」
王长田认为电影行业需要关注以下问题:
另外,王长田还透露了《哪吒 2》相关收入情况:影片带来的整个社会 GDP 增量会超过 2000 亿;卖的最多的衍生品有上百亿销售额。
6 月 14 日,《无名之辈》系列电影《无名之辈:否极泰来》定档 7 月 5 日上映。
影片由饶晓志执导,章宇、任素汐、潘斌龙领衔主演,将延续前作荒诞的黑色喜剧路线。
据守望好莱坞消息,皮克斯新片《Hoppers》发布新剧照,将于 2026 年 3 月 6 日北美上映。
据悉,影片由丹尼尔·钟执导,佩珀·柯达、鲍比·莫尼汉、乔·哈姆等配音。
影片讲述一个女孩的大脑和思维进入一只机器人海狸体内,探索动物世界,该片被描述为一部「疯狂、好笑、动作戏满满的原创电影」。
宝马在电动汽车时代的策略,总让人有种「智能当道时代的驾控异类」的感觉。
在别家都在研究辅助驾驶、零重力座椅、光毯大灯之类的智能化舒适性配置的时候,宝马的宣传重点却是「纯粹驾驶乐趣」。
BMW iX3试装车全速通过赛道长弯时,车身精准地沿着理想线循迹行进,车尾稳定而灵动,……,在车辆压过湿滑弯道时,根据轮胎摩擦力自动分配前后轴上的动力输出及动能回收,像轨道车般紧咬劈弯路线。
你能从字里行间感受到宝马这帮人的热情,他们确实认可「车是用来开的」理念,也希望能够在纯电车型上带给你一些「驾驶乐趣」。
令人兴奋的是,宝马画的这个「饼」我们很快就能吃到了。
基于 Neue Klasse 平台的新时代 iX3 将在 9 月的慕尼黑车展上亮相,它的国产版本也已经完成了极寒测试,预计将在 26 年年初在沈阳工厂正式投产。
让宝马在新时代也有底气坚持「纯粹驾驶乐趣」的是 Neue Klasse 平台。
该平台的概念车曾在上海车展上有过一次小小的出圈——当四电机系统加上高达 18000 牛米的扭矩,让这台车轻松冲上了 54° 的陡坡。
作为量产车型的 iX3 虽然没法做到这么恐怖,但它的双电机四轮驱动版本也将可以输出 402 匹马力和 600 牛米扭矩, 并在不到 5 秒的时间内完成零百加速。
支持这一速度的是宝马的第六代电动传统系统,这一系采用了 800V 的电气架构,在性能和操控方面都有了进步,同时它也为新 iX3 提供了四种驾驶模式:个性、运动、高效和静音。在个性模式下,驾驶者可以自定义车辆的传动系统、转向系统和动能回收设置。
所有的这些系统都有宝马新的中央控制器「Heart of Joy」来管理,在统一管理模式下,各个系统之间的通讯延迟被控制到了毫秒级。
宝马的一位高级工程师解释说,「Heart of Joy」将电动机的强大功率和扭矩、使车辆减速和制动的能力以及可变的动力源有机的结合在了一起,98% 的制动力将由能量回收提供,只有在急停时才需要物理制动。宝马为此提供了一个「B 档」模式,它将提供更加强劲的减速效果,能驾驶者能够实现单踏板驾驶。
也不必担心你会在新的 iX3 遇到国内网约车上「强动能回收」的晕车感受,宝马特意对车辆走走停停时的「拖拽感」做了优化,在一整套高度集成的底盘、动力系统和车身控制算法的配合下,车辆可以在1毫秒内感知驾驶者的意图,不仅能减少能量损耗和刹车件磨损,也能让乘员彻底告别「点头式顿挫」。
同时在高速场景下,新宝马 iX3 能够在前后50:50均匀轴荷比以及「Heart of Joy」的配合下,实现更好的车身控制能力,在车辆经过湿滑弯道等场景下,系统可以根据轮胎摩擦力自动分配前后轴上的动力输出及动能回收,让整个车身维持较强的稳定性和信赖感。
新世代的宝马 iX3 在续航和补能效率上也有了提升,新车采用了 800V 的电气架构,并使用了通过新工艺制造的圆柱电池组,宝马声称新车在 WLTP 工况下的续航里程约为 800 公里,充电速度也提升到了 400kW,在 10 分钟内可增加约 350 公里续航。
新的全景 iDRIVE 人机交互也确认将在 iX3 上首发搭载。
这是一套蕴含了大量人体工程学和人因研究的人机交互解决方案,其核心理念是让合适的信息,以合适的界面,在合适的时间出现,尽量不干扰驾驶。
它包含四个部分:
– BMW 全景视域桥
– 中央信息显示屏
– 3D 视域前景显示
– 全新多功能方向盘
用更通俗易懂更容易理解的方式解释就是,「天际屏」「中控大屏」「AR-HUD」和「多功能方向盘」。
其中最显眼的还是那个不规则的「中控大屏」。
宝马之前介绍过这个中央信息显示屏的设计理念:
– 以平行四边形形状向驾驶侧靠拢,并进行了不规则的切割。
– 屏幕向驾驶侧倾斜 17.5°,针对驾驶员视线进行了优化,并尽量缩短方向盘到显示屏的距离。
– 中央信息显示屏带矩阵背光,保证了屏幕内容在任何光线下的可见度。
总结一下,宝马主要还是希望能够尽可能少的分散驾驶员的注意力从而保证驾驶安全。
内饰的其他部分目前还没有太多的信息,不过由于新的 iX3 采用了新平台,地板中间不再有隆起,所以新车的内部以及后备厢空间将会比现有的燃油版本来的更大。
3 系车型一直是宝马销量的绝对主力,但是宝马这一代的 X3 在外观造型设计上似乎没那么讨喜,月销量只有 4000 辆左右,远远落后于奔驰 GLC 和奥迪 Q5。
根据一些谍照和爆料,新的 iX3 将舍弃现款 X3 那种巨大个性的垂直「双肾」格栅,恢复到了类似上世纪 BMW 2000 轿车的小格栅设计,其车身侧面则将和现款 X3 相似,拥有较大倾斜度的挡风玻璃、齐平门把手以及标志性的「霍夫迈斯特弯角」。
▲BMW 2000CS
一辆拥有漂亮外观、极致操控、全新内饰以及超长续航的新 iX3能让宝马甩掉「杂牌电动车」的标签嘛?
确实值得期待一下。
▲现款宝马 X3 长轴距版
我们曾在上周预告了特斯拉将对 Model S 和 Model X 进行一些小幅度的更新——[又一次「无关痛痒」的更新,Model S 正在走向自然消亡]。
今天,特斯拉官方正式在社交媒体 X 上宣布小幅改款的 Model S 和 Model X 将正式在美国推出。官方确认的更新点有:
– 两车均新增了一款接近于天蓝色的车漆。
– Model S 长续航版的续航里程增加到了 410 英里(约合 660 公里),其也成为了续航里程最长的特斯拉车型。
– 座舱更加静谧,风噪与路噪更低,主动降噪效果有所提升。
– 全新的轮毂设计以及改进的空气动力学性能。
– 前保险杠处的摄像头视野提升。
– 全新设计的动态氛围灯,车主进入车辆时将在仪表盘和车门处看到独特的动画效果。
– 全新设计的衬套和悬架,将为车主带来更平顺的驾乘体验。
– 新增自适应的远光灯。
– Model S Plaid 更新了外观设计,并专门优化了高速场景下的稳定性。
– Model X 现在拥有了更大的第三排乘客空间和储物空间。
同时,Model S/X 各个版本售价都上涨了 5000 美元,现在 Model S 全轮驱动和 Plaid 车型的售价分别为$84990(约合人民币 61 万元) 和$99990(约合人民币 71.7 万元),Model X 的售价则来到了$89990(约合人民币 64.6 万元) 和$104990 元(约合人民币 75.3 万元)。
美国网友对于这次更新普遍的反应是——失望。
这并不是一个大的升级。
没有线控转向。
没有后轮转向。
没有 48V。
没有改进的电池技术。
没有添加豪华功能。
你似乎并不想在高端市场销售它。
特斯拉 Model S 自 2012 年投入生产以来,虽然曾多次更新内饰、动力总成以及电池,但是车辆的造型、动态表现和悬架底盘等部分 13 年来则一直未做调整。
作为特斯拉的旗舰轿车,Model S 在这次更新后依旧没有 800V 架构、超快速充电等较为先进的电子电气配置,曾经引以为傲的悬架和底盘也正在逐渐落后于时代。
▲特斯拉 Model S 车架
特斯拉 Model S/X 目前在英国、日本和澳大利亚等国家已经不再销售,预定了 Model S/X 消费者会被邀请将订单切换到 Model 3 或者 Model Y,中国官网也在今年 4 月份下架 Model S/X 两款车型的配置工具,这一系列动作都引发了外界对 Model S/X 还能存在多久的担忧。
不过之前曾有消息称特斯拉正在开发一款基于新平台的全新电动汽车,其内部代号为「Redwood」,预计将在 2026 年推出。在在今年早些时候的电话会议上,马斯克也曾证实新一代特斯拉的第一款车将于 2025 年年中在奥斯汀工厂投入生产,这或许有可能是 Model S 的继任者。
不知道逐渐淡出政治事物之后的马斯克,会不会在新一代的 Model S 上多倾注一些心血,从而让我们更早看到它呢?