仅需 40 万，4 台顶配 Mac Studio 串联，同时跑两个 DeepSeek 是什么体验？

几个月前，爱范儿在一台 M3 Ultra 的 Mac Studio 成功部署了 671B 的 DeepSeek 的本地大模型（4-bit 量化版）。而如果把 4 台顶配 M3 Ultra 的 Mac Studio，通过开源工具串联成一个「桌面级 AI 集群」，能否把本地推理的天花板再抬高一个维度？

这也是来自英国创业公司 Exo Labs 正尝试解决的问题。

「不要以为牛津大学 GPU 多得用不完」

你可能会以为像牛津这样的顶级大学肯定 GPU 多得用不完，但其实完全不是这样。

Exo Labs 创始人 Alex 和 Seth 毕业于牛津大学。即使在这样的顶尖高校做研究，想要使用 GPU 集群也需要提前数月排队，一次只能申请一张卡，流程漫长而低效。

他们意识到，当前 AI 基础设施的高度集中化，使得个人研究者和小型团队被边缘化。

去年 7 月，他们启动了第一次实验，用两台 MacBook Pro 成功串联跑通了 LLaMA 模型。虽然性能有限，每秒只能输出 3 个 token，但已经足以验证 Apple Silicon 架构用于 AI 分布式推理的可行性。

转折点来自 M3 Ultra Mac Studio 的发布。512GB 统一内存、819GB/s 的内存带宽、80 核 GPU，再加上 Thunderbolt 5 的 80Gbps 双向传输能力——让本地 AI 集群从理想变成了现实。

同时跑两个 670 亿参数大模型是什么体验？

4 台顶配 M3 Ultra 的 Mac Studio 通过 Thunderbolt 5 串联后，账面数据相当惊人：

128 核 CPU（32×4）
240 个 GPU 核心（80×4）
2TB 统一内存（512GB×4）
总内存带宽超过 3TB/s

这样的组合几乎是一台家用级别的小型超算。但硬件只是基础，真正发挥效能的关键是 Exo Labs 开发的分布式模型调度平台 Exo V2。Exo V2 会根据内存与带宽状态将模型自动拆分，部署在最合适的节点上。

在现场，Exo V2 展示了以下核心能力：

大模型加载：8-bit 量化后的 DeepSeek 完整载入需要 700GB 以上内存，单台 Mac Studio 无力承担。Exo 会将模型拆分部署到 2 台 Mac Studio 上完成加载。激活后，它的「打字速度」基本上超过了人的阅读速度。

IMB g5JXVY 1

并行推理：在运行 DeepSeek V3 的基础上，又加载了同样 670 亿参数的 DeepSeek R1。系统立即将 R1 分配到剩余的两台设备上，实现两个大模型并行推理，支持多用户同时提问。

IMB 96ONUu

文档私有问答：拖入公司财报 PDF，模型在本地完成知识嵌入与问答，不依赖任何云端资源，数据完全私有可控。

轻量微调：若企业有数千份内部资料，可通过 QLoRA + LoRA 技术进行本地微调。单台微调需耗时数日，而通过 Exo 的集群调度能力，训练任务可线性加速，大幅缩短时间成本。

巨大的成本差异

爱范儿在现场后台观察拓扑图发现：即使 4 台机器同时处于高负载状态，整套系统功耗始终控制在 400W 以内，运行几乎无风扇噪音。

要在传统服务器方案中实现同等性能，至少需要部署 20 张 A100 显卡，服务器加网络设备成本超 200 万人民币，功耗达数千瓦，还需独立机房与制冷系统。

苹果芯片在 AI 浪潮中意外找到了新定位

M3 Ultra Mac Studio 的起售 32999 元，配备 96GB 统一内存，而 512GB 的顶配版本价格确实不菲。但从技术角度来看，统一内存架构带来的优势是革命性的。

在设计 M 芯片之初，苹果更多是为节能、高效的个人创作而生。但统一内存、高带宽 GPU、Thunderbolt 多路径聚合等特性，却在 AI 浪潮中意外找到了新定位。

传统 GPU 即使是最高端的工作站卡，显存通常也只有 96GB。而苹果的统一内存让 CPU 和 GPU 共享同一块高带宽内存，避免了数据在不同存储层级之间的频繁搬运，这对大模型推理来说意义重大。

当然，EXO 这套方案也有明显的定位差异。它不是为了与 H100 正面对抗，不是为了训练下一代 GPT，而是为了解决实际的应用问题：运行自己的模型，保护自己的数据，进行必要的微调优化。

如果说 H100 是金字塔顶的王者，而 Mac Studio 正在成为中小团队手中的瑞士军刀。

早报｜理想 i8 发布一周官宣降价/英伟达否认芯片存在后门和终止开关/宇树发布新款机器狗

刚刚，OpenAI发布2款开源模型！手机笔记本也能跑，北大校友扛大旗

我们真正乐见的「卷」：联想卷轴屏笔电正式开售

苹果「脑控」iPad 首次公开演示：四肢瘫痪的他，用一个念头重新拥抱世界

理想汽车回应「小车撞大车」测试：无意对东风柳汽做出质量方面的引导评价

早报｜曝苹果大折叠无缘 2026 年量产/余承东：尊界 S800 大定破万/微信员工否认「调时间恢复过期文件」

奕派 008 推出 2026 款，17.36 万起配置升级，风神 L8 同场亮相

iPhone 要出「大师模式」？我举双手赞成 | 爱范儿

实测豆包一键修图，拍照小白有救了｜附修图指令

iOS 26 不尽人意，但相机 App 值得所有厂家学习

「兔子蹦床」播放超 5 亿！这条全网最火 AI 视频，是人类爱被「骗」的结果

对话 Hypershell：人人都能成为「钢铁侠」，是可以触及的未来！丨多样性公司

早报｜曝 iPhone 17 Pro 国行电池缩水/理想回应对撞争议：无心之举/特斯拉辅助驾驶车祸或赔 3.29 亿美元

库克罕见「打鸡血」：AI 革命属于苹果！

25.99 万元起，华为智驾加持，上汽奥迪 A5L Sportback 是燃油车智能化的新起点

深蓝 S05 新版型上市：12.99 万起配宁德电池，续航 620km

早报｜Google 辟谣全面恢复中国大陆地区服务/第四批国补资金 10 月下达/微信提现手续费下调，最低 0.01 元

ChinaJoy，是高通骁龙展示朋友圈的会客厅

星愿被迫降价，比亚迪元 UP 加推 7.48 万元新款，续航 301 KM

预售 130 万元，仰望 U8L 鼎世版把「东方豪华」玩明白了

早报｜iPhone 累计出货破 30 亿，库克预告新 Siri 明年来/理想回应重卡撞不过新车/网易云音乐起诉 SM 娱乐

对话理想辅助驾驶团队：辅助驾驶，如何从「猴子」进化到「人类」

保持联络是第一要务：自然灾害手机预警通讯指南｜附开启方法

「特朗普爱上保洁员」把全网都耍了，连 AI 也被套路，我还能信谁

2025 年，不要再跟着小红书教程刷机了！ | 爱范儿

查看全部

茉莉花论坛作为一个开放社区，允许您发表任何符合社区规定的文章和评论。

仅需 40 万，4 台顶配 Mac Studio 串联，同时跑两个 DeepSeek 是什么体验？

「不要以为牛津大学 GPU 多得用不完」

同时跑两个 670 亿参数大模型是什么体验？

巨大的成本差异

苹果芯片在 AI 浪潮中意外找到了新定位

同类信息

茉莉花新闻网

联系我们

敬请期待

邮件订阅