华盛顿 —
宣称兼具低成本、高效能优势的中国人工智能(AI)模型DeepSeek本周在美国科技投资界引发震动。在众多业界人士为美国AI技术领导地位岌岌可危深感担忧之际,最新分析指出,DeepSeek可能以不正当方式“照搬”了美国OpenAI的产品模型,其真实成本也远远没有此前传说的那么低廉。
DeepSeek被指违规“借用”美国AI模型
美国人工智能研究机构 OpenAI 和白宫官员表示,中国人工智能初创公司深度探索可能通过不正当的方式利用了OpenAI的专有技术来开发其自有的AI产品 DeepSeek。
OpenAI一名发言人通过电子邮件对美国之音说:“我们知道中华人名共和国的组织正在积极努力使用包括‘蒸馏’在内的方法,试图复制美国先进的人工智能模型。我们意识到并正在评估 DeepSeek 可能不恰当地‘蒸馏’了我们的模型的迹象,并将在我们了解更多信息时分享信息。”
这名发言人还说,OpenAI正在“采取积极、主动的对策来保护我们的技术,并将继续与美国政府密切合作”,保护在美国建立的功能最强大的AI模型。
“蒸馏”是一种通过训练小型模型模仿大型模型行为的技术,将复杂模型的知识提炼到简单模型,广泛应用于提高AI效率与降低成本。
中国媒体第一财经说,DeepSeek-V3 的技术文档显示,该模型使用数据蒸馏技术生成的高质量数据提升了训练效率,通过已有的高质量模型来合成少量高质量数据,作为新模型的训练数据,从而达到接近于在原始数据上训练的效果。
OpenAI的发言人介绍说,AI技术开发人员可以合法方式以蒸馏方式来提高其开发的应用的水平,但是根据 OpenAI 的官方使用条款,不允许外界使用OpenAI模型的产出来开发与OpenAI竞争的AI模型。
白宫人工智能与加密货币事务主管戴维·萨克斯 (David Sacks)星期二在接受福克斯新闻采访时表示,DeepSeek“很可能”窃取了美国的知识产权。
他指出,“蒸馏”技术在AI领域中是一种常见的做法,但从 OpenAI 模型中提炼知识的行为可能引发了OpenAI的不满。阻止外国AI公司“蒸馏”美国技术将可以有效减缓这些公司的抄袭行为。
他说:“有大量证据表明,DeepSeek 在这里所做的是从OpenAI的模型中提取知识。我认为 OpenAI 对此并不满意。我认为,在接下来的几个月里你会看到,我们领先的AI公司采取措施,防止蒸馏。我们要观察的是,那些领先的人工智能公司能否阻止第三方公司的蒸馏。
此前,社交媒体流传的用户使用 DeepSeek V3 模型的对话截图显示,DeepSeek 时常在提供答案是“坦言”自己是基于 OpenAI 出品的ChatGPT-4 人工智能机器人的设计架构,有时甚至自称自己就是ChatGPT,这似乎佐证了 DeepSeek 直接移植 OpenAI 技术的有关指控。
乔治城大学安全与新兴科技中心数据研究分析师雅各布·费尔德盖斯(Jacob Feldgoise)说,AI技术日新月异,其开源的特点为制订知识产权规则带来许多挑战。
费尔德盖斯对美国之音说,“蒸馏基本上就是一种利用更大、更有能力的模型的输出,让较小的模型性能发挥到极致的方法。因此,这一系列关于 OpenAI 服务条款和潜在知识产权盗窃的问题,可以总结为DeepSeek 是否使用 OpenAI 的 o1 模型来训练 DeepSeek 发布的 R1 模型。”
他说:“这是一系列的新问题。这不仅是公司必须努力解决的问题,也是美国法律体系也要努力解决的问题。”
低成本说法遭质疑
DeepSeek 的另一个“高明”之处,在于其所声称的低开发成本。深度探索公司团队最初声称,其开发 DeepSeek-V3 模型仅花费不到600万美元,这一消息震动了美国科技投资界。然而,最新的分析质疑,这个数字可能远低于其实际的研发成本。
半导体研究和咨询公司 SemiAnalysis 在1月31日发表的研究报告中说,DeepSeek 的主要投资方幻方量化早在2021年美国出口管制生效前,就囤积了一万块英伟达先进的A100 GPU。
报告认为,DeepSeek 仅在GPU方面的投资就超过五亿美元,服务器总资本支出约为16亿美元,其中高达9.44亿美元用于运行其芯片集群。
硅谷科技投资公司 Altimeter Capital 创始人布莱德·格斯特纳 (Brad Gerstner) 在X平台上发文指出,此前盛传的 DeepSeek 只用了6百万美元就研发出媲美 OpenAI、Anthropic 等美国公司耗资数十亿的AI工具的说法是“假新闻”。
OpenAI并未公开其AI产品“o1”的研发投入。但据格斯特纳推测,“o1”成本在150万美元左右。格斯特纳1月28日在接受美国CNBC采访时说,考虑到 DeepSeek 发布时间比 OpenAI的o1(预览版)更晚,研发成本更低是情理之中。
他说:“这不是一个重大的价格突破。这实际上是你所期望的——计算成本每年下降约50%。”
芯片来路引关注
另一方面,也有报道指出,DeepSeek不但利用了 OpenAI 的开源代码和数据,并可能通过第三方绕开了美国对高端芯片的出口管制,获得了大量高端英伟达芯片来支持其AI模型的开发,这已经引发美国政府的关注和调查。
据路透社报道,美国商务部正在调查 DeepSeek 是否一直在使用被禁止运往中国的美国芯片。DeepSeek 表示,使用了英伟达的H800芯片,这款芯片本可以在2023年合法购买。
彭博社报道说,美国政府还在调查DeepSeek是否能够通过新加坡的第三方实体获取高性能的英伟达芯片。
英伟达的一名发言人通过电子邮件对美国之音说,DeepSeek的成功是一种被称为“测试时扩展”(test time scaling)技术优势的典范,但没有直接回应DeepSeek是否使用了目前受制裁的高端英伟达芯片。
他说,DeepSeek的成就“说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算能力。而推理(inference)需要大量的英伟达 GPU和高性能网络。”
与此同时,白宫本周表示,国家安全委员会已经开始调查 DeepSeek 是否对美国国家安全构成影响。
国会众议院美国与中国共产党战略竞争特设委员会主席约翰·穆勒纳尔(John Moolenaar)和首席民主党议员拉贾·克里希纳莫蒂(Raja Krishnamoorthi)众议员本周四致函白宫国安顾问迈克·沃尔兹(Mike Waltz),要求白宫方面考虑将目前允许向中国出口的英伟达H20芯片列入出口管制对象,并严格管制可以被用于AI推理(inference)的芯片设计技术。
他们还要求联邦政府设备和关键基础设施禁止安装中国的AI工具。公开信指出,DeepSeek的隐私政策明确规定,该软件将收集的信息“存储在位于中华人民共和国的服务器上”。
公开信要求白宫调查新加坡是否成为了中国实体获取被禁芯片的中转国,并表示,如果新加坡等国不愿意打击通过向中国转运芯片的活动,就应该受到更严格的许可要求。
在英伟达最近的季度报告中,新加坡占其收入的22%。该公司本身透露,这些出货量中的大部分最终都运往新加坡以外的用户。
英伟达公司的发言人对美国之音表示,与新加坡相关的收入并不意味着有产品转移到了中国。他说,英伟达的盈利报告中显示的账单(bill to)地址不等同最终的发货(ship to)地址。他说:“我们的许多客户在新加坡都有商业实体,并将这些实体用于向美国和西方运送产品。”
他强调,英伟达“坚持要求我们的合作伙伴遵守所有适用法律”,如果得知有任何违法情况,会要求其合作伙伴遵守相关法规。
与此同时,越来越多的国家和地区的政府以安全考量为由,禁止政府设备安装 DeepSeek。意大利政府星期四宣布,出自保护用户数据隐私的考虑,封锁 DeepSeek 在该国的使用,并对这款AI工具的所有者进行调查。
台湾政府星期五表示,禁止公务机关和关键基础设施使用中国深度求索(DeepSeek)公司推出AI模型和产品。与此同时,美国德克萨斯州星期五也宣布,禁止州政府分发的电子设备安装 DeepSeek 等中国应用;其他被禁的应用程序还包括小红书和 Lemon8。