同行谈DeepSeek破圈：对AI发展是利好，不代表其他模型没有机会

DeepSeek破圈后，其他大模型企业怎么看？

2025全球开发者先锋大会（GDC）将于2月21日至23日在上海徐汇举办。2月17日下午，澎湃新闻记者前往人工智能企业商汤科技、大模型创业公司稀宇科技（以下简称MiniMax）探营，并与两家企业的相关负责人聊了聊。

“DeepSeek的核心优势在于它的上下文理解和深度思考，商汤的模型更多是在多模态上有一定优势，相信在不同的场景，不同的模型能够发挥不同优势。”商汤大装置产品总监刘叶枫认为。

谈及DeepSeek这家“友商”，MiniMax副总裁刘华不吝赞美之词，称DeepSeek在强化学习、算力调配等方面都做得非常有创新。他认为，在顶层研发框架迭代的情况下，需要研发人员对技术变革抱有极致的热情。

“一个模型做得好，不代表其他模型就没有机会。很多友商觉得DeepSeek做得好，自己也主动接入、也愿意用，这是一个非常开放的心态，我觉得这挺好。”刘华说。

位于上海漕河泾开发区的商汤科技大厦内景图本文图片均由澎湃新闻记者俞凯摄

商汤：DeepSeek引爆，对整个AI生态和产业发展来说是利好消息

澎湃新闻记者在探营中了解到，就在2月8日，商汤大装置官宣上架DeepSeek系列模型，企业客户和开发者可在商汤大装置万象平台中，快速部署DeepSeek-V3、DeepSeek-R1等模型，并可享受3个月内1000万tokens免费使用权益。

刘叶枫表示，DeepSeek破圈，更多人使用并把它当作工作流程的一部分，后续可能会产生一系列应用浪潮，对于未来的算力需求会有一个更大的增长空间，无论是政府侧还是业主侧。

resize,w 1024

刘叶枫介绍2025全球开发者先锋大会商汤科技参会情况

在商汤科技产品总监、小浣熊家族产品负责人贾安亚看来，DeepSeek引发的这一波浪潮主要体现在三点：一是更低的成本，包括一些架构的优化、训练和推理成本的降低，对于产业落地非常关键；第二就是更强的模型能力，主要体现在模型通过长思维链的更强推理能力；第三就是多模态的融合，带来更多实际应用场景的落地，给包括医疗、金融、教育、工业等行业以及辅助编程、智能办公、智能客服和营销等场景带来非常多的应用机会。

“前两年，一些新的AI技术还让大家感觉需要花很多的教育成本，但随着DeepSeek引爆，更多人尝试使用，对于整个AI生态和产业发展来说，都是一个非常利好的消息。最终落在实处的还是客户价值，怎么去服务更多用户。我们也看到，一些开源模型在很多能力上的亮点，我们也希望保持产品的开放性、博众家之长，去接入更多更好的模型。”贾安亚告诉记者。

贾安亚告诉记者，在本周末举行的全球开发者先锋大会上，商汤将会发布在辅助编程、智慧办公方面功能更丰富的代码小浣熊2.0，也会邀请实际用户去展示他们使用小浣熊的实际体验。

MiniMax：一个模型做得好，不代表其他模型就没有机会

位于上海徐汇区的MiniMax是2021年成立的一家规模数百人的大模型创业公司。该公司副总裁刘华告诉记者，今年1月该公司也做了一次大模型开源，开源的是全球首个大规模实现线性注意力机制的模型MiniMax-01系列，其语音模型能够反映出人类的喜怒哀乐，目前已可支持17种语言。

resize,w 1024

媒体记者在MiniMax探营采访

谈及DeepSeek这家“友商”，刘华不吝赞美之词：“DeepSeek在强化学习、算力调配等方面都做得非常有创新，取得了非常多的进步与发展，所以迅速火出圈。作为AI行业的从业者，我们的感受是，这个行业技术迭代的速度非常快，大模型技术一直保持着每隔几个月就取得重要突破的一个频率，这其中就包括DeepSeek所带来的创新。我们判断，接下来的两三年，大模型的能力还会带来几倍量级的提升。”

不过，刘华同时呼吁，大家千万不能掉以轻心，“竞争非常激烈，千万别说中国大模型已经弯道超车、不再需要关心和支持了，我们还是需要得到大家的呵护。”

他以中国新能源汽车举例说，中国的新能源汽车是从1995年开始起步的，到2024年差不多发展了30年，其间走过了模仿、创新、赶上阶段，目前基本是处于一个超越的阶段，对大模型企业来说，也需要经过这样一个历程。

在采访中，刘华还特别提到了得益于大模型的开源，近期社会各界热衷向DeepSeek“提问”。在他看来，高水平大模型的开源，有助于推动行业的加快发展，能够让大众免费体验到优秀大模型的技术能力，有助于提高AI的渗透力，吸引更多的开发者一起参与大模型的研发。

但他也提到，问答助手还是属于AI大模型比较初级阶段的浅层次应用，只是解决了求知欲的问题，对提高生产力方面作用并不大。“现在的大模型推理能力增强，可以去思考复杂的问题、给出复杂的答案，问它一些特别简单的问题，其实是浪费大模型的能力。其实在很多复杂的场景下，大模型会有更多的用处，也可以对生产力有真正立竿见影的效果。”

刘华同时表示，在顶层研发框架已经迭代的情况下，其实需要研发人员对技术变革抱有极致的热情。所以大家可以看到DeepSeek特别好玩的一点，就是他们不去招募所谓大模型行业的专家学者，招的基本上都是顶多在业界干了一两年或者直接就招博士硕士，这些年轻人对技术变革往往抱有极致的热情。

“MiniMax也一样，我们的研发团队也非常年轻，就是一个90后的天地，大部分人都在35岁以下，好多博士还在读书阶段就过来做实习生，然后一毕业就来公司签约。”刘华说，这次全球开发者先锋大会，公司会请很多智能硬件生产合作伙伴一起展示大模型的应用场景，把自己正在做的事情和创新点展示给大家。

“一个模型做得好，不代表其他模型就没有机会。现在很多友商觉得DeepSeek做得好，自己也主动接入、也愿意用，这是一个非常开放的心态，我觉得这挺好。”刘华表示。