这篇带大家快速认识 DeepSeek(深度求索)。2025 年初,它的 App 突然冲上美国 App Store 免费榜第一、超越 ChatGPT,整个硅谷开始重新计算「训练一个前沿模型到底要花多少钱」,但这家公司到底是谁开的、靠什么活着,多数人讲不太清楚。

DeepSeek 2023 年在杭州成立,背后是一家量化基金幻方科技(High-Flyer),创始人梁文锋同时是两边的老板。它最为人知的招牌,是用更少的算力做到对标前沿的效果,再把模型权重以 MIT 等开源授权公开发布。

它和多数对手最大的差别,在于「便宜又开放」。当 OpenAI、Anthropic 走闭源、高价路线时,DeepSeek 把模型权重公开、API 价格压到同级最低,「最便宜的可用前沿模型」这个定位,本身就成了护城河。

一句话记住它:用量化基金的钱和工程效率,把前沿 AI 做成开源又便宜的那家中国公司。

它也有几个还没有定论的问号:最受关注的外部变量是高端芯片的获取,梁文锋本人就曾表示,真正的限制不在资金,而在先进芯片的禁运;此外,首轮融资估值仍在洽谈、财务没有审计披露,海外也有数据与出口管制方面的争议。看 DeepSeek 时,这些背景值得一起放进来。


核心数据快照

先把关键数字放一起。DeepSeek 未上市、没有公开完整财报,下面不少数字是公司对外口径或媒体报道,这里尽量分清楚哪些是官方确认、哪些是外界推估。

项目数据
成立年份2023 年
总部中国杭州
创始人 / CEO梁文锋(Liang Wenfeng)
背后 / 母公司源自量化基金幻方科技(High-Flyer),同一创始人;为早期算力与资金来源
公司性质未上市;由量化基金旗下 AGI 研究组独立而来的 AI 研究加商业 API 平台
主力产品推理模型(R 系列)、通用模型(V 系列);免费 App/Web、开放权重、低价 API
最新估值报道称首轮融资估值约 200-500 亿美元(尚未确认成交,多家媒体口径不一)
开源授权R1、V3 系列多采 MIT 开源;V4 系列官方称开源(完整授权条款待确认)
主要算力Nvidia H800(早期训练主力)、H20;同时推进华为昇腾、AMD 等替代路径
正面对手全球:OpenAI、Anthropic、Google、Meta;中国:通义千问、豆包、Kimi、GLM 等

两个读数字的提醒,看任何中国 AI 新创都用得上。 ①DeepSeek 公布过「理论利润率」这类数字(例如把全天用量都按定价计费推算),那是理论估算、不是财报实际毛利,看到要先问「这是假设还是入账」;②私人公司没有审计财报,估值与营收多是报道或推估,抓「量级和趋势」比抓精确值实在。


七个维度快速导览

认识一家 AI 公司,可以从七个维度切入。后面会把重点维度再拆成单篇。

①技术与产品路线:产品分两条线,推理模型(2025 年初一战成名的 R 系列)与通用模型(V 系列),近期往更长的上下文与 agent 工具使用发展。它真正的招牌是工程效率,大量采用 MoE(混合专家)稀疏架构,让模型每次只激活一小部分参数,加上一系列训练优化,能用相对少的算力做到对标前沿。模型权重多以 MIT 等开源授权公开(最新一代官方称开源,完整条款待确认)。

②客户与市场定位:一端是免费 App 打全球消费者心智(2025 年初登上美国 App Store 免费榜第一),一端是超低价 API 与开放权重吃开发者与企业。竞争定位很清楚,「最便宜的可用前沿模型」。正面对手在全球是 OpenAI、Anthropic、Google、Meta,在中国则是通义千问、豆包、Kimi、GLM 等一批本土模型。

③生态系统与合作策略:DeepSeek 不靠渠道堆叠,靠「开放权重加推理框架全面适配」让生态自己长,模型上架 HuggingFace、GitHub 等平台,主流推理框架与 AMD、华为昇腾等硬件都有人做适配。它早期的资金与算力几乎只有一个来源:母公司幻方,用量化交易的收益换成 GPU 集群再投入研究。

④估值与财务模型:截至 2026 年 5 月,它正洽谈首轮外部融资,媒体报道的估值区间约落在 200 亿到 500 亿美元、但尚未确认成交,且不同媒体口径差异不小。创始人梁文锋在公司握有主导地位。另一个常被引用的数字是「545% 理论利润率」,它把全天用量都按定价计费推算,属理论值、而非实际营收或毛利;公司未上市、没有审计财报,实际财务状况仍待披露。

⑤商业化风险与监管:在中国境内,DeepSeek 已完成生成式 AI 服务的备案,是少数可直接核查的合规节点。海外则有争议:意大利数据保护机构曾在 2025 年初阻止它访问意大利用户数据,韩国个人信息保护委员会也提出数据跨境的疑虑(依媒体报道)。长期维持的大幅促销定价,也让人关注它的推理成本与毛利能不能撑住。

⑥地缘政治与供应链:高端芯片的获取,是 DeepSeek 最受关注的外部变量。早期训练主力是 Nvidia 在出口管制后推出的降规版 H800,如今正推进华为昇腾、AMD 等国产与替代路径(技术上已有适配,商业规模仍待观察)。供应链上也有一则具争议的指控:曾有单一匿名美国官员指 DeepSeek 涉及军方并规避出口管制,但 Nvidia 否认、称其使用合法取得的 H800,相关报道也未能独立核实,属未经独立查证、且被供应商否认的单源说法,两面并陈。整条硬件链怎么运作,可以看 AI 硬件供应链一条龙

⑦领导层与治理:创始人梁文锋同时主导量化基金幻方与 DeepSeek,决策高度集中是这家公司的特色,也是风险。公司由幻方的 AGI 研究组衍生而来,尚未见独立董事会等治理结构的公开确认。人才动向值得长期关注,已有核心研究员离职、转往其他中国科技公司的 AI 团队。


重要里程碑

把 DeepSeek 走到今天的关键节点挑出来看:

时间里程碑
2021母公司幻方完成约一万张 A100 GPU 集群,奠定算力底气
2023梁文锋创立 DeepSeek,自幻方的 AGI 研究组独立
2024-04DeepSeek 完成中国生成式 AI 服务备案(可核查的合规节点)
2024-12发布 V3(低成本训练的成名作)
2025-01发布推理模型 R1(采开源授权);App 登上美国 App Store 免费榜第一
2025-01意大利数据保护机构阻止其访问用户数据(首个海外监管事件)
2025 下半年R1、V3 持续迭代,能力与 agent/工具使用强化
2026-04发布 V4 系列(V4-Pro/V4-Flash,支持百万级别长上下文)
2026-05首轮外部融资洽谈曝光(报道估值最高约 500 亿美元,未成交)

里程碑会持续补充,数字以最新公告为准(本表最后整理:2026 年 5 月)。


延伸阅读与接下来的单篇

接下来如果想读更深入的,会把重点维度拆成单篇,陆续产出:

  • 出口管制下,DeepSeek 的算力怎么补?
  • DeepSeek 估值怎么算出来的?为什么便宜还能活
  • 从备案到意大利争议:DeepSeek 的监管全景
  • 梁文锋与幻方:量化基金怎么长出一家全球瞩目的 AI 公司
  • 想学 DeepSeek 怎么用、免费怎么上手?教程另外写(上线后补上链接)
  • 比较一下打法不同的对手:OpenAIAnthropic
  • 想看整条硬件链:AI 硬件供应链一条龙