wumiancaijing.com////这两天,全球科技圈和资本圈被一条消息炸锅。中国大模型头部玩家DeepSeek(深度求索)正式启动成立以来的首次外部融资,目标估值不低于100亿美元,计划募集资金不少于3亿美元。但资本市场还是给了很高的预期。据说这个周末,无数投资人订好了机票,务必要在这千载难逢的窗口期见到那个曾经连电话都不接的梁文锋。那个曾被拒绝向资本低头的技术理想主义者,也扛不住了?还是梁文锋有更大的布局?100亿美元估值?估值逻辑是什么?100亿美元是个什么概念?参照下同业。2026年1月,智谱AI在港股上市,首日市值528亿港元,约合68亿美元。MiniMax上市首日市值冲到了1067亿港元,约合137亿美元。截至目前公开查询到的数据,DeepSeek尚未盈利,尚未发布V4,尚未有任何商业化数据,却已经在融资谈判桌上开出了100亿美元的价格牌。这个估值介于智谱和MiniMax之间,但要知道,智谱和MiniMax已经在港交所挂牌交易,有公开市场的定价锚。DeepSeek拿的是私募市场的钱,这个估值意味着投资人对它的技术实力和未来商业潜力给出了极高的溢价。再看海外九龙澳门。OpenAI在今年3月以8520亿美元估值完成1220亿美元融资,Anthropic在2月以3800亿美元估值完成300亿美元G轮融资。100亿美元放在全球舞台上看,不过是个零头,但在中国AI独角兽阵列里,这个数字已经足够让VC们疯狂了。DeepSeek的钱包发生了什么?DeepSeek由量化私募巨头幻方量化于2023年孵化,创始人梁文锋同时执掌这两家横跨金融与AI的企业。公开工商信息显示,梁文锋在DeepSeek直接和间接持有84.29%的股份,拥有几乎100%的表决权。这家公司从第一天起就没有拿过外部VC的钱。梁文锋为什么要拒绝资本?他曾经说得很直接:VC都是帮LP管钱,都得赚钱,谈不到一块去。他的理想(可能是曾经的理想)是做一个纯粹的研究机构,追AGI、做开源、不被任何人的商业化时间表绑架。更重要的是,他确实有钱。幻方量化2025年收益均值高达56.55%,在百亿量化私募中位列第二。按超700亿元的管理规模计算,这意味着约350到400亿元的利润。业内人士估算,幻方量化2025年的强劲表现可能带来超过7亿美元的收入。相比之下,DeepSeekV3的总训练成本预算仅557万美元。从账面上看,幻方几个月的利润足以支撑DeepSeek数年的研发投入。早年间梁文锋就已经囤了大量的英伟达GPU,2021年砸10亿元建萤火二号,把幻方做成了国内屈指可数的万卡集群公司。这就是DeepSeek的底气。在友商拿着PPT融资数亿美元的时候,梁文锋在用自己的钱玩。但2026年的故事已经不同了。这张表格揭示了一个残酷的事实:大模型的烧钱速度在指数级增长。2025年你花500多万美元就能训练出一个震惊世界的模型,2026年你可能需要投入十亿美元级别的资金才能跟上节奏。V4发布前夕,市场变天了融资消息传出的时间点很微妙。DeepSeekV4预计在4月底正式亮相,这原本该是这家公司的又一次高光时刻。但在这个节骨眼上,梁文锋选择了向资本开口。V4的参数规格让所有人大吃一惊:总参数跃升至约1万亿(MoE架构,每个token仅激活370亿参数),上下文窗口扩展至100万token,首次支持原生多模态。内部测试基准显示SWE-bench超80%、HumanEval达90%。这个模型如果真能跑出这样的成绩,将与美国顶尖大模型处于同一水平线。但问题在于,V4已经被推迟了好几次。原定春节前后发布,推到2月,再推到3月,目前的口径是4月下旬。综合业内人士的分析,延期背后至少有三层原因。1.技术路线本身发生了质变。V4不再是简单的参数堆叠,而是万亿参数MoE架构、原生多模态、百万token上下文的全新系统级工程,训练验证复杂度陡然上了一个台阶。2.DeepSeek选择了一条最难的路:彻底去英伟达化。V4将深度适配华为昇腾芯片,工程师们需要将核心代码从英伟达的CUDA生态迁移到华为的CANN架构。精度对齐需要反复调试,同样的模型在两种芯片上跑出一致结果极其耗时。3.身份包袱的压力。DeepSeek以“效率神话”立身,V4不能有闪失,否则整个叙事就会崩塌。这些问题的本质指向同一个东西:钱。更多的钱意味着更多的算力、更多的工程师、更快的调试进度。人才正在用脚投票如果说算力压力是外部推动力,那么人才流失就是内部引爆点。有媒体报道,自2025年初R1爆红以来,DeepSeek的核心团队正在经历一场“大出血”。V3架构的关键贡献者罗福莉2025年底转投小米,接手MiMo大模型团队。第一代大语言模型核心作者王炳宣去了腾讯。多模态方向核心研究员阮翀加入元戎启行做首席科学家。OCR系列核心作者魏浩然也在今年春节前后离开。1994年生的核心研究员郭达雅被字节跳动挖走,担任Agent方向负责人之一。为什么?因为在这个阶段,理想不能当饭吃。对于大部分打工人来说,诗和远方(老板画的大饼)不能充饥,解决当下的生活问题,真金白银进入自己腰包才是实惠的。DeepSeek从未融资,没有市场化的估值对标。员工手里的股权承诺就是一张无法兑现的白条。大厂的期权有行权价、有内部回购机制、有IPO预期。外界只知道DeepSeek很值钱,但到底值多少,没有人能说清,员工更不知道。当字节、小米开出“现金+期权+IPO预期”的组合时,梁文锋拿什么留人?这个问题只有一个答案:建立市场化的股权激励机制。而要建立这个机制,首先需要一轮市场化的融资,给公司一个公允价值。行业竞争背后的重要筹码:资本2026年全球大模型竞争的格局已经彻底变了。海外市场,OpenAI和Anthropic正在上演“资本之王”的争夺战。OpenAI以8520亿美元

*ST万方面临“市值退” 4月14日开市起停牌

wumiancaijing.com////这两天,全球科技圈和资本圈被一条消息炸锅。中国大模型头部玩家DeepSeek(深度求索)正式启动成立以来的首次外部融资,目标估值不低于100亿美元,计划募集资金不少于3亿美元。但资本市场还是给了很高的预期。据说这个周末,无数投资人订好了机票,务必要在这千载难逢的窗口期见到那个曾经连电话都不接的梁文锋。那个曾被拒绝向资本低头的技术理想主义者,也扛不住了?还是梁文锋有更大的布局?100亿美元估值?估值逻辑是什么?100亿美元是个什么概念?参照下同业。2026年1月,智谱AI在港股上市,首日市值528亿港元,约合68亿美元。MiniMax上市首日市值冲到了1067亿港元,约合137亿美元。截至目前公开查询到的数据,DeepSeek尚未盈利,尚未发布V4,尚未有任何商业化数据,却已经在融资谈判桌上开出了100亿美元的价格牌。这个估值介于智谱和MiniMax之间,但要知道,智谱和MiniMax已经在港交所挂牌交易,有公开市场的定价锚。DeepSeek拿的是私募市场的钱,这个估值意味着投资人对它的技术实力和未来商业潜力给出了极高的溢价。再看海外。OpenAI在今年3月以8520亿美元估值完成1220亿美元融资,Anthropic在2月以3800亿美元估值完成300亿美元G轮融资。100亿美元放在全球舞台上看,不过是个零头,但在中国AI独角兽阵列里,这个数字已经足够让VC们疯狂了。DeepSeek的钱包发生了什么?DeepSeek由量化私募巨头幻方量化于2023年孵化,创始人梁文锋同时执掌这两家横跨金融与AI的企业。公开工商信息显示,梁文锋在DeepSeek直接和间接持有84.29%的股份,拥有几九龙澳门乎100%的表决权。这家公司从第一天起就没有拿过外部VC的钱。梁文锋为什么要拒绝资本?他曾经说得很直接:VC都是帮LP管钱,都得赚钱,谈不到一块去。他的理想(可能是曾经的理想)是做一个纯粹的研究机构,追AGI、做开源、不被任何人的商业化时间表绑架。更重要的是,他确实有钱。幻方量化2025年收益均值高达56.55%,在百亿量化私募中位列第二。按超700亿元的管理规模计算,这意味着约350到400亿元的利润。业内人士估算,幻方量化2025年的强劲表现可能带来超过7亿美元的收入。相比之下,DeepSeekV3的总训练成本预算仅557万美元。从账面上看,幻方几个月的利润足以支撑DeepSeek数年的研发投入。早年间梁文锋就已经囤了大量的英伟达GPU,2021年砸10亿元建萤火二号,把幻方做成了国内屈指可数的万卡集群公司。这就是DeepSeek的底气。在友商拿着PPT融资数亿美元的时候,梁文锋在用自己的钱玩。但2026年的故事已经不同了。这张表格揭示了一个残酷的事实:大模型的烧钱速度在指数级增长。2025年你花500多万美元就能训练出一个震惊世界的模型,2026年你可能需要投入十亿美元级别的资金才能跟上节奏。V4发布前夕,市场变天了融资消息传出的时间点很微妙。DeepSeekV4预计在4月底正式亮相,这原本该是这家公司的又一次高光时刻。但在这个节骨眼上,梁文锋选择了向资本开口。V4的参数规格让所有人大吃一惊:总参数跃升至约1万亿(MoE架构,每个token仅激活370亿参数),上下文窗口扩展至100万token,首次支持原生多模态。内部测试基准显示SWE-bench超80%、HumanEval达90%。这个模型如果真能跑出这样的成绩,将与美国顶尖大模型处于同一水平线。但问题在于,V4已经被推迟了好几次。原定春节前后发布,推到2月,再推到3月,目前的口径是4月下旬。综合业内人士的分析,延期背后至少有三层原因。1.技术路线本身发生了质变。V4不再是简单的参数堆叠,而是万亿参数MoE架构、原生多模态、百万token上下文的全新系统级工程,训练验证复杂度陡然上了一个台阶。2.DeepSeek选择了一条最难的路:彻底去英伟达化。V4将深度适配华为昇腾芯片,工程师们需要将核心代码从英伟达的CUDA生态迁移到华为的CANN架构。精度对齐需要反复调试,同样的模型在两种芯片上跑出一致结果极其耗时。3.身份包袱的压力。DeepSeek以“效率神话”立身,V4不能有闪失,否则整个叙事就会崩塌。这些问题的本质指向同一个东西:钱。更多的钱意味着更多的算力、更多的工程师、更快的调试进度。人才正在用脚投票如果说算力压力是外部推动力,那么人才流失就是内部引爆点。有媒体报道,自2025年初R1爆红以来,DeepSeek的核心团队正在经历一场“大出血”。V3架构的关键贡献者罗福莉2025年底转投小米,接手MiMo大模型团队。第一代大语言模型核心作者王炳宣去了腾讯。多模态方向核心研究员阮翀加入元戎启行做首席科学家。OCR系列核心作者魏浩然也在今年春节前后离开。1994年生的核心研究员郭达雅被字节跳动挖走,担任Agent方向负责人之一。为什么?因为在这个阶段,理想不能当饭吃。对于大部分打工人来说,诗和远方(老板画的大饼)不能充饥,解决当下的生活问题,真金白银进入自己腰包才是实惠的。DeepSeek从未融资,没有市场化的估值对标。员工手里的股权承诺就是一张无法兑现的白条。大厂的期权有行权价、有内部回购机制、有IPO预期。外界只知道DeepSeek很值钱,但到底值多少,没有人能说清,员工更不知道。当字节、小米开出“现金+期权+IPO预期”的组合时,梁文锋拿什么留人?这个问题只有一个答案:建立市场化的股权激励机制。而要建立这个机制,首先需要一轮市场化的融资,给公司一个公允价值。行业竞争背后的重要筹码:资本2026年全球大模型竞争的格局已经彻底变了。海外市场,OpenAI和Anthropic正在上演“资本之王”的争夺战。OpenAI以8520亿美元

围绕本文主题,相关信息仍在持续更新,后续内容将根据公开资料进行整理。

金管局公布 汇丰及碇点金融科技为首批稳定币牌照发行人

元建萤火二号,把幻方做成了国内屈指可数的万卡集群公司。这就是DeepSeek的底气。在友商拿着PPT融资数亿美元的时候,梁文锋在用自己的钱玩。但2026年的故事已经不同了。这张表格揭示了一个残酷的事实:大模型的烧钱速度在指数级增长。2025年你九龙澳门花500多万美元就能训练出一个震惊世界的模型,2026年你可能需要投入十亿美元级别的资金才能跟上节奏。V