姚顺雨首秀为何与市场预期错位? 出品|虎嗅黄青春频道 作者|商业消费主笔 黄青春 题图|视觉中国 姚顺雨执掌腾讯混元后的首秀,最终被 DeepSeek-V4 的讨论淹没了。 4 月 23 日,腾讯正式发布并开源混元 Hy3 preview 语言模型——这是姚顺雨主导混元技术体系全面重建后,交出的首份落地成果。 在此之前,市场对姚顺雨的期待值早已拉满:清华姚班出身、OpenAI 前核心研究员、AI 领域顶尖专家,入职即获得集团层面双线汇报的最高权限,一手推动腾讯混元大模型研发架构重构,还打破盘桓多年的部门墙,让成立十年的 AI Lab 打散重组。 有鉴于此,外界翘首以盼腾讯拿出一款颠覆性的新模型,但 Hy3 preview 最终的市场声量与讨论度并不及预期。这很大程度上源于,同期 GPT-5.5、小米 Mimo、Kimi K2.6 等新模型密集发布,次日 DeepSeek-V4 也强势登场。 这让混元有限的声量彻底在这轮大模型更新浪潮中“失声”,业内因此有人揶揄腾讯,“不如关停混元,高价收购 DeepSeek”。 对此,腾讯内部人士向虎嗅透露,与外界期待姚顺雨“单骑救主”的英雄主义叙事不同,团队对这一版本并未设定过高目标,因为 Hy3 preview 并非对 Hy2.0 的迭代,而是腾讯混元技术体系的一次推倒重建。 “Hy3 预览版与 DeepSeek-V4 的核心差异在于,后者暂不考虑商业化,专注于突破技术上限;而混元从研发之初就以适配腾讯业务生态为核心,强调与场景的深度绑定。如今 AI 行业已进入下半场,模型能力、生态资源与工程化实力将形成协同效应——毕竟腾讯从来不是一家单纯的模型公司。”该内部人士表示。 腾讯终究“差了一口气”? 从官宣预热到最终发布,Hy3 preview 的表现与市场拉满的期待存在明显落差。 自高调宣布姚顺雨加盟以来,腾讯便对其展现了超乎寻常的重视:一人身兼“CEO/总裁办公室”首席 AI 科学家、AI Infra 部与大语言模型部负责人两大职务,同时向腾讯总裁刘炽平、技术工程事业群总裁卢山双线汇报。 这种人事安排在腾讯发展史上颇为罕见,等于从集团层面确立了大模型的战略核心地位,也向市场传递出腾讯 All in AI 的决心。 3 月 18 通天论坛772003com日的财报电话会上,刘炽平的表态更将市场期待推至顶峰:他明确透露混元全新技术体系下的旗舰模型 Hy3.0 正处于内部业务测试阶段,计划于 4 月对外推出,且相较于 Hy2.0 的能力提升幅度,将超过混元历史上任何一次版本迭代。 叠加 2026 年二季度全球大模型赛道进入新一轮密集发布期:Anthropic 发布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview、Kimi 开源 K2.6、小米官宣 Mimo 全系列新模型,GPT-5.5 与 DeepSeek V4 前后脚上桌——如此“神仙打架”的贴身肉搏,市场自然期待腾讯能拿出一款足以改写国内大模型格局的旗舰产品。 然而,与拉满的市场预期形成鲜明对比的是,Hy3 preview 虽踩点交付,但技术突破有限,在各个维度均未给市场带来预期中的惊喜。 首先,腾讯高管承诺 4 月推出核心版本,4 月底却只发布了 Hy3 预览版,勉强踩中时间节点,未体现出腾讯作为行业巨头应有的执行力与爆发力。 对此,腾讯内部人士向虎嗅表示,实际上 Hy3 预览版是技术重建的起点,正式版及更高级别的版本还在同步研发测试中。“Hy3 基本完成了对原有技术架构的全面重构,这个版本的核心目标是验证全新技术路线、磨合重组后的团队并跑通完整研发流程,且仅用不到三个月就完成交付,而行业同类技术重构通常需要 6-12 个月。” 其次,在行业动辄以 1T 参数炸场的当下,Hy3 preview 总参数 295B、激活参数 21B 的规格无法给市场带来冲击力,被业内人士吐槽不够顶尖、不够震撼。 从实测与行业评测结果来看,Hy3 preview 的综合能力虽达到国内一线水平,但极限推理能力仍逊于 GLM-5、Gemini 3.1 等顶级模型;代码与智能体能力仅相当于 GLM-4.7——也就是智谱 AI 四个月前的技术水平,既没有实现市场期待的代差级突破,更谈不上对标全球顶级模型。 可如果抛开市场的高预期滤镜,回归模型本身的技术与落地能力,Hy3 preview 已然是腾讯混元历史上进步幅度最大、实用性最强的版本。 推理效率层面,得益于模型架构与推理框架的深度协同,Hy3 preview 整体推理效率提升 40%,首 token 延迟降低 54%,端到端时长降低 47%,成本较上一代模型大幅下降——等于说,决定用户体验与商业化可行性的核心指标均被大幅优化。 复杂推理能力层面,Hy3 preview 在 FrontierScience-Olympiad 拿下 70.0 分、IMO Answer Bench 达到 84.3 分,整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4。 代码与智能体能力是 Hy3 preview 提升最显著的方向。在 SWE-Bench Verified 基准测试中达到 74.4% 的通过率,逼近 GLM-5 与 Kimi-K2.5;在 Terminal-Bench 2.0 测试中取得 54.4% 的得分,超过 GLM-4.7 等模型,挤进行业第一梯队;在涵盖 16 项基准的 Agent 综合评测中,平均得分从 Hy2 的 35 分跃升至 56 分,接近 GLM-5 与 Kimi-K2.5 所在的旗舰区间。 这些能力跃升背后,是 Hy3 preview 从研发之初就确立了与产品深度协同设计(Co-Design)的研发路线。 虎嗅获悉,Hy3 pre
湖南城步苗乡三代人的传承 让民族文化焕发新生
姚顺雨首秀为何与市场预期错位? 出品|虎嗅黄青春频道 作者|商业消费主笔 黄青春 题图|视觉中国 姚顺雨执掌腾讯混元后的首秀,最终被 DeepSeek-V4 的讨论淹没了。 4 月 23 日,腾讯正式发布并开源混元 Hy3 preview 语言模型——这是姚顺雨主导混元技术体系全面重建后,交出的首份落地成果。 在此之前,市场对姚顺雨的期待值早已拉满:清华姚班出身、OpenAI 前核心研究员、AI 领域顶尖专家,入职即获得集团层面双线汇报的最高权限,一手推动腾讯混元大模型研发架构重构,还打破盘桓多年的部门墙,让成立十年的 AI Lab 打散重组。 有鉴于此,外界翘首以盼腾讯拿出一款颠覆性的新模型,但 Hy3 preview 最终的市场声量与讨论度并不及预期。这很大程度上源于,同期 GPT-5.5、小米 Mimo、Kimi K2.6 等新模型密集发布,次日 DeepSeek-V4 也强势登场。 这让混元有限的声量彻底在这轮大模型更新浪潮中“失声”,业内因此有人揶揄腾讯,“不如关停混元,高价收购 DeepSeek”。 对此,腾讯内部人士向虎嗅透露,与外界期待姚顺雨“单骑救主”的英雄主义叙事不同,团队对这一版本并未设定过高目标,因为 Hy3 preview 并非对 Hy2.0 的迭代,而是腾讯混元技术体系的一次推倒重建。 “Hy3 预览版与 DeepSeek-V4 的核心差异在于,后者暂不考虑商业化,专注于突破技术上限;而混元从研发之初就以适配腾讯业务生态为核心,强调与场景的深度绑定。如今 AI 行业已进入下半场,模型能力、生态资源与工程化实力将形成协同效应——毕竟腾讯从来不是一家单纯的模型公司。”该内部人士表示。 腾讯终究“差了一口气”? 从官宣预热到最终发布,Hy3 preview 的表现与市场拉满的期待存在明显落差。 自高调宣布姚顺雨加盟以来,腾讯便对其展现了超乎寻常的重视:一人身兼“CEO/总裁办公室”首席 AI 科学家、AI Infra 部与大语言模型部负责人两大职务,同时向腾讯总裁刘炽平、技术工程事业群总裁卢山双线汇报。 这种人事安排在腾讯发展史上颇为罕见,等于从集团层面确立了大模型的战略核心地位,也向市场传递出腾讯 All in AI 的决心。 3 月 18 日的财报电话会上,刘炽平的表态更将市场期待推至顶峰:他明确透露混元全新技术体系下的旗舰模型 Hy3.0 正处于内部业务测试阶段,计划于 4 月对外推出,且相较于 Hy2.0 的能力提升幅度,将超过混元历史上任何一次版本迭代。 叠加 2026 年二季度全球大模型赛道进入新一轮密集发布期:Anthropic 发布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview、Kimi 开源 K2.6、小米官宣 Mimo 全系列新模型,GPT-5.5 与 DeepSeek V4 前后脚上桌——如此“神仙打架”的贴身肉搏,市场自然期待腾讯能拿出一款足以改写国内大模型格局的旗舰产品。 然而,与拉满的市场预期形成鲜明对比的是,Hy3 preview 虽踩点交付,但技术突破有限,在各个维度均未给市场带来预期中的惊喜。 首先,腾讯高管承诺 4 月推出核心版本,4 月底却只发布了 Hy3 预览版,勉强踩中时间节点,未体现出腾讯作为行业巨头应有的执行力与爆发力。 对此,腾讯内部人士向虎嗅表示,实际上 Hy3 预览版是技术重建的起点,正式版及更高级别的版本还在同步研发测试中。“Hy3 基本完成了对原有技术架构的全面重构,这个版本的核心目标是验证全新技术路线、磨合重组后的团队并跑通完整研发流程,且仅用不到三个月就完成交付,而行业同类技术重构通常需要 6-12 个月。” 其次,在行业动辄以 1T 参数炸场的当下,Hy3 preview 总参数 295B、激活参数 通天论坛772003com21B 的规格无法给市场带来冲击力,被业内人士吐槽不够顶尖、不够震撼。 从实测与行业评测结果来看,Hy3 preview 的综合能力虽达到国内一线水平,但极限推理能力仍逊于 GLM-5、Gemini 3.1 等顶级模型;代码与智能体能力仅相当于 GLM-4.7——也就是智谱 AI 四个月前的技术水平,既没有实现市场期待的代差级突破,更谈不上对标全球顶级模型。 可如果抛开市场的高预期滤镜,回归模型本身的技术与落地能力,Hy3 preview 已然是腾讯混元历史上进步幅度最大、实用性最强的版本。 推理效率层面,得益于模型架构与推理框架的深度协同,Hy3 preview 整体推理效率提升 40%,首 token 延迟降低 54%,端到端时长降低 47%,成本较上一代模型大幅下降——等于说,决定用户体验与商业化可行性的核心指标均被大幅优化。 复杂推理能力层面,Hy3 preview 在 FrontierScience-Olympiad 拿下 70.0 分、IMO Answer Bench 达到 84.3 分,整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4。 代码与智能体能力是 Hy3 preview 提升最显著的方向。在 SWE-Bench Verified 基准测试中达到 74.4% 的通过率,逼近 GLM-5 与 Kimi-K2.5;在 Terminal-Bench 2.0 测试中取得 54.4% 的得分,超过 GLM-4.7 等模型,挤进行业第一梯队;在涵盖 16 项基准的 Agent 综合评测中,平均得分从 Hy2 的 35 分跃升至 56 分,接近 GLM-5 与 Kimi-K2.5 所在的旗舰区间。 这些能力跃升背后,是 Hy3 preview 从研发之初就确立了与产品深度协同设计(Co-Design)的研发路线。 虎嗅获悉,Hy3 pre
蓝猫头鹰资本以24亿美元收购西拉房地产信托
见,等于从集团层面确立了大模型的战略核心地位,也向市场传递出腾讯 All in AI 的决心。 3 月 18 日的通天论坛772003com财报电话会上,刘炽平的表态更将市场期