通天论坛772003com-腾讯出牌方式变了

姚顺雨首秀为何与市场预期错位？出品|虎嗅黄青春频道作者|商业消费主笔黄青春题图|视觉中国姚顺雨执掌腾讯混元后的首秀，最终被 DeepSeek-V4 的讨论淹没了。 4 月 23 日，腾讯正式发布并开源混元 Hy3 preview 语言模型——这是姚顺雨主导混元技术体系全面重建后，交出的首份落地成果。在此之前，市场对姚顺雨的期待值早已拉满：清华姚班出身、OpenAI 前核心研究员、AI 领域顶尖专家，入职即获得集团层面双线汇报的最高权限，一手推动腾讯混元大模型研发架构重构，还打破盘桓多年的部门墙，让成立十年的 AI Lab 打散重组。有鉴于此，外界翘首以盼腾讯拿出一款颠覆性的新模型，但 Hy3 preview 最终的市场声量与讨论度并不及预期。这很大程度上源于，同期 GPT-5.5、小米 Mimo、Kimi K2.6 等新模型密集发布，次日 DeepSeek-V4 也强势登场。这让混元有限的声量彻底在这轮大模型更新浪潮中“失声”，业内因此有人揶揄腾讯，“不如关停混元，高价收购 DeepSeek”。对此，腾讯内部人士向虎嗅透露，与外界期待姚顺雨“单骑救主”的英雄主义叙事不同，团队对这一版本并未设定过高目标，因为 Hy3 preview 并非对 Hy2.0 的迭代，而是腾讯混元技术体系的一次推倒重建。 “Hy3 预览版与 DeepSeek-V4 的核心差异在于，后者暂不考虑商业化，专注于突破技术上限；而混元从研发之初就以适配腾讯业务生态为核心，强调与场景的深度绑定。如今 AI 行业已进入下半场，模型能力、生态资源与工程化实力将形成协同效应——毕竟腾讯从来不是一家单纯的模型公司。”该内部人士表示。腾讯终究“差了一口气”？从官宣预热到最终发布，Hy3 preview 的表现与市场拉满的期待存在明显落差。自高调宣布姚顺雨加盟以来，腾讯便对其展现了超乎寻常的重视：一人身兼“CEO/总裁办公室”首席 AI 科学家、AI Infra 部与大语言模型部负责人两大职务，同时向腾讯总裁刘炽平、技术工程事业群总裁卢山双线汇报。这种人事安排在腾讯发展史上颇为罕见，等于从集团层面确立了大模型的战略核心地位，也向市场传递出腾讯 All in AI 的决心。 3 月 18 通天论坛772003com日的财报电话会上，刘炽平的表态更将市场期待推至顶峰：他明确透露混元全新技术体系下的旗舰模型 Hy3.0 正处于内部业务测试阶段，计划于 4 月对外推出，且相较于 Hy2.0 的能力提升幅度，将超过混元历史上任何一次版本迭代。叠加 2026 年二季度全球大模型赛道进入新一轮密集发布期：Anthropic 发布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview、Kimi 开源 K2.6、小米官宣 Mimo 全系列新模型，GPT-5.5 与 DeepSeek V4 前后脚上桌——如此“神仙打架”的贴身肉搏，市场自然期待腾讯能拿出一款足以改写国内大模型格局的旗舰产品。然而，与拉满的市场预期形成鲜明对比的是，Hy3 preview 虽踩点交付，但技术突破有限，在各个维度均未给市场带来预期中的惊喜。首先，腾讯高管承诺 4 月推出核心版本，4 月底却只发布了 Hy3 预览版，勉强踩中时间节点，未体现出腾讯作为行业巨头应有的执行力与爆发力。对此，腾讯内部人士向虎嗅表示，实际上 Hy3 预览版是技术重建的起点，正式版及更高级别的版本还在同步研发测试中。“Hy3 基本完成了对原有技术架构的全面重构，这个版本的核心目标是验证全新技术路线、磨合重组后的团队并跑通完整研发流程，且仅用不到三个月就完成交付，而行业同类技术重构通常需要 6-12 个月。” 其次，在行业动辄以 1T 参数炸场的当下，Hy3 preview 总参数 295B、激活参数 21B 的规格无法给市场带来冲击力，被业内人士吐槽不够顶尖、不够震撼。从实测与行业评测结果来看，Hy3 preview 的综合能力虽达到国内一线水平，但极限推理能力仍逊于 GLM-5、Gemini 3.1 等顶级模型；代码与智能体能力仅相当于 GLM-4.7——也就是智谱 AI 四个月前的技术水平，既没有实现市场期待的代差级突破，更谈不上对标全球顶级模型。可如果抛开市场的高预期滤镜，回归模型本身的技术与落地能力，Hy3 preview 已然是腾讯混元历史上进步幅度最大、实用性最强的版本。推理效率层面，得益于模型架构与推理框架的深度协同，Hy3 preview 整体推理效率提升 40%，首 token 延迟降低 54%，端到端时长降低 47%，成本较上一代模型大幅下降——等于说，决定用户体验与商业化可行性的核心指标均被大幅优化。复杂推理能力层面，Hy3 preview 在 FrontierScience-Olympiad 拿下 70.0 分、IMO Answer Bench 达到 84.3 分，整体表现超过 GLM-5、Kimi-K2.5，接近 Gemini 3.1 Pro 与 GPT-5.4。代码与智能体能力是 Hy3 preview 提升最显著的方向。在 SWE-Bench Verified 基准测试中达到 74.4% 的通过率，逼近 GLM-5 与 Kimi-K2.5；在 Terminal-Bench 2.0 测试中取得 54.4% 的得分，超过 GLM-4.7 等模型，挤进行业第一梯队；在涵盖 16 项基准的 Agent 综合评测中，平均得分从 Hy2 的 35 分跃升至 56 分，接近 GLM-5 与 Kimi-K2.5 所在的旗舰区间。这些能力跃升背后，是 Hy3 preview 从研发之初就确立了与产品深度协同设计（Co-Design）的研发路线。虎嗅获悉，Hy3 pre

湖南城步苗乡三代人的传承让民族文化焕发新生

姚顺雨首秀为何与市场预期错位？出品|虎嗅黄青春频道作者|商业消费主笔黄青春题图|视觉中国姚顺雨执掌腾讯混元后的首秀，最终被 DeepSeek-V4 的讨论淹没了。 4 月 23 日，腾讯正式发布并开源混元 Hy3 preview 语言模型——这是姚顺雨主导混元技术体系全面重建后，交出的首份落地成果。在此之前，市场对姚顺雨的期待值早已拉满：清华姚班出身、OpenAI 前核心研究员、AI 领域顶尖专家，入职即获得集团层面双线汇报的最高权限，一手推动腾讯混元大模型研发架构重构，还打破盘桓多年的部门墙，让成立十年的 AI Lab 打散重组。有鉴于此，外界翘首以盼腾讯拿出一款颠覆性的新模型，但 Hy3 preview 最终的市场声量与讨论度并不及预期。这很大程度上源于，同期 GPT-5.5、小米 Mimo、Kimi K2.6 等新模型密集发布，次日 DeepSeek-V4 也强势登场。这让混元有限的声量彻底在这轮大模型更新浪潮中“失声”，业内因此有人揶揄腾讯，“不如关停混元，高价收购 DeepSeek”。对此，腾讯内部人士向虎嗅透露，与外界期待姚顺雨“单骑救主”的英雄主义叙事不同，团队对这一版本并未设定过高目标，因为 Hy3 preview 并非对 Hy2.0 的迭代，而是腾讯混元技术体系的一次推倒重建。 “Hy3 预览版与 DeepSeek-V4 的核心差异在于，后者暂不考虑商业化，专注于突破技术上限；而混元从研发之初就以适配腾讯业务生态为核心，强调与场景的深度绑定。如今 AI 行业已进入下半场，模型能力、生态资源与工程化实力将形成协同效应——毕竟腾讯从来不是一家单纯的模型公司。”该内部人士表示。腾讯终究“差了一口气”？从官宣预热到最终发布，Hy3 preview 的表现与市场拉满的期待存在明显落差。自高调宣布姚顺雨加盟以来，腾讯便对其展现了超乎寻常的重视：一人身兼“CEO/总裁办公室”首席 AI 科学家、AI Infra 部与大语言模型部负责人两大职务，同时向腾讯总裁刘炽平、技术工程事业群总裁卢山双线汇报。这种人事安排在腾讯发展史上颇为罕见，等于从集团层面确立了大模型的战略核心地位，也向市场传递出腾讯 All in AI 的决心。 3 月 18 日的财报电话会上，刘炽平的表态更将市场期待推至顶峰：他明确透露混元全新技术体系下的旗舰模型 Hy3.0 正处于内部业务测试阶段，计划于 4 月对外推出，且相较于 Hy2.0 的能力提升幅度，将超过混元历史上任何一次版本迭代。叠加 2026 年二季度全球大模型赛道进入新一轮密集发布期：Anthropic 发布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview、Kimi 开源 K2.6、小米官宣 Mimo 全系列新模型，GPT-5.5 与 DeepSeek V4 前后脚上桌——如此“神仙打架”的贴身肉搏，市场自然期待腾讯能拿出一款足以改写国内大模型格局的旗舰产品。然而，与拉满的市场预期形成鲜明对比的是，Hy3 preview 虽踩点交付，但技术突破有限，在各个维度均未给市场带来预期中的惊喜。首先，腾讯高管承诺 4 月推出核心版本，4 月底却只发布了 Hy3 预览版，勉强踩中时间节点，未体现出腾讯作为行业巨头应有的执行力与爆发力。对此，腾讯内部人士向虎嗅表示，实际上 Hy3 预览版是技术重建的起点，正式版及更高级别的版本还在同步研发测试中。“Hy3 基本完成了对原有技术架构的全面重构，这个版本的核心目标是验证全新技术路线、磨合重组后的团队并跑通完整研发流程，且仅用不到三个月就完成交付，而行业同类技术重构通常需要 6-12 个月。” 其次，在行业动辄以 1T 参数炸场的当下，Hy3 preview 总参数 295B、激活参数通天论坛772003com21B 的规格无法给市场带来冲击力，被业内人士吐槽不够顶尖、不够震撼。从实测与行业评测结果来看，Hy3 preview 的综合能力虽达到国内一线水平，但极限推理能力仍逊于 GLM-5、Gemini 3.1 等顶级模型；代码与智能体能力仅相当于 GLM-4.7——也就是智谱 AI 四个月前的技术水平，既没有实现市场期待的代差级突破，更谈不上对标全球顶级模型。可如果抛开市场的高预期滤镜，回归模型本身的技术与落地能力，Hy3 preview 已然是腾讯混元历史上进步幅度最大、实用性最强的版本。推理效率层面，得益于模型架构与推理框架的深度协同，Hy3 preview 整体推理效率提升 40%，首 token 延迟降低 54%，端到端时长降低 47%，成本较上一代模型大幅下降——等于说，决定用户体验与商业化可行性的核心指标均被大幅优化。复杂推理能力层面，Hy3 preview 在 FrontierScience-Olympiad 拿下 70.0 分、IMO Answer Bench 达到 84.3 分，整体表现超过 GLM-5、Kimi-K2.5，接近 Gemini 3.1 Pro 与 GPT-5.4。代码与智能体能力是 Hy3 preview 提升最显著的方向。在 SWE-Bench Verified 基准测试中达到 74.4% 的通过率，逼近 GLM-5 与 Kimi-K2.5；在 Terminal-Bench 2.0 测试中取得 54.4% 的得分，超过 GLM-4.7 等模型，挤进行业第一梯队；在涵盖 16 项基准的 Agent 综合评测中，平均得分从 Hy2 的 35 分跃升至 56 分，接近 GLM-5 与 Kimi-K2.5 所在的旗舰区间。这些能力跃升背后，是 Hy3 preview 从研发之初就确立了与产品深度协同设计（Co-Design）的研发路线。虎嗅获悉，Hy3 pre

围绕本文主题，相关信息仍在持续更新，后续内容将根据公开资料进行整理。

蓝猫头鹰资本以24亿美元收购西拉房地产信托

见，等于从集团层面确立了大模型的战略核心地位，也向市场传递出腾讯 All in AI 的决心。 3 月 18 日的通天论坛772003com财报电话会上，刘炽平的表态更将市场期

腾讯出牌方式变了

湖南城步苗乡三代人的传承让民族文化焕发新生

蓝猫头鹰资本以24亿美元收购西拉房地产信托

相关阅读

专题延展

腾讯出牌方式变了

湖南城步苗乡三代人的传承 让民族文化焕发新生

蓝猫头鹰资本以24亿美元收购西拉房地产信托

相关阅读

专题延展

湖南城步苗乡三代人的传承让民族文化焕发新生