炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!来源:版面之外 腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,1月底开训,不到三个月发布。 这样一个体量的模型放在今天,很容易被淹没。 但如果把这件事放在三个月前的背景下看,就有意思了。 这次发布看起来是模型升级,真正变化发生在模型之外,腾讯开始用AI反过来重写自己的组织方式。 今年1月26日,腾讯年会现场,腾讯总裁刘炽平在台上做了一件高管很少做的事,公开复盘混元大模型为什么不行。 他用了一个比喻:高中生背题应考。成绩单好看,但真正上了考场就露馅。盘点之后发现,每个关键模块都有缺失。 马化腾的措辞更直接:太慢了。慢了9个月到1年。 从那场年会到今天 Hy3 preview上线,88天。 背题拿不了真分 腾讯混元的故事要从2023年9月说起,腾讯在全球数字生态大会上正式发布混元大模型,大厂入场,声势不小。 然后就开始进入一种自证的逻辑。 不是缺投入,不是缺人。问题出在路径上。 刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限,团队选了捷径,用SFT(监督微调)去打榜。效果立竿见影,成绩单漂亮,但一进真实业务场景就暴露,泛化能力差,模型能力无法复用到产品上。 再往下挖,每一层都有裂缝。数据做得不够多,预训练不稳定,AI Infra无法规模化,强化学习缺因子和目标,底座模型撑不起上层应用。 这直接导致了产品端的困局。元宝,腾讯的AI助手应用,今年一季度月活约5700万。听起来在涨,但同期豆包月活3.45亿,千问1.66亿,差距不是在缩小,是在拉大。 差距已经不在规模层面,而是在入口的定义权。 更麻烦的是内部。腾讯体系内的业务线,微信、游戏、广告、企业服务,需要AI能力,但过去的混元接不住。不是业务不想用,是用了效果不达标。一些核心业务甚至不敢接混元,宁可绕开自己找方案。 一个大厂自研的大模型,在自己家里都坐不上主桌,这是混元过去困境最直接的写照。 彼时,腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心,AI团队是配角。先做产品,再让AI适配。用刘炽平的话说,腾讯的AI开发像是产品里没有产品经理,研发团队没人把控方向,很多工作做了等于白做。 而同一时期,字节仅AI芯片采购一项就砸了约900亿元,DeepSeek用极致效率的小团队做出R1震动全球,阿里千问的全球API调用量攀上前列。 混元不是输给了某一个对手,是组织结构本身,让它上不了战场。 先借一条命 2025年春节前后,DeepSeek R1爆火,全球AI行业的注意力被这家杭州公司劫持。 腾讯做了一个极其务实且讨巧的决定。2月13日,元宝全面接入DeepSeek-R1满血版,免费开放。 元宝日活在一个月内暴涨超过20倍,2月22日超越豆包登上苹果中国区免费App下载榜第二,一度还拿下榜单第一。 腾讯在那个窗口期的反应速度,整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima,一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。 全行业都在围观DeepSeek的时候,腾讯是第一个全方位把它接进自家生态的大厂。 但腾讯比谁都清楚,这次机遇是借来的。 DeepSeek帮元宝拉来了用户,但留存是另一回事。搜索链路被割裂,一部分走混元一部分走DeepSeek,体验不统一。 简单来说,拥抱DeepSeek的本质,是在混元自己还没准备好的时候,用外部能力把用户先接住、把场景先撑起来。 但问题在于,腾讯的微信生态、企业服务、游戏AI、广告智能投放,这些核心业务需要深度定制、可控可调的AI能力,一个通用API解决不了。 混元必须自己站起来。问题是怎么站。 拆房子的人 2025 年 9 月,一位 27 岁的年轻人低调入职腾讯。 姚顺雨,清华姚班本科、普林斯顿大学博士,师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间,他提出ReAct 框架与思维树(Tree of Thoughts),二者均为全球 AI Agent 领域的奠基性工作。 2024 年博士毕业后,他加入 OpenAI,深度参与Operator、Deep Research两大核心智能体项目研发。 但履历并非关键,更重要的是他入职后带来的架构级变革。 2025 年 12 月,腾讯发布内部组织架构调整公告,正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家,同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人,实行双线汇报,直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。 27 岁直通腾讯二号人物、执掌两大 AI 核心部门,这样的晋升与权限,在腾讯发展史上都极其罕见。 有媒体报道,入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因,经常和港彩同事、实习生交流到半夜。诊断结果上报刘炽平,直接推动了后续一连串的组织手术。 他接手的不是一个模型优化任务,而是一整套需要被推翻的工作方式。 2025 年 12 月,腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门,基建先行、推倒重打底层技术地基。与此同时,公司全面加速全球顶尖 AI 人才引进,补齐技术短板。 今年3 月 20 日,成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部,归入混元大模型研发主线,统一向姚顺雨汇报。 自此,腾讯不再保留独立于大模型体系之外的专属 AI 研究机构,所有 AI 研究力量全部收拢,聚焦混元单一主线。 这是一次全链路的重建,从底层Infra到数据管线到训练流程到组织架构,不是修补旧系统,是拆了重来,从

百度副总裁石清华:企业要开始进行自己的算力规划,现在是“卡吃人、卡吃业务”

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!来源:版面之外 腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。 MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度,1月底开训,不到三个月发布。 这样一个体量的模型放在今天,很容易被淹没。 但如果把这件事放在三个月前的背景下看,就有意思了。 这次发布看起来是模型升级,真正变化发生在模型之外,腾讯开始用AI反过来重写自己的组织方式。 今年1月26日,腾讯年会现场,腾讯总裁刘炽平在台上做了一件高管很少做的事,公开复盘混元大模型为什么不行。 他用了一个比喻:高中生背题应考。成绩单好看,但真正上了考场就露馅。盘点之后发现,每个关键模块都有缺失。 马化腾的措辞更直接:太慢了。慢了9个月到1年。 从那场年会到今天 Hy3 preview上线,88天。 背题拿不了真分 腾讯混元的故事要从2023年9月说起,腾讯在全球数字生态大会上正式发布混元大模型,大厂入场,声势不小。 然后就开始进入一种自证的逻辑。 不是缺投入,不是缺人。问题出在路径上。 刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限,团队选了捷径,用SFT(监督微调)去打榜。效果立竿见影,成绩单漂亮,但一进真实业务场景就暴露,泛化能力差,模型能力无法复用到产品上。 再往下挖,每一层都有裂缝。数据做得不够多,预训练不稳定,AI Infra无法规模化,强化学习缺因子和目标,底座模型撑不起上层应用。 这直接导致了产品端的困局。元宝,腾讯的AI助手应用,今年一季度月活约5700万。听起来在涨,但同期豆包月活3.45亿,千问1.66亿,差距不是在缩小,是在拉大。 差距已经不在规模层面,而是在入口的定义权。 更麻烦的是内部。腾讯体系内的业务线,微信、游戏、广告、企业服务,需要AI能力,但过去的混元接不住。不是业务不想用,是用了效果不达标。一些核心业务甚至不敢接混元,宁可绕开自己找方案。 一个大厂自研的大模型,在自己家里都坐不上主桌,这是混元过去困境最直接的写照。 彼时,腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心,AI团队是配角。先做产品,再让AI适配。用刘炽平的话说,腾讯的AI开发像是产品里没有产品经理,研发团队没人把控方向,很多工作做了等于白做。 而同一时期,字节仅AI芯片采购一项就砸了约900亿元,DeepSeek用极致效率的小团队做出R1震动全球,阿里千问的全球API调用量攀上前列。 混元不是输给了某一个对手,是组织结构本身,让它上不了战场。 先借一条命 2025年春节前后,DeepSeek R1爆火,全球AI行业的注意力被这家杭州公司劫持。 腾讯做了一个极其务实且讨巧的决定。2月13日,元宝全面接入DeepSeek-R1满血版,免费开放。 元宝日活在一个月内暴涨超过20倍,2月22日超越豆包登上苹果中国区免费App下载榜第二,一度还拿下榜单第一。 腾讯在那个窗口期的反应速度,整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima,一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。 全行业都在围观DeepSeek的时候,腾讯是第一个全方位把它接进自家生态的大厂。 港彩但腾讯比谁都清楚,这次机遇是借来的。 DeepSeek帮元宝拉来了用户,但留存是另一回事。搜索链路被割裂,一部分走混元一部分走DeepSeek,体验不统一。 简单来说,拥抱DeepSeek的本质,是在混元自己还没准备好的时候,用外部能力把用户先接住、把场景先撑起来。 但问题在于,腾讯的微信生态、企业服务、游戏AI、广告智能投放,这些核心业务需要深度定制、可控可调的AI能力,一个通用API解决不了。 混元必须自己站起来。问题是怎么站。 拆房子的人 2025 年 9 月,一位 27 岁的年轻人低调入职腾讯。 姚顺雨,清华姚班本科、普林斯顿大学博士,师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间,他提出ReAct 框架与思维树(Tree of Thoughts),二者均为全球 AI Agent 领域的奠基性工作。 2024 年博士毕业后,他加入 OpenAI,深度参与Operator、Deep Research两大核心智能体项目研发。 但履历并非关键,更重要的是他入职后带来的架构级变革。 2025 年 12 月,腾讯发布内部组织架构调整公告,正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家,同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人,实行双线汇报,直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。 27 岁直通腾讯二号人物、执掌两大 AI 核心部门,这样的晋升与权限,在腾讯发展史上都极其罕见。 有媒体报道,入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因,经常和同事、实习生交流到半夜。诊断结果上报刘炽平,直接推动了后续一连串的组织手术。 他接手的不是一个模型优化任务,而是一整套需要被推翻的工作方式。 2025 年 12 月,腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门,基建先行、推倒重打底层技术地基。与此同时,公司全面加速全球顶尖 AI 人才引进,补齐技术短板。 今年3 月 20 日,成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部,归入混元大模型研发主线,统一向姚顺雨汇报。 自此,腾讯不再保留独立于大模型体系之外的专属 AI 研究机构,所有 AI 研究力量全部收拢,聚焦混元单一主线。 这是一次全链路的重建,从底层Infra到数据管线到训练流程到组织架构,不是修补旧系统,是拆了重来,从

围绕本文主题,相关信息仍在持续更新,后续内容将根据公开资料进行整理。

深化本土化布局,丰田以TO YOU理念开启在华发展新阶段

应用,今年一季度月活约5700万。听起来在涨,但同期豆包月活3.45亿,千问1.66亿,差距不是在缩小,是港彩在拉