DeepSeek核心研究员郭达雅加盟字节跳动，曾主导Code Intelligence与纯强化学习突破

推荐 2026-04-15 18:50

字号

SmartHey4月15日消息，据Z Finance报道，刚刚，DeepSeek的核心研究员、R1与V3系列模型的主要作者之一郭达雅或已正式入职字节跳动。

公开资料显示，郭达雅本科与博士均就读于中山大学，师从人工智能学院印鉴教授，并由前微软亚洲研究院（MSRA）副院长周明博士联合培养。这位曾在腾讯广告算法大赛蝉联冠军、被业界称为“尚未毕业已斩获百万奖金”的青年AI科学家，在DeepSeek期间攻克了两大关键技术方向：

代码智能（Code Intelligence）：他主导推进DeepSeek-Coder系列模型的迭代升级，通过高精度数据清洗与结构化训练范式，显著提升模型在代码生成、补全及跨语言理解方面的性能，达到国际领先水平。

纯强化学习（RL）的前沿探索：作为R1推理模型的核心设计者之一，他深度参与构建了不依赖大规模监督微调（SFT）的端到端强化学习框架，推动模型通过自我博弈与反馈实现“自主反思”与“思维链（CoT）”能力的涌现。该技术路径被视为中国大模型在2025年实现逻辑推理能力反超硅谷的关键突破之一。

猜你喜欢