DeepSeek核心研究员郭达雅加盟字节跳动,曾主导Code Intelligence与纯强化学习突破

SmartHey4月15日消息,据Z Finance报道,刚刚,DeepSeek的核心研究员、R1与V3系列模型的主要作者之一郭达雅或已正式入职字节跳动。

公开资料显示,郭达雅本科与博士均就读于中山大学,师从人工智能学院印鉴教授,并由前微软亚洲研究院(MSRA)副院长周明博士联合培养。这位曾在腾讯广告算法大赛蝉联冠军、被业界称为“尚未毕业已斩获百万奖金”的青年AI科学家,在DeepSeek期间攻克了两大关键技术方向:

代码智能(Code Intelligence):他主导推进DeepSeek-Coder系列模型的迭代升级,通过高精度数据清洗与结构化训练范式,显著提升模型在代码生成、补全及跨语言理解方面的性能,达到国际领先水平。

纯强化学习(RL)的前沿探索:作为R1推理模型的核心设计者之一,他深度参与构建了不依赖大规模监督微调(SFT)的端到端强化学习框架,推动模型通过自我博弈与反馈实现“自主反思”与“思维链(CoT)”能力的涌现。该技术路径被视为中国大模型在2025年实现逻辑推理能力反超硅谷的关键突破之一。