姚班、伯克利、OpenAI、清华……年仅30出头的吴翼身上已聚集诸多亮眼标签。
无论哪个阶段或领域,他总能交出令人瞩目的答卷:他是ACM奖牌得主,也是带队冲击IOI竞赛的教练;
亲历Facebook 2012年的崛起、字节跳动2016-2018年的爆发式增长,以及OpenAI爆火前的关键时期;
同时参与创业并主导开源项目开发。
其创立的边塞科技于2024年被蚂蚁集团收购,团队历时四年积累的规模化强化学习成果全部注入开源项目AReaL——这是一个专为大型推理模型设计的完全异步强化学习训练框架,目前在GitHub已获2.4k星标。
谈及定位,吴翼直言:”按照这个定位我们没有竞品”。
关于选择加入OpenAI的经历,吴翼回忆道:”当时本打算去Google Brain(因其学术声誉更高),但因签证限制需提前回国任教,Google因headcount限制难以协调,而OpenAI作为非营利机构没有编制限制,面试后一周就收到入职通知”。
对于大模型在编程竞赛中的表现差异,他认为:”ICPC等赛事本质是体育竞技而非单纯能力测试,涉及心理和技术博弈,AI当前挂零源于尚未成熟”。
针对RL在IMO夺金中的作用,吴翼肯定了RL的关键性:”Gemini和OpenAI明确表示这是RL训练成果”。
谈到创业方向选择时透露:”我的研究始终聚焦强化学习,AReaL是核心载体”。
他指出OpenAI当年解散多智能体团队等组织变革具有探索性特征,”团队目标和人员流动非常灵活”。
对于中美创业差异及回国契机,吴翼表示早有规划:”2018年已确定2020年回国任教”。
他提及中国互联网发展奇迹:”亲历了Facebook 2012年腾飞、字节跳动爆发期及OpenAI关键阶段”。
在开源框架演进方面,AReaL从分布式RLHF到当前版本实现了架构重构,”重新围绕算法研究与用户迭代需求设计”。
对于多智能体系统的挑战与机遇,他认为这是必然方向,”复杂系统将催生更多算法与基础设施机会”。
最后谈及未来规划时强调:”当前唯一目标是做好AReaL开源项目”,并预告即将发布的ASearcher项目,”希望为搜索Agent提供新思路”。
评论列表 (0条):
加载更多评论 Loading...