币安是全球领先的区块链生态系统,拥有全球交易量和注册用户数最大的加密货币交易所。我们在100多个国家拥有超过2.8亿用户,因其行业领先的安全性、用户资金透明度、交易引擎速度、深度流动性以及无与伦比的数字资产产品组合而受到信赖。币安的产品范围从交易和金融到教育、研究、支付、机构服务、Web3功能等。我们利用数字资产和区块链的力量构建包容性的金融生态系统,以促进货币自由并改善全球人们的金融获取。
关于该职位
我们正在寻找一位高技能的研究科学家/工程师,以提升大型基础模型的推理和规划能力。在这个角色中,您将通过数据获取、监督微调(SFT)、奖励建模和强化学习等整个开发生命周期来提升模型性能,同时推动推理和决策方面的创新。您将通过重写、增强和生成技术合成大规模、高质量的数据集,以在预训练、SFT和RL阶段加强基础模型。该角色的一个关键部分是使用系统2思维解决复杂任务,并应用高级解码策略,如MCTS和A*。您将设计和实施稳健的评估方法,教导模型与外部工具、API和代码解释器进行交互,并构建能够解决复杂现实问题的代理和多代理系统。
职责
• 基础模型的推理和规划:在整个开发过程中,包括数据获取、模型评估、SFT、奖励建模和强化学习,提升推理和规划能力,以改善整体性能。
• 使用重写、增强和生成等方法合成大规模、高质量的数据,以在不同阶段(预训练、SFT、RL)提高基础模型的能力。
• 使用系统2思维解决复杂任务,并利用高级解码策略,如MCTS、A*。
• 调查和实施稳健的评估方法,以评估模型在各个阶段的性能。
• 教导基础模型使用工具、与API交互和代码解释器。构建代理和多代理系统以解决复杂任务。
要求
• 在RL、LLM研究经验方面的熟练程度,熟悉大规模模型训练者优先。
• 熟练掌握数据结构和基本算法技能,精通Python或C++/Java。
• 在RL、NLP或深度学习方面有影响力的项目或论文经验者优先。
• 优秀的问题分析和解决能力,能够深入解决大规模模型训练和应用中的挑战。
• 良好的沟通和协作能力,能够与团队一起探索新技术并推动技术进步。
为什么选择币安
• 与全球领先的区块链生态系统一起塑造未来
• 在以用户为中心的全球组织中与世界级人才合作,结构扁平
• 在创新环境中以自主权处理独特、快节奏的项目
• 在以结果为导向的工作场所中茁壮成长,拥有职业发展和持续学习的机会
• 具有竞争力的薪资和公司福利
• 居家办公安排(具体安排可能因业务团队的工作性质而异)
币安致力于成为一个平等机会的雇主。我们相信,多元化的员工队伍是我们成功的基础。
通过提交求职申请,您确认您已阅读并同意我们的候选人隐私声明。
我们可能会使用人工智能(AI)工具来支持招聘过程的部分环节,例如审阅申请、分析简历或评估响应。这些工具协助我们的招聘团队,但不会取代人类判断。最终的招聘决定仍由人类做出。如果您想了解有关您的数据处理的更多信息,请联系我们。