币安是全球领先的区块链生态系统，拥有全球交易量和注册用户数最大的加密货币交易所。我们在100多个国家拥有超过2.8亿用户，因其行业领先的安全性、用户资金透明度、交易引擎速度、深度流动性以及无与伦比的数字资产产品组合而受到信赖。币安的产品范围从交易和金融到教育、研究、支付、机构服务、Web3功能等。我们利用数字资产和区块链的力量构建包容性的金融生态系统，以促进货币自由并改善全球人们的金融获取。关于该职位我们正在寻找一位高技能的研究科学家/工程师，以提升大型基础模型的推理和规划能力。在这个角色中，您将通过数据获取、监督微调（SFT）、奖励建模和强化学习等整个开发生命周期来提升模型性能，同时推动推理和决策方面的创新。您将通过重写、增强和生成技术合成大规模、高质量的数据集，以在预训练、SFT和RL阶段加强基础模型。该角色的一个关键部分是使用系统2思维解决复杂任务，并应用高级解码策略，如MCTS和A*。您将设计和实施稳健的评估方法，教导模型与外部工具、API和代码解释器进行交互，并构建能够解决复杂现实问题的代理和多代理系统。职责 • 基础模型的推理和规划：在整个开发过程中，包括数据获取、模型评估、SFT、奖励建模和强化学习，提升推理和规划能力，以改善整体性能。 • 使用重写、增强和生成等方法合成大规模、高质量的数据，以在不同阶段（预训练、SFT、RL）提高基础模型的能力。 • 使用系统2思维解决复杂任务，并利用高级解码策略，如MCTS、A*。 • 调查和实施稳健的评估方法，以评估模型在各个阶段的性能。 • 教导基础模型使用工具、与API交互和代码解释器。构建代理和多代理系统以解决复杂任务。要求 • 在RL、LLM研究经验方面的熟练程度，熟悉大规模模型训练者优先。 • 熟练掌握数据结构和基本算法技能，精通Python或C++/Java。 • 在RL、NLP或深度学习方面有影响力的项目或论文经验者优先。 • 优秀的问题分析和解决能力，能够深入解决大规模模型训练和应用中的挑战。 • 良好的沟通和协作能力，能够与团队一起探索新技术并推动技术进步。为什么选择币安 • 与全球领先的区块链生态系统一起塑造未来 • 在以用户为中心的全球组织中与世界级人才合作，结构扁平 • 在创新环境中以自主权处理独特、快节奏的项目 • 在以结果为导向的工作场所中茁壮成长，拥有职业发展和持续学习的机会 • 具有竞争力的薪资和公司福利 • 居家办公安排（具体安排可能因业务团队的工作性质而异）币安致力于成为一个平等机会的雇主。我们相信，多元化的员工队伍是我们成功的基础。通过提交求职申请，您确认您已阅读并同意我们的候选人隐私声明。我们可能会使用人工智能（AI）工具来支持招聘过程的部分环节，例如审阅申请、分析简历或评估响应。这些工具协助我们的招聘团队，但不会取代人类判断。最终的招聘决定仍由人类做出。如果您想了解有关您的数据处理的更多信息，请联系我们。

研究科学家 - 大型语言模型基础模型

Binance