研究科学家(L4) - 机器学习与推理研究,LLM 后训练

纽约 2个月前全职 网络
121.0万 - 512.3万 / 年
Netflix 是全球领先的娱乐服务之一,拥有超过 3 亿的付费会员,遍布 190 多个国家,享受各种类型和语言的电视剧、电影和游戏。会员可以随时随地播放、暂停和继续观看他们想要的内容,并可以随时更改他们的计划。 随着 Netflix 的发展,我们不断推进个性化和发现、实验和决策、理解我们的会员和标题以及后端基础设施的创新。这些发展不断为研究创造新的机会,以推动有意义的影响。通过探索 AI/ML 的前沿以及交叉领域,机器学习与推理研究团队将这些机会转化为我们会员和业务的实际利益。 机器学习与推理研究团队是一个专注的研究团队,通过解决与我们最重要挑战相关的基础研究问题,来提升 Netflix 的技术能力,并与各个业务团队紧密合作,将研究转化为大规模的影响。作为团队的一员,您将利用您的技术专长来制定路线图、跨职能合作,并将新想法从探索转化为影响。您还将通过在顶级场所发表论文、在会议上演讲、指导实习生和促进学术合作,积极参与更广泛的研究社区。 我们正在寻找一位早期职业研究人员,能够发展出一个强大的研究议程,并在内部和外部获得可见性,能够有效传播知识并激励他人,与同事合作以实现切实的影响,并帮助营造一个开放的创新、智力严谨和好奇心的环境。 您所带来的 • 计算机科学或相关领域的博士学位,专注于下游任务的后训练 LLM,特别是使用 RL(例如,RLVR、RLHF、离线或在线、基于策略或价值),可能还包括推理、对齐、蒸馏/压缩、工具使用、记忆、校准或相关领域。 • 顶级出版物的记录,展示在该专业领域的深厚专业知识。 • 对合作的热情,建立强大关系以解决重大跨职能问题。 • 强大的技术沟通能力,能够适应不同的受众。 • 自我激励,能够在最小的监督和流程下茁壮成长和领导。 • 在识别和框架模糊的研究和商业问题方面具备好奇心和判断力,并能够将两者联系起来。 • 渴望通过分享知识和指导新方法的采用来提升更广泛的组织。 我们的薪酬结构仅由年薪组成;我们没有奖金。您可以选择每年将多少薪酬作为工资与股票期权之间的比例。为了确定您个人的市场最高薪酬,我们依赖市场指标,并考虑您的具体职位类别、背景、技能和经验,以确定您在市场范围内的薪酬。该职位的薪酬范围为 170,000 美元 - 720,000 美元。 Netflix 提供全面的福利,包括健康计划、心理健康支持、401(k) 退休计划(雇主匹配)、股票期权计划、残疾计划、健康储蓄和灵活支出账户、家庭形成福利,以及生命和重伤福利。我们还提供带薪休假计划。全职小时工每年累计 35 天的带薪假期,用于休假、假日和病假。全职薪资员工立即享有灵活的休假权利。有关我们福利的更多详细信息,请查看此处。 Netflix 拥有独特的文化和环境。了解更多信息请点击这里。 包容性是 Netflix 的价值观,我们努力为所有候选人提供有意义的面试体验。如果您在招聘过程中需要因残疾或其他原因进行住宿/调整,请向您的招聘伙伴发送请求。 我们是一个平等机会的雇主,庆祝多样性,认识到多样性构建更强大的团队。我们认真而周到地对待多样性和包容性。我们不以种族、宗教、肤色、祖先、国籍、种姓、性别、性取向、性别、性别认同或表达、年龄、残疾、医疗状况、怀孕、基因构成、婚姻状况或军队服役为基础进行歧视。