机器学习系统工程师（微调） - Anthropic招聘

关于角色我们的微调研究人员使用RLHF和其他相关方法训练我们的生产Claude模型和内部研究模型。您的工作将是构建、维护和改进这些研究人员用于训练模型的算法和系统。您将负责改进这些系统的速度、可靠性和易用性。关于Anthropic Anthropic的使命是创建可靠、可解释和可操控的人工智能系统。我们希望人工智能对我们的用户和整个社会都是安全和有益的。我们的团队是一个快速增长的、由致力于构建有益人工智能系统的研究人员、工程师、政策专家和商业领导者组成的团队。如果您满足以下条件，您可能是一个合适的人选： • 有丰富的软件工程经验 • 结果导向，偏向灵活性和影响力 • 即使超出工作描述的范围，也能承担额外的工作 • 喜欢结对编程（我们喜欢结对！） • 想要了解更多关于机器学习研究的知识 • 喜欢开发能提高他人工作效率的系统和工具 • 关心您工作的社会影响优秀候选人还可能具有以下经验： • 高性能、大规模分布式系统 • Kubernetes • Python • 机器学习 • 实施RLHF等LLM微调算法代表性项目： • 对我们的强化学习流程进行分析，寻找改进的机会 • 构建一个系统，在测试环境中定期启动训练作业，以便我们可以快速检测训练流程中的问题 • 对我们的微调系统进行更改，使其适用于新的模型架构 • 构建仪器来检测和消除我们训练代码中的Python GIL争用 • 诊断为什么训练运行在某个步骤之后开始变慢，并修复它 • 实现研究人员提出的一种新的训练算法的稳定、快速版本年薪（美元）该职位的预期薪资范围为32万美元至40.5万美元。物流基于地点的混合政策：目前，我们希望所有员工至少25%的时间在办公室工作。申请截止日期：无。申请将根据滚动方式进行审查。美国签证赞助：我们提供签证赞助！然而，我们不能为每个职位和每个候选人成功地提供签证支持；运营职位尤其难以支持。但如果我们给您发出录用通知，我们将尽一切努力让您进入美国，并保留一位移民律师来帮助解决此问题。我们鼓励您申请，即使您认为自己并不满足每一个资格要求。研究表明，认为自己属于少数群体的人更容易感到冒名顶替，并对自己的竞争力产生怀疑，因此我们敦促您不要过早地排除自己，并在您对这项工作感兴趣时提交申请。我们认为像我们正在构建的人工智能系统具有巨大的社会和伦理影响。我们认为这使得代表性更加重要，并努力在我们的团队中包容各种不同的观点。薪酬和福利* Anthropic的薪酬套餐包括三个元素：薪水、股权和福利。我们致力于公平薪酬，并希望这三个元素的综合竞争力与市场水平相当。股权 - 在这个职位的薪水之上（如上所述），股权将是总薪酬的一个重要组成部分。我们的目标是为我们这样规模的公司提供高于平均水平的股权报酬，并在发放录用通知时告知股权金额。美国福利 - 以下福利适用于我们在美国的员工： • 可选的股权捐赠匹配，比例为3:1，最高可达您的股权授予额的50%。 • 为您和您的所有家属提供全面的健康、牙科和视觉保险。 • 401(k)计划，匹配4%。 • 21周带薪产假。 • 无限制的带薪休假 - 大多数员工每年休假4-6周，有时更多！ • 教育、家庭办公室改进、通勤和健康的津贴。 • 通过Carrot提供生育福利。 • 办公室每日提供午餐和零食。 • 对于搬迁到湾区的人提供搬迁支持。英国福利 - 以下福利适用于我们在英国的员工： • 可选的股权捐赠匹配，比例为3:1，最高可达您的股权授予额的50%。 • 为您和您的家属提供私人健康、牙科和视觉保险。 • 养老金缴纳（匹配您工资的4%）。 • 21周带薪产假。 • 无限制的带薪休假 - 大多数员工每年休假4-6周，有时更多！ • 健康现金计划。 • 人寿保险和收入保障。 • 办公室每日提供午餐和零食。 • 此薪酬和福利信息基于Anthropic对该职位的良好信誉估计，截至发布日期，可能会在将来进行修改。在英国或美国以外的地方工作的员工将获得不同的福利待遇。薪酬范围内的水平将取决于各种与工作相关的因素，包括您在我们内部绩效阶梯上的位置，该位置基于过去的工作经验、相关教育和在我们的面试或工作试验中的表现。我们的不同之处我们相信，具有最高影响力的人工智能研究将是大规模科学。在Anthropic，我们作为一个统一的团队，致力于几个大规模的研究项目。我们重视影响力——推进我们对可操控、可信赖的人工智能的长期目标——而不是解决较小、更具体的难题。我们将人工智能研究视为一门实证科学，与传统的计算机科学努力一样，与物理学和生物学有很多共同之处。我们是一个极其合作的团队，我们经常举行研究讨论，以确保我们在任何特定时间追求最高影响力的工作。因此，我们非常重视沟通能力。我们没有工程和研究之间的界限，我们期望我们所有的技术人员根据需要为两者做出贡献。了解我们研究方向最简单的方法是阅读我们最近的研究。这项研究延续了我们团队在Anthropic之前从事的许多方向，包括：GPT-3、基于电路的可解释性、多模态神经元、缩放定律、人工智能与计算、人工智能安全中的具体问题以及从人类偏好中学习。加入我们吧！ Anthropic是一家位于旧金山的公益公司。我们提供具有竞争力的薪酬和福利，可选的股权捐赠匹配，慷慨的休假和产假，灵活的工作时间，以及一个美好的办公空间，与同事们进行合作。