前沿大语言模型研究科学家

纽约 11天前全职 网络
243.5万 - 486.9万 / 年
前沿模型和实时决策系统 专注于LLM后训练的研究科学家 • 提供搬迁和赞助 | 该职位在多个州发布。佛罗里达州的运营* 机会 Sentiro Partners受一家世界级组织委托,他们正在建立一个罕见的机器学习研究小组,您的工作将在第一天投入生产。 这不是学术性的机器学习。这不是为了研究而研究。这是前沿规模的模型部署到实时、高风险系统中,延迟至关重要,存在对手,反馈以美元而非引用来衡量。 您将在基础研究、大规模训练基础设施和实时优化的交汇处工作;从想法到影响有直接的联系。模型架构、训练动态、推理效率和系统设计同等重要。权衡是真实的。约束是严格的。工作令人振奋。后训练和模型“缓解”技能被高度重视。 您将做什么 • 设计和训练大规模神经模型,用于在噪声、对抗性和非平稳条件下进行序列决策、预测和表示学习 • 推进训练方法:大批量优化、课程策略、在线/持续学习、奖励驱动的微调 • 构建从数据摄取到部署和实时反馈循环的端到端管道 • 与系统工程师合作,最大化吞吐量,最小化延迟,并在规模上保持稳定性 • 部署在实时运行并具有严格性能保证的生产级模型 研究领域 您可以专注于一个领域或跨越多个领域: • 大规模预训练和表示学习 • 强化学习和奖励建模 • 序列建模和时间架构 • 优化、泛化和大规模训练稳定性 • 高效推理、模型压缩和部署 • 数据中心的机器学习,用于高信号、低延迟系统 我们在寻找什么 核心要求: • 深入的动手经验,训练大型神经模型(PyTorch或同等工具) • 4-8年研究生经验 • 机器学习、数据科学、计算机科学博士学位 • 对优化动态、故障模式和大规模调试有强烈直觉 • 习惯于接近底层工作:GPU利用率、内存权衡、分布式训练 • 倾向于构建和拥有系统,而不仅仅是提出想法 • 来自领先的机器学习环境的背景:有FAANG研究团队、前沿AI实验室或同等机构实习或类似经验的证据。 最重要的是什么 出版历史受到尊重但不是必需的,然而真正研究复杂问题的证据是。 影响、严谨和执行比其他一切都重要。 为什么这个角色不同 • 真实世界的反馈循环 | 您的模型会根据实时结果而非静态基准进行持续评估。您将在几小时内,有时几分钟内知道您的想法是否有效。 • 端到端的所有权 | 研究、训练、部署和迭代存在于一个统一的循环中。没有交接。没有组织摩擦。 • 计算和自主权 | 规模和自由度可以追求雄心勃勃的想法,而没有学术负担或官僚主义。 • 精英同行 | 一个小型的高级团队在应用机器学习的前沿运作。这里的每个人都建立了一些重要的东西。 成功的样子 • 在生产中可测量地更好、更快、更稳健的模型 • 清晰扩展且优雅失败的训练管道 • 经受住现实考验并获胜的研究想法 地点 美国东海岸。该职位正在美国各地发布。准备好构建在前沿运行的机器学习系统了吗?让我们谈谈。 关于 | Sentiro Partners 增强时代的领导力 我们在前沿探索,以确保将定义人类和代理工作未来的变革性领导者、专家和特立独行者。 在全球范围内提供高管搜索、人才增强和嵌入式(部分)高管搜索服务。 Sentiro Partners是一家专注于先进技术、数据科学和定量研究交叉点的前沿搜索公司。我们在国际上运营,专注于将卓越的技术人才安置到前沿研究环境中;这些组织正在解决真正具有挑战性的问题,需要智力深度和世界级的工程执行。我们与进入门槛最高的组织合作。 网站:https://sentiropartners.com/frontierailabtalent 需要专家招聘支持? 邮箱:explore@sentiropartners.com