前沿模型和实时决策系统专注于LLM后训练的研究科学家 • 提供搬迁和赞助 | 该职位在多个州发布。佛罗里达州的运营* 机会 Sentiro Partners受一家世界级组织委托，他们正在建立一个罕见的机器学习研究小组，您的工作将在第一天投入生产。这不是学术性的机器学习。这不是为了研究而研究。这是前沿规模的模型部署到实时、高风险系统中，延迟至关重要，存在对手，反馈以美元而非引用来衡量。您将在基础研究、大规模训练基础设施和实时优化的交汇处工作；从想法到影响有直接的联系。模型架构、训练动态、推理效率和系统设计同等重要。权衡是真实的。约束是严格的。工作令人振奋。后训练和模型“缓解”技能被高度重视。您将做什么 • 设计和训练大规模神经模型，用于在噪声、对抗性和非平稳条件下进行序列决策、预测和表示学习 • 推进训练方法：大批量优化、课程策略、在线/持续学习、奖励驱动的微调 • 构建从数据摄取到部署和实时反馈循环的端到端管道 • 与系统工程师合作，最大化吞吐量，最小化延迟，并在规模上保持稳定性 • 部署在实时运行并具有严格性能保证的生产级模型研究领域您可以专注于一个领域或跨越多个领域： • 大规模预训练和表示学习 • 强化学习和奖励建模 • 序列建模和时间架构 • 优化、泛化和大规模训练稳定性 • 高效推理、模型压缩和部署 • 数据中心的机器学习，用于高信号、低延迟系统我们在寻找什么核心要求： • 深入的动手经验，训练大型神经模型（PyTorch或同等工具） • 4-8年研究生经验 • 机器学习、数据科学、计算机科学博士学位 • 对优化动态、故障模式和大规模调试有强烈直觉 • 习惯于接近底层工作：GPU利用率、内存权衡、分布式训练 • 倾向于构建和拥有系统，而不仅仅是提出想法 • 来自领先的机器学习环境的背景：有FAANG研究团队、前沿AI实验室或同等机构实习或类似经验的证据。最重要的是什么出版历史受到尊重但不是必需的，然而真正研究复杂问题的证据是。影响、严谨和执行比其他一切都重要。为什么这个角色不同 • 真实世界的反馈循环 | 您的模型会根据实时结果而非静态基准进行持续评估。您将在几小时内，有时几分钟内知道您的想法是否有效。 • 端到端的所有权 | 研究、训练、部署和迭代存在于一个统一的循环中。没有交接。没有组织摩擦。 • 计算和自主权 | 规模和自由度可以追求雄心勃勃的想法，而没有学术负担或官僚主义。 • 精英同行 | 一个小型的高级团队在应用机器学习的前沿运作。这里的每个人都建立了一些重要的东西。成功的样子 • 在生产中可测量地更好、更快、更稳健的模型 • 清晰扩展且优雅失败的训练管道 • 经受住现实考验并获胜的研究想法地点美国东海岸。该职位正在美国各地发布。准备好构建在前沿运行的机器学习系统了吗？让我们谈谈。关于 | Sentiro Partners 增强时代的领导力我们在前沿探索，以确保将定义人类和代理工作未来的变革性领导者、专家和特立独行者。在全球范围内提供高管搜索、人才增强和嵌入式（部分）高管搜索服务。 Sentiro Partners是一家专注于先进技术、数据科学和定量研究交叉点的前沿搜索公司。我们在国际上运营，专注于将卓越的技术人才安置到前沿研究环境中；这些组织正在解决真正具有挑战性的问题，需要智力深度和世界级的工程执行。我们与进入门槛最高的组织合作。网站：https://sentiropartners.com/frontierailabtalent 需要专家招聘支持？邮箱：explore@sentiropartners.com

前沿大语言模型研究科学家

Sentiro Partners