高级员工工程师(机器学习)- 45391

渥太华 1天前合同 网络
面议
关于Turing: Turing总部位于加利福尼亚州旧金山,是全球领先的前沿AI实验室研究加速器,也是全球企业部署先进AI系统的可靠合作伙伴。Turing通过两种方式支持客户:首先,通过高质量的数据、先进的训练管道以及专注于编码、推理、STEM、多语言、多模态和代理的顶级AI研究人员加速前沿研究;其次,通过应用这些专业知识帮助企业将AI从概念验证转变为专有智能,提供可靠的系统,带来可衡量的影响,并在损益表上推动持久的结果。 职位概述: Turing正在寻找一位实干型机器学习高级工程师,领导跨职能团队构建和部署尖端的LLM和ML系统。在这个角色中,您将推动AI开发的整个生命周期——从研究和大规模模型训练到生产部署,同时指导顶级工程师并与研究和基础设施领导者密切合作。 您将结合深度学习和MLOps的技术深度与执行和战略的领导力,确保Turing的AI计划交付可靠的高性能系统,将研究突破转化为可衡量的业务影响。 这个职位非常适合那些仍然乐于编写代码、优化大规模训练管道、构建能够打破模型的协作笔记本,并在研究、工程和产品交付的交汇处导航的领导者。 角色与职责: - 领导和指导跨职能的ML工程师、数据科学家和MLOps专业团队。 - 监督LLM和ML项目的整个生命周期——从数据收集到训练、评估和部署。 - 与研究、产品和基础设施团队合作,定义目标、里程碑和成功指标。 - 提供大规模模型训练、微调和分布式系统设计的技术指导。 - 实施MLOps、模型治理、实验跟踪和CI/CD的最佳实践。 - 管理计算资源、预算,并确保符合数据安全和负责任的AI标准。 - 有效地向利益相关者和高管传达进展、风险和结果。 - 必须与PST时区重叠6小时。 所需技能和资格: - 在机器学习、NLP和现代深度学习架构(Transformers、LLMs)方面有扎实的背景。 - 拥有使用PyTorch、TensorFlow、Hugging Face或DeepSpeed等框架的实际经验。 - 拥有使用Docker进行生产部署的实际经验。 - 拥有管理团队在生产环境中交付ML/LLM模型的经验。 - 了解分布式训练、GPU/TPU优化和云平台(AWS、GCP、Azure)。 - 熟悉MLflow、Kubeflow或Vertex AI等MLOps工具,用于可扩展的ML管道。 - 优秀的领导能力、沟通能力和跨职能协作能力。 - 计算机科学、工程或相关领域的学士或硕士学位(优先考虑博士)。 加分项: - 有构建代理应用程序的经验。 - 有训练或微调基础模型的经验。 - 对开源ML或LLM框架的贡献。 - 理解负责任的AI、偏见缓解和模型可解释性。 与Turing合作的自由职业者福利: - 在完全远程的环境中工作。 - 有机会与领先的LLM公司合作参与尖端AI项目。 报价详情: - 所需承诺:每天至少4小时,每周至少20小时,与PST重叠4小时。 - 雇佣类型:合同工(无医疗/带薪休假)。 - 合同期限:2个月;[预计开始日期为下周]。 - 时区:美国PST(需要重叠6小时,12pm PST至6pm PST)。 评估过程(约120分钟): - 两轮面试(60分钟技术+60分钟技术和文化讨论)。 申请后,您将收到一封包含登录链接的电子邮件。请使用该链接访问门户并完成您的个人资料。 认识优秀人才?请在turing.com/referrals推荐他们,并从您的网络中赚取收入。 如果您对软件工程师职位感兴趣,请在此申请。