机器学习基础设施工程师

14个月前全职
Intelletec

Intelletec

location 旧金山
unsaved
ML系统工程师 - 领导角色 加入我们的团队,担任领导地位的ML系统工程师,推动视频基础(VFM)和语言模型(VLM)的先进机器学习系统的开发。在这个角色中,您将领导一支才华横溢的团队,制定技术战略,并确保我们的系统在速度、效率和可靠性方面超出用户的期望。 职责: • 领导VFM和VLM生产的机器学习系统开发 • 优化推理基础设施的可扩展性和可靠性 • 监督模型优化和自动化的ML部署和运维(VFMOps / VLMOps) • 管理高质量视频数据的数据基础设施和准备工作 • 设计有效的团队流程以提高运营效率 • 辅导和发展团队成员的职业发展 • 在快速增长阶段推动招聘工作 要求: • 10年以上软件开发经验,包括ML工程 • 5年以上构建端到端ML系统的经验,包括MLOps和数据管理 • 2年以上管理高产出工程团队的经验 • 熟悉视频处理和数据管道 • 有安全软件开发环境的经验 期望经验: • 计算机科学、数学或等同经验的硕士或博士学位 • 在快节奏环境中的初创工程经验 • 熟悉大规模模型和云端/本地环境 • 有机器学习研究经验者优先考虑 • 理解大规模计算系统和云扩展方法 技术栈: • 编程语言:Python、Golang、C++、CUDA • ML/平台:PyTorch、Docker、Kubernetes、Terraform • ML运维:MLFlow、Weights and Biases • 数据:Pachyderm、DVC • 自动化:Airflow、Kubeflow • 模型服务:Triton、FasterTransformer