持续时间:12个月以上
寻找一名ML Ops工程师来推动机器学习解决方案的全生命周期。
主要职责
- 使用MLflow、Kubeflow或Vertex AI等工具开发和维护ML管道。
- 在云环境(如GCP、AWS、Azure)中自动化模型训练、测试、部署和监控。
- 为模型生命周期管理实施CI/CD工作流程,包括版本控制、监控和再训练。
- 使用可观测性工具监控模型性能,并确保符合模型治理框架(MRM、文档、可解释性)。
- 与工程团队合作,提供容器化环境,并通过低延迟API支持模型评分。
- 利用AutoML工具(如Vertex AI AutoML、H2O Driverless AI)进行低代码/无代码模型开发、文档自动化和快速部署。
资格要求
- 10年以上软件工程专业经验及3年以上AIML、机器学习模型操作经验。
- 精通Java和Python、SQL以及ML库(如scikit-learn、XGBoost、TensorFlow、PyTorch)。
- 具有云平台和容器化(Docker、Kubernetes)经验。
- 熟悉数据工程工具(如Airflow、Spark)和ML Ops框架。
- 深刻理解软件工程原则和DevOps实践。
- 能够向非技术利益相关者传达复杂的技术概念。