职位描述:
• 设计和实施云解决方案,在云端建立MLOps(使用AWS、Azure或GCP)
• 使用GitLab CI、GitHub Actions、Circle CI、Airflow或类似工具构建CI/CD流水线编排
• 数据科学模型审查,运行代码重构和优化,容器化,部署,版本控制和质量监控
• 数据科学模型测试,验证和测试自动化
• 与数据科学家、数据工程师和架构师团队沟通,记录流程
• 基础设施设置:设计和部署适用于机器学习工作负载的AWS基础设施组件,如EC2实例、S3存储桶、VPC和网络配置。
• 自动化模型部署:使用AWS服务(如SageMaker、AWS Lambda和AWS Batch)开发模型训练、评估和部署的自动化流程。
• 使用AWS Personalization进行推荐和内容优化。创建和管理批量推断作业,根据来自Amazon S3的输入数据为用户提供批量项目推荐。
• 监控和优化:实施监控解决方案,跟踪模型性能、资源利用率和整体系统健康状况。使用AWS CloudWatch、AWS X-Ray或自定义监控工具。
• 安全和合规性:根据AWS最佳实践和行业标准,通过实施加密、访问控制和合规措施,确保数据和模型的安全性。