• 根据整体平台治理原则(如版本控制、数据/模型衍生、代码最佳实践等),对ML模型进行合规审查,并向数据科学家提供反馈以改进。
• 利用MLOps领域CI/CD垂直的最佳实践,为ML模型开发连续运营、反馈和监控的流水线。这可能包括监测数据漂移、触发模型重新训练和设置回滚。
• 优化AI开发环境(开发、测试、生产)的可用性、可靠性和性能。
• 与基础架构和应用开发团队建立紧密联系,以了解将ML模型集成到企业应用程序的最佳方法(例如将生成的模型转换为API)。
• 与数据工程师合作,确保数据存储(数据仓库或数据湖)和数据管道正常工作,并为ML功能或数据存储提供所需的数据。
• 评估开源和AI/ML平台和工具的可行性,从基础架构的角度进行集成。这还包括及时了解数据科学团队所使用的ML平台的最新发展、补丁和升级。
• 开发和部署有效的机器学习模型,分析数据,优化算法。
• 清理和准备数据集,训练模型,并确保性能符合定义的标准。
• 交付成果包括准确可扩展的模型、清晰的文档以及从数据中得出的有效沟通的见解。
• 持续改进和优化模型。