• 根据整体平台治理原则,如版本控制、数据/模型渊源、代码最佳实践,对ML模型进行合规审查,并向数据科学家提供反馈以改进
• 开发管道,实现ML模型的持续运行、反馈和监控,借鉴MLOps领域的CI/CD垂直最佳实践。这可能包括监控数据漂移,触发模型重新训练和设置回滚。
• 优化AI开发环境(开发、测试、生产),以提高可用性、可靠性和性能。
• 与基础架构和应用程序开发团队建立紧密联系,以了解将ML模型集成到企业应用程序的最佳方法(例如,将生成的模型转换为API)。
• 与数据工程师合作,确保数据存储(数据仓库或数据湖)和数据管道正常工作,以及ML特征或数据存储正常工作。
• 评估开源和AI/ML平台和工具的可行性,从基础架构角度进行集成。这还涉及了解数据科学团队使用的ML平台的最新开发、补丁和升级。
要求
• 开发和部署有效的机器学习模型,分析数据并优化算法。
• 清理和准备数据集,训练模型,并确保性能符合定义的标准。
• 交付的成果包括准确可扩展的模型、清晰的文档,并有效传达从数据中得出的见解。
• 持续改进和优化模型。