• 实施数据转换、聚合和丰富过程,支持各种数据分析和机器学习项目
• 与跨职能团队合作,了解数据需求,并将其转化为有效的数据工程解决方案
• 确保数据质量和完整性在数据处理生命周期中得到保证
• 使用容器化和编排技术,在OpenShift容器平台(OCP)上设计和部署数据工程解决方案
• 优化容器化部署和资源利用的数据工程工作流程
• 与DevOps团队合作,简化部署流程,实施CI/CD流水线,并确保平台稳定性
• 实施数据治理实践、数据血统和元数据管理,以确保数据准确性、可追溯性和合规性
• 监控和优化数据流水线性能,解决问题,并实施必要的增强措施
• 实施监控和日志记录机制,确保数据基础设施的健康、可用性和性能
• 记录数据工程过程、工作流程和基础设施配置,以进行知识共享和参考
• 了解新兴技术、行业趋势和数据工程和DevOps的最佳实践
• 为初级团队成员提供技术领导、指导和指导,培养持续学习和创新的文化,不断改进银行的分析能力
要求
• 5年以上数据工程师(Spark、Scala和DevOps)经验
• 使用容器化和编排技术,在OpenShift容器平台(OCP)上设计和部署数据工程解决方案
• 记录数据工程过程、工作流程和基础设施配置,以进行知识共享和参考
• 为初级团队成员提供技术领导、指导和指导,培养持续学习和创新的文化,不断改进银行的分析能力