工作描述
我们正在寻找熟练的人才加入生产工程团队。该团队负责全球支付执行、消息与编排以及制裁与调查服务的技术运营。基于现场可靠性工程学科,该团队在从供应商产品到内部开发的微服务等多种技术领域中进行使命关键的工作。随着我们客户实时需求的不断增加,我们的关键业务驱动因素是我们平台的可用性和服务的稳定性。
• 为实现共同目标做出有益的贡献,有时支持,有时领导活动
• 实施和协调目标运营模型(自动化、减少无用工作、减少事故、增加服务稳定性、采用现代技术、使用AppDynamics进行监控和警报)
• 在事故期间担任指挥官角色,负责从事故恢复到恢复的所有责任
• 在事故期间担任联络官角色,负责提供报告并提供管理升级电话的技术更新
• 通过新技术审查、设计和重新设计流程以提高性能
• 设计和推动服务提供、能力提升和流程改进的实施
• 实施本地开发的解决方案
• 提供全面的日常生产支持服务,包括解决实时事故以及事后问题管理活动
• 在找到主要系统问题的根本原因方面提供技术专业知识
• 在生产中维护分布式容器化平台
• 安装供应商提供的新软件版本
• 实施本地开发的解决方案
• 支持与新实施相关的各种测试活动
• 与世界各地的各方利益相关者密切合作
• 通过新技术审查、设计和重新设计流程以提高性能
• 设计和推动服务提供、能力提升和流程改进的实施
• 评估、开发和应用适当的工具来分析架构
• 参与数据验证、开发、实施、测试活动
• 对关键问题领域进行数据分析,以协助根本原因分析和数据对账,以识别数据异常
• 为实现共同目标做出有益的贡献,有时支持,有时领导活动
要求
• 信息技术、计算机科学、商业或相关领域的学士学位
• 在生产或相关领域至少5年的经验,最好是在金融服务行业
• 可以在美国时区的周末和轮班工作(8点到20点之间的轮班)
• 在危机中组织和管理的能力
• 快速学习和理解复杂环境的能力
• 熟悉全球支付系统、流程和技术
基本技能
• 管理各种利益相关者的经验,并展示管理上升能力
• CICD:具有实施持续集成、交付和部署的技术、原则和实践的实际经验(Jenkins、Bamboo、Circle CI或等效工具)
• 平台和系统架构的实际经验-模块化单体、SOA/微服务,包括启用的工具和技术(Spring Cloud、Docker、OpenShift、Kubernetes、CloudFoundry等);如何从零开始构建云原生应用程序,并通过引入API、微服务和网关来解决庞大的单体系统
• 云原生技术:Kubernetes、Docker、Kafka、Istio Service Mesh
• 为应用程序故障排除和性能优化进行JVM调优和诊断
• 传统技术:Bash/Shell、Groovy或Java、Unix/Linux、Jenkins、GitHub
• 分布式系统设计,如微服务、Springboot
• 理解消息传递技术和缓存
• 对应用程序景观中的技术层(存储、操作系统、网络、数据库、应用程序)有深入的理解
• 在全球组织中具有可证明的出色口头和书面沟通能力
• 在压力下进行故障排除的能力,能够在运行时平衡竞争需求时做出强有力的优先判断
• 对现代工程学科和技术有技术好奇心
• 理解客户需求并提供优质客户服务
• 在敏捷/DevOps环境中的经验,并协助生产支持工作