【约15-22.5万英镑综合薪酬,混合工作模式】
我们代表一家在金融科技领域享有盛誉的公司,为他们伦敦办公室寻找一名高级站点可靠性工程师。这个角色对于公司致力于提供强大的数字资产交易平台至关重要,专注于开发、监控和可扩展性,以确保最佳性能。
主要职责:
• 主导工程、DevOps、基础设施和站点可靠性倡议
• 领导持续集成/持续交付转型项目
• 推动零停机部署的自动化
• 与团队合作确保平台组件的高可用性
• 监控和警报关键的可观测性指标
• 影响架构决策以与站点可靠性工程目标一致
• 管理事故并进行彻底的事后分析
• 识别并纠正负载下的系统弱点
主要要求:
• 具备Golang和云原生环境(GCP、AWS、Azure)的经验
• 熟练使用可观测性工具(Prometheus、DataDog、Grafana OpsGenie)
• 在大规模、事件驱动的分布式系统方面具备背景
• 熟练掌握Terraform、Docker和部署脚本
• 精通持续集成/持续交付实践以实现零停机部署
• 了解C#
• (期望)熟悉分布式消息系统和关系数据库
• (期望)具有交易/EMS/PMS系统和加密市场的经验