站点可靠性工程经理

迪拜 无个税9天前全职 网络
面议
在Sana Commerce,我们致力于创造一个包容的环境,并认识到我们多元化的员工队伍是我们最大的优势之一。 一切始于2007年,一次披萨聚会和一个计划。Sana Commerce是一个电子商务平台,旨在通过与依赖他们的客户建立持久关系,帮助制造商、分销商和批发商取得成功。我们是一家快速成长的SaaS公司,允许您掌控自己的职业生涯。 在Sana Commerce,我们正在寻找一位SRE经理,来组建和管理我们的全球SRE团队,该团队负责管理和监控所有已安装的系统、环境和基础设施,并解决通过我们的通知系统出现的问题。 您将获得: - 在快速增长的SaaS公司中创造影响的机会; - 每年最多5周的“随时随地工作”; - 全球定制的入职培训计划(之前的员工评分为9.1/10); - 混合工作模式——3天在办公室,2天在家; - 每周公司提供的午餐。 职位描述 您将负责: - 领导SRE团队,设定目标,并指导团队在平衡成本和性能SLA的同时实现高可靠性。 - 与平台和产品工程团队合作,将可靠性和运营最佳实践嵌入软件开发生命周期。 - 制定和实施SRE政策和实践,包括服务水平目标(SLO)、服务水平指标(SLI)和错误预算。 - 推动运营自动化以减少重复劳动,提高系统性能,确保可扩展性,并对重复的手动工作保持合理的过敏反应。 - 监督事件管理、事后分析和根本原因调查,以防止未来的中断并提高系统可靠性。 - 促进容量规划和可扩展性练习,以管理增长并确保资源的有效使用。 - 促进灾难恢复计划和测试,以确保客户网店的业务连续性。 - 通过指导团队成员和在团队内培养创新,鼓励持续改进的文化。 - 跟踪SRE领域的最新趋势和技术,并在适当时倡导其采用。 资格 您将具备: - 计算机科学、工程或相关技术领域的学士或硕士学位。 - 至少5年的网站可靠性工程经验,其中2年以上的领导或管理角色经验。 - 在云计算平台(如AWS、Azure、GCP)方面的专业知识,以及容器编排(如Kubernetes)方面的经验。 - 对网络协议、负载均衡和高可用性配置有深刻理解。 - 在SRE中应用软件开发解决方案的经验,并熟悉编程语言,如(最好是)PowerShell和C#,或Python、Go、Java等。 - 使用自动化工具、基础设施即代码(如Terraform、Ansible)的经验。 - 熟练使用监控和日志工具(如Prometheus、Grafana、ELK Stack)并实施全面的监控解决方案。具备Dynatrace知识者优先。 - 出色的问题解决能力,能够在压力下解决复杂问题。 - 杰出的领导才能,拥有指导和发展高绩效团队的经验。 - 出色的沟通和协作能力,能够有效地与跨职能团队合作。 职位描述可能难以理解。即使您可能并不完全符合所有要求,我们对迪拜办公室有雄心勃勃的计划,并鼓励那些与我们愿景一致并期待与我们共同成长的人申请。立即申请。 附加信息