在Sana Commerce,我们致力于创造一个包容的环境,并认识到我们多元化的员工队伍是我们最大的优势之一。
一切始于2007年,一次披萨聚会和一个计划。Sana Commerce是一个电子商务平台,旨在通过与依赖他们的客户建立持久关系,帮助制造商、分销商和批发商取得成功。我们是一家快速成长的SaaS公司,允许您掌控自己的职业生涯。
在Sana Commerce,我们正在寻找一位SRE经理,来组建和管理我们的全球SRE团队,该团队负责管理和监控所有已安装的系统、环境和基础设施,并解决通过我们的通知系统出现的问题。
您将获得:
- 在快速增长的SaaS公司中创造影响的机会;
- 每年最多5周的“随时随地工作”;
- 全球定制的入职培训计划(之前的员工评分为9.1/10);
- 混合工作模式——3天在办公室,2天在家;
- 每周公司提供的午餐。
职位描述
您将负责:
- 领导SRE团队,设定目标,并指导团队在平衡成本和性能SLA的同时实现高可靠性。
- 与平台和产品工程团队合作,将可靠性和运营最佳实践嵌入软件开发生命周期。
- 制定和实施SRE政策和实践,包括服务水平目标(SLO)、服务水平指标(SLI)和错误预算。
- 推动运营自动化以减少重复劳动,提高系统性能,确保可扩展性,并对重复的手动工作保持合理的过敏反应。
- 监督事件管理、事后分析和根本原因调查,以防止未来的中断并提高系统可靠性。
- 促进容量规划和可扩展性练习,以管理增长并确保资源的有效使用。
- 促进灾难恢复计划和测试,以确保客户网店的业务连续性。
- 通过指导团队成员和在团队内培养创新,鼓励持续改进的文化。
- 跟踪SRE领域的最新趋势和技术,并在适当时倡导其采用。
资格
您将具备:
- 计算机科学、工程或相关技术领域的学士或硕士学位。
- 至少5年的网站可靠性工程经验,其中2年以上的领导或管理角色经验。
- 在云计算平台(如AWS、Azure、GCP)方面的专业知识,以及容器编排(如Kubernetes)方面的经验。
- 对网络协议、负载均衡和高可用性配置有深刻理解。
- 在SRE中应用软件开发解决方案的经验,并熟悉编程语言,如(最好是)PowerShell和C#,或Python、Go、Java等。
- 使用自动化工具、基础设施即代码(如Terraform、Ansible)的经验。
- 熟练使用监控和日志工具(如Prometheus、Grafana、ELK Stack)并实施全面的监控解决方案。具备Dynatrace知识者优先。
- 出色的问题解决能力,能够在压力下解决复杂问题。
- 杰出的领导才能,拥有指导和发展高绩效团队的经验。
- 出色的沟通和协作能力,能够有效地与跨职能团队合作。
职位描述可能难以理解。即使您可能并不完全符合所有要求,我们对迪拜办公室有雄心勃勃的计划,并鼓励那些与我们愿景一致并期待与我们共同成长的人申请。立即申请。
附加信息