我们正在寻找一位高技能和经验丰富的员工 DevOps 工程师加入我们的团队。此角色将专注于网站可靠性工程(SRE),增强我们的开发平台,并确保稳健的安全实践。理想的候选人将具备 SRE 原则、平台工程和安全方面的扎实背景,并有驱动系统可靠性、性能和安全性改进的证明能力。
主要职责:
网站可靠性工程(SRE):实施和管理 SRE 实践,以确保我们系统和服务的高可用性、可靠性和性能。
开发和维护服务级目标(SLO)、服务级指标(SLI)和服务级协议(SLA)。
监控和分析系统性能,主动识别和解决可靠性问题。
自动化操作任务,以减少人工干预并提高系统效率。
开发者平台:增强和维护开发者平台,以支持高效和可扩展的软件开发。
与工程团队合作,改进 CI/CD 管道,简化开发工作流程,并优化部署过程。
确保开发工具和环境是最新的、可靠的和可扩展的。
安全:实施和管理安全实践,以保护我们的系统和数据免受威胁。
定期进行安全评估和漏洞扫描,以识别和减轻风险。
与安全团队合作,强制执行安全政策,并确保默认合规。
协作与领导:以产品思维为主导,构建开发者觉得直观易用的工具。
与跨职能团队密切合作,支持和改善系统的可靠性、性能和安全性。
指导并为初级团队成员提供技术指导。
保持对行业趋势和最佳实践的更新,应用它们以改善我们的系统和流程。