我们正在寻找一位技术娴熟、积极主动的DevOps/可靠性工程师(SRE),加入我们位于纽约市中心的充满活力的团队。如果您热衷于确保我们系统的可靠性、可扩展性和性能,并且在快节奏、协作的环境中蓬勃发展,我们希望能听到您的声音。
职责:
• 基础设施自动化:设计、实施和维护基础设施即代码(IaC)解决方案,自动化部署、扩展和管理应用程序和服务。
• 监控和事故响应:开发和维护监控工具和系统,主动识别和解决潜在问题。与跨职能团队合作,响应事故,进行故障排除,确保系统的可靠性。
• 持续集成/持续部署(CI/CD):实施和管理CI/CD流水线,促进应用程序的无缝高效部署。确保强大而自动化的发布流程。
• 性能优化:与开发团队合作,优化应用程序和服务的性能。定期进行性能测试和分析,找出改进的空间。
• 安全合规:与安全团队密切合作,实施和维护安全最佳实践。确保符合行业标准和法规。
• 容量规划:进行容量规划,预测未来的基础设施需求。根据需求扩展系统和资源。
• 协作和文档:促进与开发人员、运维和质量保证等跨职能团队的协作。记录系统架构、流程和配置。
资格:
• 计算机科学、信息技术或相关领域的学士学位。
• 在DevOps工程师或可靠性工程师方面有经验。需要5年以上经验。
• 熟练掌握脚本语言(如Python、Bash)。
• 有容器化和编排工具的经验(如Docker、Kubernetes)。
• 熟练掌握云平台(如AWS、Azure、GCP)。
• 对网络原理和协议有扎实的理解。
• 有配置管理工具的经验(如Ansible、Puppet、Chef)。
• 熟悉CI/CD工具(如Jenkins、GitLab CI)。
• 出色的问题解决和故障排除能力。
• 优秀的沟通和协作能力。
福利:
• 有竞争力的薪资待遇
• 全面的健康和福利福利
• 提供职业发展和成长机会
• 具有合作和包容性的工作环境
• 灵活的工作安排
申请人必须目前有资格在美国全职工作,无法提供赞助。