我们正在寻找一名拥有2-3年经验的SRE/DevOps工程师,加入我们客户在利雅得的团队,支持其内部和生产系统的可靠性、可扩展性和交付。
这个角色非常适合那些拥有坚实技术基础并渴望深入发展站点可靠性工程或DevOps的人,能够亲身参与现代云基础设施、CI/CD管道、监控和事件响应。
您的工作内容:
- 支持和维护AWS和GCP上的云基础设施
- 处理CI/CD管道以提高部署的可靠性和交付速度
- 协助监控、警报和日志记录以确保系统健康和可用性
- 参与事件响应、故障排除和事后学习
- 支持内部系统,如:
- 访问管理
- 核心工程工具
- 面向员工的平台
- 与工程团队紧密合作以改进自动化、可靠性和运营实践
我们寻找的条件:
- 在SRE、DevOps、平台或基础设施角色中有2-3年的经验
- 拥有扎实的Linux和命令行工具的实际操作经验
- 有在云环境(AWS和/或GCP)中工作的经验
- 理解容器和编排(Docker,Kubernetes)
- 熟悉使用GitHub的CI/CD工作流程
- 有基础设施即代码的经验(优先使用Terraform)
- 接触过监控和日志工具(Datadog,CloudWatch,GCP Logs)
- 基本理解:
- 网络概念(VPCs,子网,安全组,路由)
- 数据库(PostgreSQL)
- 具有强烈的细节关注能力、动手能力和学习意愿