职位名称:Kubernetes 运维首席专家工程师
工作地点:伊利诺伊州,芝加哥
工作经验:12年以上
雇佣类型:合同
面试类型:现场或视频
职位描述
Kubernetes 运维首席专家工程师将负责监督和管理企业级 Kubernetes 集群,确保容器化平台的最佳性能、可扩展性、安全性和可靠性。此角色涉及领导一个团队,负责日常 Kubernetes 运维、自动化、基础设施改进以及混合云和多云环境中的生产支持。候选人应具备高级的 Kubernetes、DevOps 工具、CI/CD 管道、云服务和容器管理的实践经验。
主要职责
• 领导 Kubernetes 运维,包括集群部署、配置、升级、扩展、监控和性能调优。
• 管理和维护跨云和本地环境的 Kubernetes 集群,如 AWS、Azure 或 GCP。
• 定义并执行与容器编排、安全性、网络策略、资源优化和工作负载管理相关的最佳实践。
• 利用 Prometheus、Grafana、ELK 等日志记录、监控和追踪工具实施可观察性解决方案。
• 监督事件响应、根本原因分析和事件后评审,以确保平台的可靠性。
• 使用基础设施即代码工具(如 Terraform、Helm 和 Ansible)设计和自动化基础设施操作。
• 与开发、安全和运维团队合作,支持 DevOps 工作流和 CI/CD 管道集成。
• 领导容量规划、资源预测、性能评估和升级计划。
• 文档化标准、部署程序、运行手册和操作最佳实践。
• 指导初级工程师并担任技术升级的联络点。
所需资格
• 12年以上整体 IT 经验,其中至少 6 年在 Kubernetes 和容器编排方面。
• 具备管理和操作大规模 Kubernetes 集群的实践经验。
• 在 AWS、Azure 或 Google Cloud 等云平台方面有强大的背景。
• 精通 Docker、Helm 图表、Terraform、YAML 配置和服务网格技术(如 Istio、Linkerd)。
• 熟练使用 CI/CD 工具,如 Jenkins、GitLab CI、Argo CD 或 Tekton。
• 对 Linux 系统、网络概念、负载均衡器和 DNS 有深入了解。
• 具备使用 Prometheus、Grafana、ELK 和 OpenTelemetry 等可观察性和监控框架的经验。
• 熟悉 Kubernetes 安全标准、RBAC、策略、证书管理和镜像扫描。
• 具备 Bash、Python 或 Go 的扎实脚本经验。
• 拥有强大的故障排除和性能优化技能。
优先技能
• 拥有 Kubernetes 认证,如 CKA、CKAD 或 CKS。
• 具备多集群、混合云或本地 Kubernetes 发行版(如 EKS、AKS、GKE、OpenShift 或 Rancher)的经验。
• 了解 GitOps 方法论和工具,如 Argo CD 或 Flux。
• 具备灾难恢复、备份解决方案和高可用架构的经验。
• 具备团队领导或技术架构师经验。
• 熟悉站点可靠性工程概念和自动化框架。