主要职责:
- 站点可靠性工程:确保稳健和稳定的IT系统以支持业务运营。
- 自动化和DevOps:实施和管理自动化工具和平台,如Azure DevOps、Terraform和Ansible Automation Platform。
- 自动化云供应(使用Terraform/SNOW的Azure和阿里云)
- BAU任务和事件修复的端到端自动化(Ansible / Datadog)
- 文档:创建技术文档、运行手册、架构图和自动化标准。
- 技术项目:在混合环境(云和本地)中实施和交付项目,重点关注高可用性、性能和安全性。
- 企业平台管理:监督云计算资源、服务器、数据库、SAN存储、数据保护和灾难恢复。
- 运营支持:管理和监控日常工作,定期进行系统和硬件健康检查,并进行灾难恢复演练。
- 非工作时间支持:在需要时提供非工作时间支持。
- 问题诊断:进行一级诊断以识别和解决问题,提高可靠性。
- 其他职责:执行团队领导分配的其他任务。
要求:
- 教育:计算机科学、信息技术或相关领域的学位或文凭。
- 经验:5年以上云工程、自动化或平台运营经验。
- 认证:IT专业认证(例如,Azure管理员助理、Terraform助理或阿里云ACA/ACP)是有利的。
- 技术技能:
- 精通Azure DevOps、Terraform和Ansible Automation Platform等自动化和DevOps工具。
- 拥有使用PowerShell、Bash和Python等脚本语言的丰富经验。
- 熟悉ServiceNow目录和工作流者优先。
- 熟悉Datadog等监控工具和事件驱动自动化。
- 拥有Azure和阿里云等多云平台的经验。
- 管理和排除Microsoft Windows、Linux、MS SQL数据库、网络故障。
- 了解Active Directory、ADFS、MS集群、SAN存储、Commvault备份、MS SCCM/SCOM、HP SIM/iLO或系统管理主页者优先。
- 语言能力:熟练掌握英语的口语和书面表达。