职位名称:可观测性工程师
经验水平:3级(高级):5-7年
12个月合同
蒙特利尔,QC
描述:我们正在寻找一位经验丰富且积极进取的工程师加入可观测性团队,该团队专注于在私有和公共云环境中提供工具。该职位专注于为云原生和混合应用程序开发和现代化可观测性平台。此职位涉及设计、集成和维护用于收集、传输和可视化遥测(跟踪、指标和日志)的解决方案,以提高我们应用程序的可靠性和正常运行时间。您将与软件开发人员、SRE、基础设施和安全团队密切合作,推动自动化并实施支持混合云环境中开发和运营的一流可观测性解决方案。
职责
• 构建和支持私有和公共云产品(GCP、AKS、EKS)中可观测性工具的现代化和集成
• 设计、实施和自动化遥测、日志记录和监控解决方案,包括仪表板、警报和CI/CD集成。
• 使团队能够利用可观测性数据进行可靠性、性能和安全用例;提供可操作的建议。
• 与DevOps、SRE和安全团队合作,分享最佳实践并支持可观测性标准的采用。
• 通过知识转移指导和提升客户团队的技能,并根据需要参与值班活动。
所需技能:
• 具有任何一家公共云提供商(AWS、Azure、Google)的经验
• 至少5年在企业环境中从事可观测性、日志记录和监控的相关经验。
• 具有使用可观测性工具(如Grafana、Prometheus、Loki、Cortex、Tempo、ElasticSearch、Datadog、Splunk或同类工具)的实际经验。
• 具有使用容器技术(Docker、Kubernetes)和编排平台(GKE或类似平台)的经验。
• 熟练设置和配置仪表板、警报和遥测数据警报。
• 擅长为部署在公共云环境中的应用程序配置和建立监控。
• 具有将可观测性工具与CI/CD管道集成并通过脚本(Python、Bash、JSON、YAML、Terraform或类似工具)实现自动化的经验。
• 优秀的沟通、演示和解决问题的能力。
• 熟练使用Linux操作系统和数据库(MySQL、DB2、MSSQL或类似)。
• 深刻理解企业服务交付组件如何交互(Web服务器、应用服务器、数据库、Web服务、存储、安全)
• 愿意参与值班轮换(大约每6周一次)
加分项:
• 具有分布式跟踪、指标和日志收集的应用程序检测经验。
• 具有Go编程语言经验者优先。
• 具有DevOps工具和自动化经验。
• 具有应用程序性能管理(APM)解决方案的经验。
• 具有将终端用户应用程序与监控和APM工具集成的经验。
• 理解企业架构概念:三层架构、高可用性/灾难恢复、主动-主动数据中心等。
• 熟悉网络概念和协议(OSI模型、TCP/IP、HTTP、防火墙、负载均衡器)。