教练 - DevOps/SRE设计师

蒙特利尔 1天前全职 网络
面议
从蒙特利尔市的混合模式(现场3天) 参与轮班支持(晚上/夜间) 需要双语能力:法语和英语 高级职位:需要7-10年经验 Ateko,由加拿大贝尔公司推动(前FX Innovation),正在为其客户寻找一名DevOps-SRE教练/设计师,以参与以下工作: 你将直接在现场参与,以支持可观测性实践的采用,改进工作方式并提升SRE成熟度水平。 该角色结合了技术专长、指导和影响力,以实现可持续的实践转变,而不仅限于解决方案的设计。 职责 团队支持和转型 支持应用程序和平台团队采用SRE和可观测性实践,考虑到他们的业务现实和成熟度水平。 作为技术教练帮助团队自主设计、部署和运营其可观测性解决方案。 通过审查、审计和具体建议促进实践的持续改进(监控、警报、SLO、事件管理)。 促进开发、安全和运营(DevSecOps)之间的跨学科协作文化。 积极影响行为和实践,以确保对组织标准和规范的持久承诺。 可观测性和服务可靠性 与团队一起设计和发展可扩展且有弹性的可观测性解决方案在Datadog平台上。 定义和实施与业务需求、服务可靠性和业务目标一致的可观测性策略。 提出和普及旨在优化成本、性能和高可用性的架构改进。 在DevSecOps模式下建立和传播可观测性食谱,促进团队的自助服务和自主性。 进行部署后审计,以确保监控解决方案的质量、合规性和可持续性。 平台、治理和运营 确保Datadog平台的质量、稳定性和发展。 应用和推广平台管理的最佳实践。 参与技术路线图的制定,并为与运营和可观测性相关的战略决策做出贡献。 确保在Jira和Confluence中进行文档记录和知识共享。 要求 大约5到10年相关经验于支持、指导或技术普及。 大约5到10年相关经验于IT运营、DevOps、服务可靠性、SRE或相关领域。 SRE、DevOps或云认证:重要加分项。 掌握SRE概念。 在提高系统弹性方面的经验:高可用性、故障容忍和受控降级。 运营和事件管理 在关键环境中事件和事件管理的实际经验。 对可观测性支柱(日志、指标、跟踪)及其使用的良好理解。 在SRE或DevOps环境中使用可观测性平台(Datadog)的经验。 DevOps、自动化和平台 在DevOps / DevSecOps方面的经验,包括通过管道(Azure DevOps)进行自动化。 能够促进和实施有利于团队自主性的实践(自助服务、标准化、模板)。 了解AWS和/或Azure云环境(认证为加分项)。 了解系统、应用程序和云服务的管理。 FX可访问性 我们致力于促进一个包容、公平和可访问的工作场所,在这里每个团队成员都感到被重视、尊重和支持,并有机会发挥其全部潜力。我们欢迎并鼓励残疾人士申请。对于参与选择过程各个方面的候选人,可根据要求提供便利。 如需保密请求,只需直接向您的招聘人员发送电子邮件或发送至accessibility@fxinnovation.com以进行安排。如果您对FX Innovation的无障碍就业有任何疑问,请发送电子邮件至我们的人力资源团队:accessibility@fxinnovation.com。