SRE生产支持(AS400/.Net)

多伦多 2天前全职 网络
面议
总经验:10年以上 所需技能: - 5年相关应用程序生产支持经验 - 能够成为IT生产支持团队的一员,为最终用户提供前线技术支持,响应与事件问题管理、发布部署、操作准备、应用程序监控生产治理相关的问题。 - 网站可靠性工程(SRE)展示灵活性,驾驭模糊性,并迅速在技术同行中建立信誉 - 优秀的书面和口头沟通能力 - 在以下某些领域具有公认的知识:AS400, .net - 了解中间件技术,熟悉Windows服务器操作系统,了解Unix和Windows - 具有数据库技术(例如Oracle、DB2和PLSQL)查询的经验,以支持事件解决。 - 了解事件驱动和计划驱动的批处理过程 - 具备处理各种生产支持角色(技术L1L2L3)的经验,并具有至少2-3种广泛使用的监控调度工具的实际操作经验 - 具备故障排除、分析、研究和解决的经验,使用高级查询、编程技能进行根本原因分析,识别缓解风险、实时恢复、对影响技术服务(应用程序基础设施)的问题进行分类,在恢复期间及时通知合作伙伴重大进展或挑战 - 能够评估初始严重性,收集影响,召集必要的支持团队,并在必要时升级,以确保及时恢复 - 具有随叫随到支持的经验,用于分类问题,与组织内的各种支持团队协调,并执行与事件和问题管理相关的活动 - 能够与所有业务线和管理层沟通应用程序的整体状态和健康状况,参与自动化、因果分析、开发共享的通用解决方案,并主动识别跨功能或技术问题 - 作为5天工作周轮班的一部分,在某些周末和银行假期工作 - 还负责所有与技术相关的生产服务的端到端维护责任。 - 生产共享服务的工作活动包括问题事件管理、操作准备、应用程序监控、服务分析和报告、生产治理、分类。积极参与并领导生产支持问题事件。 - 承担升级的责任并进行故障排除、分析、研究和解决。 - 确保生产和性能SLA得到满足,并升级需要注意的问题。 - 在中等监督下进行计划、安装和支持新旧设备和软件的分析、技术和行政工作。 - 识别漏洞和改进机会。