专注于基础设施事件和警报的监控、检测和分类。团队通过集中化工具确保企业系统的24x7可见性,支持主动识别事件,并通过将工单记录到ITSM系统中来触发响应工作流程。此功能是维护运营稳定性和服务连续性的关键部分。
职责
• 使用监控工具监控网络、服务器和应用系统的IT基础设施警报和事件。
• 根据SOP在检测到定义的警报或阈值突破时,在ITSM系统(如ServiceNow、BMC)中创建和分类工单。
• 按照预定义的工作流程通知相关解决小组或在需要时升级事件。
• 在24x7轮班环境中工作(包括夜班和周末班)。
• 准确维护事件日志并记录问题以便进一步分类和解决。
• 根据标准检查支持事件的初步验证(消除误报)。
• 与L1/L2支持团队合作进行事件交接或跟进。
• 确保符合监控KPI和SLA的事件检测和工单创建。
• 在监督下协助维护监控仪表板和工具。
• 根据SOP参与定期系统健康检查和基本IT操作任务。
• 基础设施领域(如Windows、AD、网络和服务器)的基本熟悉度优先。
• 熟练使用Excel进行基本报告准备和使用文字处理工具进行文档编制。
• 注重细节并能够精确遵循运行手册/SOP。
• 良好的书面和口头沟通能力。
• 始终期望以客户为导向的方式。
基本资格:
• 计算机科学、信息技术或相关领域的学士学位,或同等经验。
• 至少3年以上IT监控或支持角色的相关经验。
• 愿意接受24x7轮班工作。
• 良好的分析和问题解决能力。
• 能够以勤勉和准确性处理重复的监控任务。
其他资格:
• 相关领域的高级学位是加分项。