穆罕默德·本·扎耶德人工智能研究院 (MBZUAI) 的基础模型研究所 (IFM) 正在构建和运营大规模 GPU 集群,以支持前沿人工智能模型的训练和研究。我们正在寻找一位组织能力强、执行力强的项目经理来支持高性能计算 (HPC) 项目。
该职位将与 HPC 项目负责人紧密合作,负责端到端的基础设施项目管理,协调供应商、校内各部门(IT、采购、合规、财务)以及研究相关人员,同时确保文档、管理和交付跟踪得到妥善维护。
主要职责
- HPC 项目执行与协调
- 支持 HPC 基础设施项目(GPU 集群、存储、网络、升级)的规划和交付。
- 与外部供应商(硬件提供商、云合作伙伴、数据中心运营商)协调合作。
- 跟踪项目里程碑、风险、依赖关系和时间表。
- 维护项目计划、日志和状态报告。
- 组织并记录项目会议和行动事项。
- 集群组合跟踪与IFM项目支持
- 维护所有在IFM集群上运行的主要工作负载和项目的结构化可见性。
- 跟踪HPC支持的集群分配、重大举措和优先项目。
- 与IFM研究团队和项目负责人建立并维护良好的工作关系。
- 作为协调桥梁,确保关键IFM项目获得适当的基础设施支持。
- 主动识别影响关键研究进度的风险,并在必要时上报。
跨部门协调
- 作为HPC团队与大学IT、采购、财务、法务、合规和人力资源部门之间的联络人。
- 确保需求得到清晰记录,并在所有利益相关者之间保持一致。
- 主动跟进,消除障碍,保持项目进展。
文档与治理
- 维护集群规范、合同、服务水平协议(SLA)和变更日志的结构化文档。
- 支持治理流程(指导委员会跟踪、审查节奏)。
- 协助审计准备和文档整合。
- 协助出口管制治理跟踪和供应商合规性。协助IT部门协调访问控制和用户审批工作。
- 跟踪风险缓解措施和监管文档要求。
报告与高管沟通
- 准备简明扼要的领导层更新和高管摘要。
- 制作演示文稿和结构化的状态报告。
- 维护项目状态、预算跟踪和供应商绩效的仪表盘。
学历要求
- 工程、计算机科学、信息系统、商业或相关领域的学士学位(必需)。
- 硕士学位(MBA、工程、技术管理或相关学科)优先考虑。
专业经验要求
必备:
- 5年以上项目管理经验。
- 技术或基础设施项目经验。
- 优秀的组织和文档撰写能力。
- 出色的书面和口头沟通能力。
- 能够在复杂的组织中跨部门协作。
- 高度注重细节,并具有很强的执行力。
优先考虑:
- 高性能计算 (HPC)、数据中心、云基础设施或人工智能/机器学习 (AI/ML) 环境经验。
- 熟悉供应商合同跟踪和服务水平协议 (SLA) 监控。
- 了解风险管理和合规框架。
- 持有项目管理专业人士 (PMP) 或同等认证者优先。