在迪拜为半政府客户招聘人工智能基础设施工程师
工作年限:6 年
工作地点:迪拜(寻找基于阿联酋的候选人)
汇报对象:基础设施负责人 / 人工智能平台负责人
职位概述:
设计、构建和运营可扩展的基于 GPU 的人工智能基础设施,以支持大语言模型、生成式人工智能、计算机视觉和机器学习工作负载。管理 GPU 集群,部署 OpenShift AI,并确保在混合云环境中提供高性能、安全的人工智能平台。
主要职责:
为多租户人工智能环境部署和维护 Red Hat OpenShift AI(RHODS)。
托管和扩展 #LLM 框架(Llama、Falcon、Mistral 等)和向量数据库。
使用 Terraform/Ansible 构建模型训练、部署和监控的 MLOps 管道。
在主权云、Azure AI 和 Oracle Cloud 上实施混合人工智能解决方案。
必备技能与经验:
在 #云基础设施、DevOps 或人工智能/机器学习平台工程方面有 7 年以上的经验。
具备 #NVIDIA#GPU 集群(CUDA、DNN、GPU 操作符、NCCL)的实际操作经验。
在 OpenShift AI(RHODS)方面有丰富经验。
关键交付成果:
生产就绪的 #GPU集群 和 #OpenShift #AI平台。
可扩展的 #LLM 服务环境,具备 #MLOps 自动化。
完全文档化、安全且符合规范的 #AI基础设施。
请将您的简历发送给 Hema Javvadi,并附上您的 CTC 和通知详情:hema.j@dautom.com