职位:HPC 工程师(DevOps)
技术创新研究院(TII)是一家位于阿布扎比,阿联酋的公共资助研究机构。这里聚集了来自全球的顶尖科学家、工程师、数学家和研究人员,致力于将问题和障碍转化为开创性的研究和技术原型,以推动社会进步。
人工智能研究中心:作为 TII 人工智能研究中心的一部分,极大规模语言模型团队正在开发和实施创新的深度学习技术,应用范围广泛,从自然语言处理到感知和视觉。我们的团队开发了 Falcon 模型,并计划继续在大型语言模型的前沿应用研究上迈进。
我们正在寻找一位优秀的 HPC / DevOps 工程师加入我们的团队,帮助我们推动计算技术的边界。作为我们团队的工程师,您将设计、实施和管理可扩展的高性能集群计算基础设施,以满足我们复杂的计算需求。
职责:
- 设计、开发、维护和优化 HPC 基础设施。
- 与我们的软件工程团队合作,将软件应用与基础设施集成。
- 诊断和解决复杂的 HPC 系统和软件问题。
- 执行系统管理任务,包括系统配置、系统升级和监控 HPC 集群的健康和性能。
- 与我们的销售和客户支持团队合作,为客户咨询和售前工程支持提供技术专长。
- 研究新技术和方法以提高系统性能和效率。
要求:
- 具备 HPC、集群管理、云计算和 GPU 计算的经验。
- 精通 C、C++、Rust 或 Python 等编程语言。
- 具有 Linux/Unix 环境的经验,包括脚本、网络和系统管理。
- 具备 Git Ops 和 IaaC 工具(如 ansible、terraform、helm)的经验。
- 熟悉现代 DevOps 和云原生开发实践。
- 熟悉容器化技术及其运行时:Docker、containerd、cgroups。
- 具备编排工具(如 Kubernetes、Docker Swarm、Slurm)的经验。
- 具备较强的问题解决能力、注重细节和出色的分析能力。
- 良好的沟通能力,能够在团队环境中协作。
- 具备 IaaS 和云计算(AWS、GCP、Azure)的经验。
- 有 GPU 编程(CUDA、OpenCL)或 FPGA 经验者优先。
- 熟悉 MPI、OpenMP 或其他并行处理框架者优先。
资格:
- 计算机科学、电气工程或相关领域的学士或硕士学位。
在 TII,我们通过严谨的科学发现和探究方法,利用最先进的设施和与国际领先机构的合作,帮助社会克服其最大的障碍。我们严谨的发现和探究方法帮助在先进材料、自动化机器人、密码学、数字安全、定向能、量子计算和安全系统等领域取得新的突破。
资历水平:中高级
雇佣类型:全职
工作职能:研究
行业:研究服务
通过推荐增加您在技术创新研究院面试的机会。
阿布扎比,阿布扎比酋长国,阿联酋 AED 14,000 - AED 15,000