职位:AI GPU - 高级员工软件工程师(CPU,Linux,C++)仅限美国远程(休斯顿)
AI GPU Linux 内核计算高级员工工程师(数据中心 - CPU - IOMMU C/C++)
100% 远程工作,仅限美国全职员工职位(不接受承包商)
保密
一家公开上市的计算机硬件基础设施公司,年销售额超过 50 亿美元,股票价格在过去一年增长了 300% 以上,以支持 AI 数据中心基础设施的建设。
公司正在寻求招聘几名高级个人贡献型的实用软件工程师,负责设计和开发推动下一代高密度数据中心计算机机架的软件,包括 AI GPU、CPU 和 Linux 驱动内核开发。不同级别的多个新职位空缺,包括高级工程师、员工工程师、高级员工工程师和首席工程师。
软件开发
• 设计和实现驱动程序、应用软件,以推动下一代 CPU 和 GPU。
• 开发、增强和维护用于 GPU 计算的软件库。
• 优化代码以提高性能、效率和低延迟。
• 与网络工程师合作,创新新想法以优化整体数据中心效率。
• 为客户的数据中心管理需求架构解决方案,与多个低级驱动程序、操作系统和库协作。
硬件集成
• 板卡启动和验证与硬件的所有低级交互。
• 驱动程序监控板卡的健康状态。
• 解决硬件与软件交互问题的故障排除。
要求
• 必须愿意成为全职员工,并在美国境内 100% 远程工作。该职位享有带薪休假、带薪假期和参加公司福利计划以及年度股票赠与的资格。
• 必须具有 10 年以上的嵌入式软件开发经验,但最重要的是,必须具有 3 年以上开发高密度数据中心计算机机架的软件经验,包括 AI GPU、CPU 和 Linux 驱动内核开发。
• 必须具备 GPU 编程经验,并熟悉 CUDA 和 ROCm 等 GPU 库。
• 必须具备扎实的编程技能,精通嵌入式 C/C++。
• 必须具有 Linux 驱动内核开发经验。候选人应在 Linux 内核内存管理、中断和 IOMMU 方面具有丰富经验。
• 数据中心部署经验:在数据中心架构方面的先前经验,开发和维护部署软件。
• 必须对 CPU、DPU、内存、网络接口卡和板监控元素的主要组成部分有深入了解。
• 具备调试和测试技能,能够识别和解决软件与硬件问题。
• 必须具备良好的英语沟通能力,能够与全球各地的团队合作。需要证明能够通过书面文件(如架构规范)和技术论坛中的口头演示向大型和多样化的受众阐明需求和愿景。
这是一个软件开发角色。它不是以下列出的角色之一。
• 不接受经理。这个角色是一个动手的个人贡献者,编码工程师角色。
• 不接受仅专注于测试的工程师。