人工智能 GPU Linux 内核计算 - 高级员工工程师(数据中心 - CPU - IOMMU - C/C++)
100% 远程工作,仅限美国 - 全职员工职位(不接受承包商)
保密
一家上市计算机硬件基础设施公司,年销售额超过 50 亿美元,股票价格在过去一年中增长了 300% 以上,以支持人工智能数据中心基础设施的建设。
公司正在寻求聘请几位高级级别的个人贡献型软件工程师,负责设计和开发驱动下一代高密度数据中心计算机架的 软件,包括人工智能 GPU、CPU 和 LINUX 驱动内核开发。不同级别的多个新职位空缺,从高级工程师、员工、高级员工到首席工程师。
软件开发
• 设计和实现驱动下一代 CPU 和 GPU 的驱动程序和应用软件。
• 开发、增强和维护用于 GPU 计算的软件库。
• 优化代码以提高性能、效率和低延迟。
• 与网络工程师合作创新新想法,以优化整体数据中心效率。
• 为客户的数据中心管理需求架构解决方案,与多个低级驱动程序、操作系统和库协作。
硬件集成
• 板卡启动和验证与硬件的所有低级交互。
• 监控板卡健康的驱动程序。
• 排查和解决硬件与软件的交互问题。
要求
• 必须愿意成为全职员工,并在美国境内 100% 远程工作。该职位提供带薪假期、带薪休假、参与公司福利计划和年度股票奖励。
• 必须具有 10 年以上的嵌入式软件开发经验,最重要的是,3 年以上开发驱动高密度数据中心计算机机架的软件经验,包括人工智能 GPU、CPU 和 LINUX 驱动内核开发。
• 必须具有 GPU 编程经验,并熟悉 CUDA 和 ROCm 等 GPU 库。
• 必须具备强大的编程技能,精通嵌入式 C/C++。
• 必须具备 LINUX 驱动内核开发经验。候选人应在 Linux 内核内存管理、中断和 IOMMU 方面具有丰富经验。
• 具有数据中心部署经验:在数据中心架构、开发和维护部署软件方面的先前经验。
• 必须对 CPU、DPU、内存、网络接口卡和板监控元件的主要元素有深入了解。
• 具备调试和测试技能,能够识别和解决软件和硬件问题。
• 必须具备良好的英语沟通能力,能够与全球各地的团队合作。必须能够通过书面文件(如架构规范)和技术论坛中的口头演示,清晰地表达需求和愿景,以适应广泛的受众。
这是一个软件开发角色。它不是以下列出的角色之一。
• 不需要管理者。这是一个动手的个人贡献型编码工程师角色。
• 不接受仅专注于测试的工程师。