人工智能 GPU - 高级员工软件工程师(CPU,Linux,C++)仅限美国远程工作

休斯敦 15小时前全职 网络
面议
人工智能 GPU Linux 内核计算 - 高级员工工程师(数据中心 - CPU - IOMMU - C/C++) 100% 远程工作,仅限美国 - 全职员工职位(不接受承包商) 保密 一家上市计算机硬件基础设施公司,年销售额超过 50 亿美元,股票价格在过去一年中增长了 300% 以上,以支持人工智能数据中心基础设施的建设。 公司正在寻求聘请几位高级级别的个人贡献型软件工程师,负责设计和开发驱动下一代高密度数据中心计算机架的 软件,包括人工智能 GPU、CPU 和 LINUX 驱动内核开发。不同级别的多个新职位空缺,从高级工程师、员工、高级员工到首席工程师。 软件开发 • 设计和实现驱动下一代 CPU 和 GPU 的驱动程序和应用软件。 • 开发、增强和维护用于 GPU 计算的软件库。 • 优化代码以提高性能、效率和低延迟。 • 与网络工程师合作创新新想法,以优化整体数据中心效率。 • 为客户的数据中心管理需求架构解决方案,与多个低级驱动程序、操作系统和库协作。 硬件集成 • 板卡启动和验证与硬件的所有低级交互。 • 监控板卡健康的驱动程序。 • 排查和解决硬件与软件的交互问题。 要求 • 必须愿意成为全职员工,并在美国境内 100% 远程工作。该职位提供带薪假期、带薪休假、参与公司福利计划和年度股票奖励。 • 必须具有 10 年以上的嵌入式软件开发经验,最重要的是,3 年以上开发驱动高密度数据中心计算机机架的软件经验,包括人工智能 GPU、CPU 和 LINUX 驱动内核开发。 • 必须具有 GPU 编程经验,并熟悉 CUDA 和 ROCm 等 GPU 库。 • 必须具备强大的编程技能,精通嵌入式 C/C++。 • 必须具备 LINUX 驱动内核开发经验。候选人应在 Linux 内核内存管理、中断和 IOMMU 方面具有丰富经验。 • 具有数据中心部署经验:在数据中心架构、开发和维护部署软件方面的先前经验。 • 必须对 CPU、DPU、内存、网络接口卡和板监控元件的主要元素有深入了解。 • 具备调试和测试技能,能够识别和解决软件和硬件问题。 • 必须具备良好的英语沟通能力,能够与全球各地的团队合作。必须能够通过书面文件(如架构规范)和技术论坛中的口头演示,清晰地表达需求和愿景,以适应广泛的受众。 这是一个软件开发角色。它不是以下列出的角色之一。 • 不需要管理者。这是一个动手的个人贡献型编码工程师角色。 • 不接受仅专注于测试的工程师。