员工深度学习系统工程师(CUDA专家)

14个月前全职
180K - 300K USD Dice

Dice

location 洛杉矶
unsaved
Dice是每个阶段的技术专家的领先职业目的地。我们的客户,Myriad Consulting Inc,正在寻找以下职位。立即通过Dice申请! 员工深度学习系统工程师(CUDA专家) 地点:硅谷 需要中英文双语。 薪资范围:18万-30万 我们正在寻找一位技术娴熟、积极进取的深度学习系统工程师,具有CUDA编程的强大背景,加入我们的团队。成功的候选人将负责实施和优化我们的大规模分布式系统,这是一个全球分布式调度服务,用于高效可靠地执行深度学习工作负载。 工作职责: - 实施和优化大规模分布式系统,重点关注CUDA编程和GPU优化。 - 开发用于CUDA内核启动和管理JIT内核的自定义服务器。 - 实施和管理用于设备特定API的硬件抽象层。 - 优化GPU调用并管理内存分配API。 - 处理设备同步API,并确保正确和高效的时间切片和副本切片。 - 与团队合作设计和实施新功能和改进。 - 解决与CUDA编程和GPU优化相关的问题。 最低技能要求: - 计算机科学、电子工程或相关领域的学士或硕士学位。 - 在CUDA编程和GPU优化方面有实际经验。 - 对深度学习工作负载和分布式系统有深入了解。 - 有NVIDIA GPU和相关工具包(如cuObjDump和nvrtcCompileProgram)的经验。 - 熟悉内存分配和设备同步API。 - 出色的问题解决能力和解决复杂软件问题的能力。 - 优秀的沟通和团队合作能力。 首选技能要求: - 有大规模分布式系统或类似分布式调度服务的经验。 - 了解PyTorch或TensorFlow等深度学习框架。 - 有NCCL或类似集合通信库的经验。