Dice是每个阶段的技术专家的领先职业目的地。我们的客户,Myriad Consulting Inc,正在寻找以下职位。立即通过Dice申请!
员工深度学习系统工程师(CUDA专家)
地点:硅谷
需要中英文双语。
薪资范围:18万-30万
我们正在寻找一位技术娴熟、积极进取的深度学习系统工程师,具有CUDA编程的强大背景,加入我们的团队。成功的候选人将负责实施和优化我们的大规模分布式系统,这是一个全球分布式调度服务,用于高效可靠地执行深度学习工作负载。
工作职责:
- 实施和优化大规模分布式系统,重点关注CUDA编程和GPU优化。
- 开发用于CUDA内核启动和管理JIT内核的自定义服务器。
- 实施和管理用于设备特定API的硬件抽象层。
- 优化GPU调用并管理内存分配API。
- 处理设备同步API,并确保正确和高效的时间切片和副本切片。
- 与团队合作设计和实施新功能和改进。
- 解决与CUDA编程和GPU优化相关的问题。
最低技能要求:
- 计算机科学、电子工程或相关领域的学士或硕士学位。
- 在CUDA编程和GPU优化方面有实际经验。
- 对深度学习工作负载和分布式系统有深入了解。
- 有NVIDIA GPU和相关工具包(如cuObjDump和nvrtcCompileProgram)的经验。
- 熟悉内存分配和设备同步API。
- 出色的问题解决能力和解决复杂软件问题的能力。
- 优秀的沟通和团队合作能力。
首选技能要求:
- 有大规模分布式系统或类似分布式调度服务的经验。
- 了解PyTorch或TensorFlow等深度学习框架。
- 有NCCL或类似集合通信库的经验。