我们正在寻找一位资深深度学习软件工程师,专注于LLM性能!NVIDIA正在寻找一位有经验的深度学习工程师,热衷于分析和改进LLM推理性能!NVIDIA正在快速扩展我们在深度学习推理方面的研究和开发,并正在寻找各个专业水平的优秀软件工程师加入我们的团队。全球各地的公司正在使用NVIDIA GPU推动深度学习的革命,在LLM、生成式AI、推荐系统和视觉等领域实现突破,将深度学习融入每一个软件解决方案。加入我们的团队,构建软件以实现这些深度学习解决方案的性能优化、部署和服务。我们专注于开发GPU加速的深度学习软件,如TensorRT、深度学习基准测试软件以及用于部署和服务这些模型的高性能解决方案。
与深度学习社区合作,在TensorRT LLM、VLLM、SGLang和LLM基准测试中实现最新算法的公开发布。识别性能机会并优化NVIDIA加速器范围内的最先进LLM模型,从数据中心GPU到边缘SoC。使用TensorRT LLM、VLLM、SGLang、Triton和CUDA内核实现LLM推理、服务和部署算法及优化。与涉及性能建模、性能分析、内核开发和推理软件开发的多元化团队合作。
您的工作内容:
- 对LLM、VLM和GenAI模型进行性能优化、分析和调优,以便在NVIDIA/OSS LLM框架中进行深度学习推理、服务和部署。
- 在不同架构和类型的NVIDIA加速器上扩展LLM模型的性能。
- 在最大吞吐量、最小延迟和延迟限制下的吞吐量之间扩展性能。
- 为NVIDIA/OSS LLM框架、推理基准测试框架、TensorRT和Triton贡献功能和代码。
- 与跨生成式AI、汽车、图像理解和语音理解的跨协作团队合作,开发创新解决方案。
我们需要您具备:
- 相关领域(计算机工程、计算机科学、EECS、AI)的学士、硕士、博士学位或同等经验。
- 至少8年的相关软件开发经验。
- 优秀的Python/C/C++编程、软件设计和软件工程技能。
- 具有使用PyTorch、JAX、TensorFlow等深度学习框架的经验。
脱颖而出的方式:
- 具有LLM框架或深度学习编译器在推理、部署、算法或实现方面的经验。
- 具有深度学习/高性能计算/高性能应用程序的性能建模、分析、调试和代码优化经验。
- 具有CPU和GPU的架构知识。
- 具有GPU编程经验(CUDA或OpenCL)。
GPU深度学习为机器学习、感知、推理和解决使用人类语言提出的问题提供了基础。GPU最初是模拟人类想象力的引擎,创造出令人惊叹的视频游戏和好莱坞电影的虚拟世界。现在,NVIDIA的GPU运行深度学习算法,模拟人类智能,成为计算机、机器人和自动驾驶汽车的大脑,能够感知和理解世界。正如人类的想象力和智能是相互关联的,计算机图形和人工智能在我们的架构中结合在一起。人类大脑的两种模式,GPU的两种模式。这可能解释了为什么NVIDIA GPU被广泛用于深度学习,NVIDIA越来越被称为“AI计算公司”。来吧,加入我们的深度学习架构团队,在这个令人兴奋且快速增长的领域中,帮助构建推动我们成功的实时、经济高效的计算平台。
#LI-Hybrid
您的基本工资将根据您的所在地、经验以及类似职位员工的薪酬来确定。基本工资范围为4级184,000美元至287,500美元,5级224,000美元至356,500美元。
您还将有资格获得股权和福利。
此职位的申请将至少接受到2026年1月13日。
此职位发布是为了现有空缺。
NVIDIA在其招聘过程中使用AI工具。
NVIDIA致力于营造多元化的工作环境,并自豪地成为一个平等机会的雇主。由于我们高度重视当前和未来员工的多样性,我们不会基于种族、宗教、肤色、国籍、性别、性别表达、性取向、年龄、婚姻状况、退伍军人身份、残疾状况或法律保护的任何其他特征进行歧视(包括在招聘和晋升实践中)。