高级深度学习系统软件工程师 - AI基础设施

14个月前全职
176K - 333.5K USD NVIDIA

NVIDIA

location 旧金山
unsaved
NVIDIA是一家行业领先的公司,在高性能计算、人工智能和可视化方面取得了突破性的发展。GPU是我们的发明,它作为现代计算机的视觉皮层,并且是我们产品和服务的核心。我们的工作打开了新的探索领域,实现了惊人的创造力和发现力,并推动了从人工智能到自动驾驶等科幻发明的实现。NVIDIA正在寻找有意识性能分析和优化的高级工程师,以帮助我们在深度学习的各个方面(如训练和推理)中挤出每一个时钟周期,这是当今世界上最重要的工作负载之一。如果您敢于跨硬件/软件堆栈的各个层面(从GPU架构到深度学习框架)工作,以实现最佳性能,我们希望听到您的声音!这个角色为您提供了一个机会,直接影响硬件和软件路线图,在一个快速增长的技术公司中引领人工智能革命,同时帮助全球的深度学习用户享受更高的训练速度。 您将要做的事情: • 理解、分析、剖析和优化最先进的硬件和软件平台上的深度学习工作负载。 • 构建工具来自动化工作负载分析、工作负载优化和其他关键工作流程。 • 与跨职能团队合作,分析和优化云应用在不同GPU架构上的性能。 • 识别应用程序代码中的瓶颈和低效,并提出优化建议以增强GPU利用率。 • 从硬件层面到应用和服务层面推动端到端的平台优化。 • 设计和实施性能基准和测试方法,评估应用程序性能。 • 提供有关优化云原生应用程序速度、可扩展性和资源效率的指导和建议。 • 在应用程序转换到分布式环境时,与领域专家团队共享知识和最佳实践。 我们需要看到的: • 计算机科学、电子工程或计算机科学与电子工程硕士学位或同等经验 • 8年以上应用程序性能工程经验 • 在本地或云服务提供商上使用大规模多节点GPU基础设施的经验 • 深度学习模型架构背景,熟悉Pytorch和大规模分布式训练 • 使用NVIDIA NSight、Intel VTune等应用程序剖析工具的经验 • 深入理解计算机体系结构,并熟悉GPU体系结构的基本原理。有NVIDIA基础设施和软件堆栈的经验。 • 有分析、建模和调优DL应用程序性能的实际经验。 • 熟练使用Python和C/C++分析和优化应用程序代码 脱颖而出的方法: • 算法基础扎实,有GPU编程经验(CUDA或OpenCL) • 理解NVIDIA的服务器和软件生态系统 • 在大规模分布式系统上进行性能优化和基准测试的实际经验 • 有NVIDIA GPU、HPC存储、网络和云计算的实际经验。 • 深入理解存储系统、Linux文件系统和RDMA网络 NVIDIA被广泛认为是科技界最理想的雇主之一。我们拥有一些世界上最具前瞻性和努力工作的人才。如果您富有创造力和自主性,我们希望听到您的声音。 基本工资范围为176,000美元至333,500美元。您的基本工资将根据您的位置、经验和类似职位的员工的薪酬来确定。 您还将有资格获得股权和福利。NVIDIA接受持续申请。 NVIDIA致力于营造一个多元化的工作环境,自豪地成为一个平等机会的雇主。我们非常重视当前和未来员工的多样性,我们在招聘和晋升方面不歧视(包括种族、宗教、肤色、国籍、性别、性别表达、性取向、年龄、婚姻状况、退伍军人状况、残疾状况或任何其他受法律保护的特征)。