Python / PyTorch 开发者 前端推理编译器

迪拜 无个税2小时前全职 网络
面议
您想参与创建世界上最快的生成模型推理吗?加入Cerebras推理团队,参与开发独特的软件和硬件组合,在运行最大模型时提供市场上最佳的推理特性。 Cerebras晶圆级推理平台通过独特的硬件架构实现了前所未有的速度,提供最快的本地内存访问、超高速互连和大量可用计算能力,从而运行生成模型。 您将成为团队的一员,与最新的开放和封闭生成AI模型合作,以优化Cerebras推理平台。您的职责将包括在模型表示、优化和编译栈上工作,以在Cerebras当前和未来平台上产生最佳结果。 职责: 分析生成AI领域的新模型并理解其对编译栈的影响。开发和维护模型定义框架,该框架由模型构建块组成,以表示基于PyTorch和Cerebras方言的大型语言模型,准备在Cerebras硬件上部署。开发和维护前端编译器基础设施,该基础设施摄取PyTorch模型并生成中间表示(IR)。扩展和优化基于PyTorch FX / TorchScript / TorchDynamo的工具,用于图形捕获、转换和分析。与其他团队合作实现功能。研究新的模型优化方法以改进Cerebras推理。 理想的候选人资料 资格: 工程、计算机科学学位或同等经验和卓越能力的证据。强大的Python编程技能和深入的PyTorch内部经验(例如,TorchScript、FX或Dynamo)。对计算图、张量操作和模型跟踪的深刻理解。构建或扩展编译器、解释器或ML图优化框架的经验。使用PyTorch和HuggingFace Transformers库的经验。具有大型语言模型的知识和经验(理解Transformer架构变体、生成周期等)。强大的C++编程技能。了解基于MLIR的编译栈。 优先资格: 曾为PyTorch、TensorFlow XLA、TVM、ONNX RT或类似编译器栈做出贡献的经验。对硬件加速器、量化或运行时调度的知识。具有多目标推理编译(例如,CPU、GPU、自定义ASIC)的经验。理解数值精度权衡和操作符降低。对开源ML编译器项目的贡献。