员工软件工程师,托管人工智能

4天前全职
面议 Crusoe Energy Systems

Crusoe Energy Systems

location 旧金山
unsaved
Crusoe 正在打造全球最受欢迎的以人工智能为首的云基础设施公司。我们正在开创垂直整合、专门构建的人工智能基础设施解决方案,受到财富 500 强公司的信任,以支持他们最先进的人工智能应用程序。Crusoe 正在重新定义人工智能云基础设施,使命是将计算的未来与气候的未来相结合。我们的人工智能平台被公认为可靠性和性能的“金标准”。我们的数据中心经过优化,专为人工智能工作负载而设计,并且由清洁、可再生能源供电。 加入 Crusoe,成为可持续技术的人工智能革命的一部分。在这里,您将推动有意义的创新,产生切实的影响,并加入一个为负责任的、变革性的云基础设施设定步伐的团队。 关于这个角色: 作为 Crusoe 托管人工智能团队的员工软件工程师,您将在塑造我们下一代人工智能推理平台的架构和可扩展性方面发挥关键作用。您将领导我们人工智能服务的核心系统的设计和实施,包括弹性容错队列、模型目录和针对成本和性能优化的调度机制。这个角色让您有机会构建和扩展能够处理每秒数百万个 API 请求的基础设施,服务于成千上万的客户。 从第一天起,您将负责托管人工智能推理的关键子系统,帮助将大型语言模型 (LLM) 提供给全球受众。作为一个动态、快速增长的团队的一部分,您将跨职能合作,影响平台的长期愿景,并为前沿的人工智能技术作出贡献。这是一个独特的机会,构建一个高性能的人工智能产品,成为 Crusoe 业务增长的核心。 您将从事的工作: • 设计和开发: • 领导核心人工智能服务的设计和实施,包括: • 用于高效任务分配的弹性容错队列。 • 用于管理和版本控制人工智能模型的模型目录。 • 针对成本和性能优化的调度机制。 • 为客户服务人工智能模型的高性能 API。 • 可扩展性和性能: • 构建和扩展基础设施,以处理每秒数百万个 API 请求。 • 在基于 GPU 的系统上优化人工智能推理性能。 • 实施强大的监控和警报,以确保系统健康和可用性。 • 合作与创新: • 与产品管理、商业战略和其他工程团队密切合作。 • 影响人工智能平台的长期愿景和架构决策。 • 为开源人工智能框架做出贡献,并参与人工智能社区。 • 原型设计并迭代新特性和技术。 您将为团队带来的: • 强大的工程基础: • 计算机科学、工程或相关领域的高级学位。 • 在分布式系统设计和实施方面的可证明经验。 • 在紧迫的截止日期内交付早期项目的成功记录。 • 使用基于云的服务的专业知识,例如弹性计算、对象存储、虚拟专用网络、托管数据库等。 • 人工智能/机器学习专业知识: • 在生成性人工智能(大型语言模型、多模态)方面的经验。 • 熟悉人工智能基础设施,包括训练、推理和 ETL 管道。 • 软件工程技能: • 具有容器运行时(例如 Kubernetes)和微服务架构的经验。 • 使用 REST API 和常见通信协议(例如 gRPC)的经验。 • 在软件开发周期中的经验以及对 CI/CD 工具的熟悉。 • 优先资格: • 精通 Golang 或 Python,用于大规模、生产级服务。 • 对开源人工智能项目(如 VLLM 或类似框架)的贡献。 • 在 GPU 系统和推理框架上的性能优化。 • 个人特质: • 积极主动并具有协作精神,能够独立工作。 • 强大的沟通和人际交往能力。 • 对构建前沿人工智能产品和解决具有挑战性的技术问题的热情。 福利: • 行业具有竞争力的薪资 • 在快速增长、资金充足的科技公司中享有限制性股票单位 • 包括 HDHP 和 PPO、视力和牙科保险的健康保险套餐供您和您的家属选择 • 雇主对 HSA 账户的贡献 • 带薪父母假 • 带薪人寿保险、短期和长期残疾保险 • Teladoc • 401(k) 计划,薪资的 4% 以内 100% 匹配 • 慷慨的带薪休假和假期安排 • 手机报销 • 学费报销 • Calm 应用订阅 • MetLife 法律服务 • 公司每月支付 200 美元的通勤 FSA 福利 薪酬: 薪酬将高达每年 250,000 美元 + 奖金。所有报价均包含限制性股票单位。薪酬将根据申请人的知识、教育和能力,以及内部公平性和与市场数据的一致性来确定。 Crusoe 是一个平等机会雇主。就业决定不考虑种族、肤色、宗教、残疾、遗传信息、怀孕、公民身份、婚姻状况、性别/性别、性取向、性别认同、年龄、退伍军人身份、国籍或任何其他受法律或法规保护的身份。