现场可靠性工程师 - 现场运营

旧金山 5个月前全职 网络
92.5万 - 121.2万 / 年
C3 AI(纽约证券交易所代码:AI)是一家企业人工智能应用软件公司。C3 AI 提供一系列完全集成的产品,包括 C3 Agentic AI 平台,这是一个用于开发、部署和运营企业人工智能应用的端到端平台;C3 AI 应用程序,这是一个行业特定的 SaaS 企业人工智能应用组合,能够推动全球组织的数字化转型;以及 C3 生成性人工智能,这是一个面向企业的领域特定生成性人工智能产品套件。了解更多信息,请访问:C3 AI 我们正在寻找一位现场可靠性工程师加入我们位于加州红木城或弗吉尼亚州泰森斯的团队。 职责 • 与客户合作,设计并实施满足独特访问和安全要求的 C3 AI 平台定制安装。 • 最大化系统正常运行时间和可用性,确保功能和性能服务水平协议(SLA)。 • 在所有关键方面建立端到端监控和警报。 • 解决关键服务的复杂问题,并构建自动化以防止问题重复发生。 • 启动并领导脚本和自动化,以简化系统更新和升级。 • 设置关键基础设施、工具和框架,以简化部署周期。 • 与服务和工程团队跨职能合作。 资格 • 科学、技术、工程或数学(STEM)学士学位,或相关领域的学习经历。 • 在 AWS、GCP 和其他公共云中部署、管理和运营可扩展且容错的基于 Kubernetes 的基础设施方面有证明的经验。 • 精通 Linux 操作系统、网络和数据库概念。 • 精通云服务提供商,如亚马逊网络服务、Azure 和 GCP。 • 具有基础设施即代码配置的经验,如 Terraform 和 Helm。 • 具有 Bash 或 Python 的经验;用于自动化和监控系统。 • 出色的问题解决、批判性思维和沟通能力。 • 具有商业 SaaS 解决方案的 DevOps 或系统管理员支持经验。具有客户面对面的经验者优先。 C3 AI 提供具有竞争力的薪酬包和优厚的福利。 加州基本薪资范围 $129,000—$169,000 美元 C3 AI 自豪地成为一个平等机会和积极行动的雇主。我们不基于任何法律保护的特征,包括残疾和退伍军人身份进行歧视。