机器学习DevOps工程师

15个月前全职
Agilus Work Solutions

Agilus Work Solutions

location 多伦多
unsaved
Agilus正在招聘金融服务行业的机器学习DevOps工程师。 Agilus Work Solutions的客户在金融服务领域拥有一家正在寻找机器学习DevOps工程师的团队,该职位是永久性职位。我们的客户是北美增长最快的私募股权基金之一,拥有超过130亿美元的资产。他们正在寻找多样化、精力充沛、充满活力的个人,这些个人在快节奏、高绩效、创业环境中蓬勃发展。 职责 • 与软件开发人员、DL/ML工程师和其他工程师跨部门合作,确保高效交付,增强整体软件交付流水线和基础设施的健康性和维护高质量的机器学习模型 • 设计、部署和维护可扩展的解决方案,跨主要云平台(首选Google Cloud,但至少其中之一Google Cloud、AWS或Azure),确保我们的基础设施以及所有应用程序和服务的可用性、性能和就绪状态 • 实施和维护端到端的微服务和机器学习流水线,确保顺畅地从数据摄取、训练、测试、部署到生产环境的过渡 • 利用CI/CD原则简化代码部署和软件更新,确保从开发环境到生产环境的无缝过渡。使用相同的CI/CD原则自动化将ML算法部署到生产环境中(熟悉使用基础设施即代码工具,如Google Cloud Development Manager或CloudFormation) • 实施和管理监控工具,确保系统健康,诊断潜在问题,并为开发团队提供反馈循环,以提高应用程序的可靠性。监控生产基础设施和ML模型的健康和性能。实施实时监控、日志记录和警报策略,以确保高的正常运行时间和可靠性 • 在整个开发生命周期和基础设施中执行安全最佳实践和漏洞管理标准。确保ML模型和数据流水线符合相关法规和公司政策 • 保持对DevOps和MLOps中新兴趋势和工具的更新,不断寻求改进机会,并主动推荐 要求 • 计算机科学、工程或相关领域的学士学位或更高学位 • 在DevOps角色中工作的经验7年,其中至少1年专门从事MLOps或处理ML在生产中的经验 • 精通Python、Shell或等效的脚本语言 • 必须精通主要云平台,尤其是Google Cloud Platform(GCP)。 • 必须精通主要云平台,尤其是Google Cloud Platform(GCP) • 具备使用Docker等容器化技术和Kubernetes等编排工具的实际经验 • 具有使用Cloud Deployment Manager或CloudFormation或Terraform等基础设施即代码工具的经验 • 熟悉TensorFlow、Extended(TFX)、MLflow或KubeFlow(GCP)等MLOps工具。具备将ML模型部署到生产环境的经验,了解不同模型架构及其基础设施要求的细微差别 • 全面了解网络架构、VPC设计和设置以及云环境中的安全最佳实践是一个加分项。有在数据和ML工作流程中实施身份和访问管理以及其他安全协议的经验 对您有什么好处 • 与北美增长最快的私募股权公司合作 • 在组织的技术堆栈和长期技术启用战略的发展中发挥关键作用 感兴趣吗? 请直接在线申请或发送电子邮件至dkurtz@agilus.ca Agilus感谢所有对此机会表示兴趣的候选人。由于我们收到的简历数量很多,我们可能只能直接回复那些被选中进行面试的候选人。 我们鼓励您定期访问agilus.ca或订阅我们的电子邮件提醒agilus.ca/Account/Register,因为每天都会有新的令人兴奋的就业机会。