经理,机器学习平台和基础设施

温哥华 7天前全职 网络
104.3万 - 139万 / 年
您的工作 DarkVision正在寻找一位实干的工程经理来领导我们的ML平台和基础设施团队。您将负责推动我们先进声学成像技术的计算和数据系统的战略规划、架构和可靠性。 DarkVision的超声成像系统创造了世界上最大的超声数据集,单次扫描接近PB级别。检测数百公里资产中的毫米级缺陷需要一个强大、可扩展且高效的平台。您将领导团队构建我们的AI引擎,弥合硬件、云基础设施和统计数据验证之间的差距。 该职位位于我们位于不列颠哥伦比亚省北温哥华的总部,员工可以享受包括设备齐全的健身房、壁球场、蒸汽室、攀岩墙等在内的各种设施! 我们的团队 您将领导ML平台和基础设施团队,这是成像与AI大组中的一个专业单位。您的直接下属包括云基础设施工程师、MLOps工程师和数据科学家。您将与应用ML团队密切合作,确保他们的算法拥有从实验到生产所需的计算资源和清洁数据。 您的职责 - 团队领导与战略: 管理、指导和发展多元化的工程师和科学家团队。您将为我们的ML基础设施设定技术路线图,平衡即时生产需求与长期可扩展性目标。 - 平台架构: 设计大规模批处理所需的云(AWS)和本地系统。您将就计算编排(Kubernetes)、存储和成本优化做出高层次决策。 - 运营卓越: 监督CI/CD管道和MLOps实践的发展。您将确保我们的训练和推理工作流是可复现的、受监控的和安全的。 - 数据完整性与验证: 监督数据科学职能,确保我们模型的统计有效性。您将倡导数据完整性审核和实验设计框架,以向客户证明我们技术的可靠性。 - 跨职能合作: 作为软件工程、应用ML和数据分析团队之间的桥梁,确保基础设施决策支持公司的产品交付目标。 您的背景(基本资格) - 计算机科学、工程或相关领域的学士或硕士学位。 - 5年以上软件、基础设施或数据工程经验。 - 2年以上领导或管理技术团队的经验。 - 深刻理解云基础设施(AWS)和容器编排(Kubernetes)。 - 精通Python并熟悉机器学习生命周期。 加分项 - 管理多学科团队(结合DevOps/Infra与数据科学)的经验。 - 拥有工作流编排工具(如Prefect、Dagster、Airflow)的实际经验。 - 处理PB级数据集的经验。 - 熟悉分布式计算框架(如Ray、Dask)。 - 在工业环境中处理数据治理、安全和合规的经验。 - 实用的领导风格,能够判断何时构建定制解决方案与使用托管服务。 - 出色的沟通技巧,能够向非技术人员清晰表达复杂的基础设施限制。 一般薪资范围 对于此职位,我们预计每年支付$150,000到$200,000。该职位有资格获得可变薪酬,以货币奖金或其他形式发放。 在Koch公司,我们是企业家。这意味着我们公开挑战现状,寻找创造价值的新方法,并因个人贡献而获得奖励。为某个职位提供的任何薪酬范围都是根据可用的市场数据估算的。实际金额可能高于或低于所提供的范围,具体取决于每位候选人的知识、技能、能力和地理位置。如果您有疑问,请与您的招聘人员讨论我们的薪酬理念的灵活性和细节。