Databricks研发运营组织正在寻找一位高度积极主动且技术娴熟的技术项目经理(TPM),以领导和监督推动我们尖端AI研究计划的数据标注项目。此角色位于项目管理、数据运营和AI/ML的交汇处,将在确保我们的数据标注工作具有可扩展性、高质量并符合我们的研究和产品团队需求方面发挥关键作用。
您将与研究人员、数据科学家、ML工程师和供应商运营密切合作,推动大规模数据标注和策划工作的端到端生命周期——从策略和规划到执行、交付和质量评估。
职责
• 项目所有权:推动大规模数据标注项目的端到端,从需求范围界定到交付和事后分析。
• 跨职能合作:与AI研究领导、AI研究人员、数据科学家、ML工程师和产品经理合作,定义数据需求、成功指标和标注指南。
• 供应商和劳动力管理:管理外部标注供应商和内部标注团队,包括合同谈判、服务水平协议、质量标准和吞吐量规划。
• 质量与流程:设计和实施强大的质量控制管道、标注工具和反馈循环,以确保大规模数据质量。
• 工具与自动化:与工程团队合作,改进标注基础设施、工作流程和数据管道,以提高效率和可扩展性。
• 数据策略与治理:为数据治理最佳实践做出贡献,包括标注工作流程中的隐私、安全、伦理和合规性。
• 报告与指标:定义和跟踪关键项目指标(成本、质量、速度、体量),并定期向利益相关者和领导层报告进展。
• 内部采用:通过建立入职流程、工作流程和变更管理策略来协调自主AI产品的内部采用。
• 数据质量领导:建立和标准化流程,以测量、监控和提高数据集和标注团队的数据质量。
• 客户参与:与外部客户和研究合作伙伴合作,进行评估研讨会、试点和反馈会,以推动持续改进。
能力和要求
• 具有技术领域的学士或硕士学位(如计算机科学、数据科学、机器学习、信息系统)或同等实践经验。
• 在数据中心或AI/ML环境中拥有7年以上技术项目管理、项目管理或运营经验。
• 对ML开发工作流程、数据管道和标注生命周期有深入理解。
• 有管理大规模数据标注或数据收集工作的经验,包括与第三方供应商合作。
• 熟悉大数据平台(如Apache Spark、Databricks、Hadoop)和数据仓库概念。
• 具备优秀的组织、问题解决和沟通能力,能够影响跨职能利益相关者。
• 拥有推动跨职能团队按时高质量交付复杂技术项目的成功记录。
• 具备优秀的沟通、谈判和分析能力,能够记录标准操作程序和流程。
• 高级SQL工作知识,能够通过即席SQL、报告和仪表板构建和维护分析以跟踪、预测和可视化消费。
• 有进行内部和外部数据和流程根本原因分析的经验,以回答特定业务问题并识别改进机会。
• 自我激励,能够独立工作,也能在团队环境中工作。
• 优先具备良好的GPU技术工作知识及其在生成AI和机器学习中的应用。
• 熟悉大数据技术,如Apache Spark、Delta Lake和MLflow者优先。