数据工程师 - 云原生管道

5天前全职
93.4万 - 122万 / 年 beBeeDataEngineer

beBeeDataEngineer

location 纽约
unsaved
职位描述 我们正在寻找一位熟练的数据工程师,使用生成性人工智能和大型语言模型等新兴技术,构建下一代数据管道和应用程序,跨越各种系统。 您将有机会与内部利益相关者、数据科学家、可视化专家和技术人员合作,开发灵活且可扩展的分析应用程序和数据仓库。我们希望找到一位精通设计、构建和支持API、机器学习服务和框架,以及基础数据仓库技术的人。 您的主要工作将是构建可靠、高效和可扩展的管道,以供LLMs使用,并打造我们的LLM分析愿景。您将在定义团队战略、评估和整合数据模式和技术方面发挥重要作用,并与领域专家和数据科学家共同构建管道。 职责: • 设计、构建和扩展跨各种源系统、分布式环境和下游应用程序的数据管道。 • 深刻理解机器学习的最佳实践和算法。 • 扎实理解数据建模、仓储和架构原则。 • 在优化性能、成本、安全性和规模的同时实施设计模式。 • 与跨职能团队合作,理解数据需求并开发高效的数据获取策略。 • 与技术团队接口,使用云原生数据工程原则从各种源中提取、加载和转换数据。 • 成为数据工程相关技术和设计的主题专家。 • 指导和辅导组织内其他人,基于基础数据工程原则构建可扩展的管道。 • 参与开发冲刺、演示和回顾,与发布和部署一起进行。 • 与支持工程团队建立和管理关系,以有效地将工作产品交付到生产环境。 • 与数据科学家、业务分析师和机器学习基础设施良好合作,连接业务和技术合作伙伴之间的点。 • 为您的代码开发自动化测试,确保与多个系统的兼容性。 • 为开发人员和业务用户创建文档,帮助他们理解产品。 • 在矩阵化组织内与多学科团队协作,利用强大的人际交往能力来应对系统复杂性并高效部署解决方案。 • 部署到基于云的平台,并在必要时排除应用程序、云和配置问题。 • 利用代码和测试生成工具加速功能和组件的交付。 资格要求: • 8年以上数据工程师经验,重点是领导数据工程团队。 • 熟悉GenAI技术,如LLMs、向量数据库或AI驱动的数据管道。 • 能够批判性地思考问题,解读用户偏好与挑战性需求,并有效利用在线和现场资源找到合适的解决方案。 • 在敏捷开发环境中茁壮成长的证明能力,善于吸收反馈并调整优先级。 • 理解基于REST的API、向量化嵌入和检索增强生成AI工作负载组件。 • 具有数据建模、ETL/ELT开发原则、云开发和数据仓库概念的直接经验。 • 了解AWS、Azure、GCP等云技术。 • 了解数据管理基础和数据存储原则。 • 使用Python/SQL或类似编程语言构建数据管道的经验。 • 一般了解云数据工程设计模式和用例。 • 计算机科学、数据科学、统计学、信息学、信息系统或相关领域的学士学位。 福利: 该职位符合公司提供的福利,包括医疗、牙科和视力保险、401(k)、带薪休假、学费报销以及各种其他折扣和福利。 附加要求: • 完全远程:该职位已被指定为完全远程,意味着该职位预计将从非NBCUniversal工作场所贡献。 该职位对外部候选人持续开放。