高级数据科学家

14个月前全职
Grid Dynamics

Grid Dynamics

location 纽约
unsaved
我们的客户是一家总部位于硅谷、在全球范围内开展业务的世界最大科技公司之一。在这个项目中,我们正在使用最先进的大数据技术开发一个处理PB级数据的高性能数据分析平台。我们正在寻找一位热情并精通技术的高级数据科学家,他渴望参与设计和实施一流的大数据解决方案,该解决方案将在大规模部署。 职责: • 设计、开发和监督实施评估LLM模型训练中使用的数据质量的流程和工具。 • 创建评估数据准确性、一致性和相关性的指标和关键绩效指标。 • 与工程团队合作开发自动逻辑检查,以识别训练数据中的不一致和潜在问题。 • 领导将质量流程整合到现有数据流程中。 • 与数据科学家合作,审查注释数据并制定持续数据质量改进策略。 • 提供反馈回路,并确保数据质量与注释指南的一致性。 • 与机器学习工程师合作,确定数据质量变化如何影响LLM模型的性能。 • 根据模型性能分析,推荐对数据收集、预处理和利用进行调整。 • 了解数据质量管理领域的最新趋势和进展。 • 根据行业最佳实践,推荐并实施对质量流程、工具和方法论的改进。 要求: • 在机器学习模型训练的数据质量管理方面拥有7年以上的设计/测试/实施/咨询经验 • 对机器学习原理有深入的了解,特别是在自然语言处理和LLM的背景下 • 对相关编程语言和工具(如Python、SQL)有基本的了解 • 具有项目管理和跨职能合作的经验 • 出色的分析、解决问题和组织能力 • 能够在业务、产品和技术挑战方面进行战略性思考的能力 • 具备良好的口头和书面沟通能力,能够在内部和外部组织以及虚拟团队之间有效工作 我们提供: • 参与最前沿的项目 • 与积极进取的团队合作 • 有竞争力的薪资 • 灵活的工作时间安排 • 福利待遇包括医疗保险、体育活动 • 公司社交活动 • 职业发展机会 关于我们:Grid Dynamics(纳斯达克股票代码:GDYN)是一家数字原生技术服务提供商,为财富1000强公司加速增长并增强竞争优势。Grid Dynamics提供全渠道客户体验、大数据分析、搜索、人工智能、云迁移和应用现代化的数字化转型咨询和实施服务。Grid Dynamics通过使用技术加速器、敏捷的交付文化和全球工程人才库实现高速上市、质量和效率。Grid Dynamics成立于2006年,总部位于硅谷,在美国、英国、荷兰、墨西哥以及中东欧地区设有办事处。要了解更多关于Grid Dynamics的信息,请访问www.griddynamics.com。关注我们的Facebook、Twitter和LinkedIn页面。