数据科学家 [自然语言处理]

15个月前全职
Ahrefs

Ahrefs

location 新加坡
unsaved
让我们从一些数字开始: • H100 SXM: 504(SuperPod) • H100 PCI: 128 • A100 SMX: 120 • CPU: 600K个核心 • SSD: 350pb • HDD: 33pb 这是很大的计算能力,那么我们为什么需要它呢? 我们正在从头开始构建Yep,一个搜索引擎和LLM。为了以最高水平进行,我们投资了所有这些硬件,以至于我们的超级节点单独在linpack中达到20 PFlops,在世界超级计算机中排名第30位... 是的,我们是认真的! 让我们利用这个计算能力! 你的职责 在这个小而精干的团队中,你将有机会在前沿研究中蓬勃发展,并将其转化为现实影响力。我们正在寻找一位充满活力的数据科学家加入我们创新的团队,帮助塑造我们产品的未来。 • 参与数据准备和模型训练: • 深入研究大型语言模型的世界,并在数据准备和模型训练方面发挥你的魔力。 • 保持前沿: • 通过密切关注和尝试最新的自然语言处理和计算机视觉的趋势和进展,保持领先。 • 评估新兴模型和框架,确定它们对我们产品的潜在影响。 • 算法开发: • 积极发现搜索和SEO中的新机会,并制定新算法来解决它们。 • 与工程团队合作: • 与我们的前端和后端工程团队密切合作,实施、部署和维护生产系统。 • API开发: • 准备好在必要时开发和部署API以增强我们产品的功能。 作为回报,你将有机会加入我们小而紧密的团队,并获得无与伦比的计算能力,这是你在其他地方找不到的机会。 你将有机会参与人工智能、自然语言处理和计算机视觉交叉领域的前沿项目。 你将有机会塑造我们产品的未来并产生真正的影响。如果你是一位数据科学家、人工智能工程师、自然语言处理工程师、机器学习工程师或者对自然语言处理、计算机视觉、机器学习充满热情,并且有将研究转化为现实的动力,我们很乐意听到你的声音!加入我们,成为一个推动技术和创新边界的团队的一员。 基本要求 • 最好拥有任何数量学科的硕士学位:应用数学、计算机科学、统计学等。 • 最好拥有至少三(3)年的自然语言处理、计算机视觉、搜索、信息检索方面的实际经验。 • 有C/C++、Python、SQL(clickhouse方言是一个加分项)、Git、CI/CD的经验。 • 具备统计学基础知识(线性代数)、机器学习算法(监督分类/回归/LTR,无监督KNN/聚类)和深度学习模型(LLM/LMM系列等)的知识。 • 有使用Pytorch、TensorFlow等库进行机器学习模型构建、评估和推断的经验。有解决计算机视觉/自然语言处理(或多模态)、LTR、信息检索(例如候选生成)或推荐任务的经验者优先。 • 强大的人际交往和沟通能力。 我们是谁 Ahrefs构建在线SEO工具,并创建免费的教育材料,帮助全球数百万个网站所有者从搜索引擎获取更多流量。 十多年来,Ahrefs一直在爬行网络,存储和处理千兆字节的数据,并调整简单直观的用户界面。它现在被广泛认为是营销专业人士必备的工具,也是小企业主的可信赖伙伴。 Ahrefs的工具和功能涵盖了大多数基本的SEO需求,如竞争对手研究、关键词研究、网站审核、排名跟踪等等。 该公司成立于2010年,由Dmytro Gerasimenko创立,总部位于新加坡。 你将获得什么 • 有竞争力的薪酬福利 • 轻松和繁荣的工作氛围 • 一流的工作场所设备(硬件和工具) • 其他福利和额外待遇 Ahrefs不与代理机构或第三方招聘解决方案合作。如果我们需要帮助,我们会告诉你! 我们是谁 我们的数据科学团队面临着一个巨大而令人兴奋的挑战:构建机器学习模型,改进Fairsearch的体验。当用户进行搜索时,他们想要看到什么,什么使一篇内容比另一篇更好或更相关-这些是决定我们如何重新排列网页的重要问题。听起来有趣吗?我们很想听到你的声音。