职责
团队介绍:字节跳动搜索团队主要负责抖音、头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们采用最前沿的机器学习技术进行端到端建模,并不断创新和突破。同时,我们专注于分布式系统和机器学习系统的构建和性能优化,从内存、磁盘等优化到索引压缩、召回、排序等算法探索,充分为学生提供成长机会。
1. 参与字节跳动搜索引擎的研发工作,使用最前沿的机器学习算法和海量数据,打造最令人激动的技术,为用户提供最佳的搜索体验。
2. 参与头条/抖音等产品的搜索研发工作,为大量用户提供服务。
3. 参与搜索算法的改进。可能的方向包括:(1)NLP:将行业最先进的自然语言处理技术应用于搜索算法的改进,包括纠错、分词、重写、词权重和意图识别等。(2)排序:解决数百亿网页的排序问题,克服基本检索、相关性、意图理解、权威性和时效性等全球性问题。(3)页面分析和摘要:从数百亿网页中提取最有趣的内容,进行结构化字段提取、智能摘要生成、转码等工作,优化搜索体验。(4)链接分析:从数万亿链接中找到最有价值的网页,优化链接质量、索引质量、垃圾欺诈识别、调度策略等。(5)智能问答:探索最先进的阅读理解和语义提取技术,开发开放领域的智能问答系统,直接满足用户在搜索结果的第一位置的查询需求。
资格要求
1. 出色的问题分析和解决能力,能够从复杂的数据中找到问题的本质。
2. 出色的机器学习(深度学习)、自然语言处理和数据挖掘基础,能够将其很好地建模和应用于解决搜索问题。
3. 较强的编码能力,熟悉数据结构和基本算法技能。
4. 熟悉Linux开发环境,熟练使用C++和Python语言。
5. 对于具有主流大规模搜索引擎算法优化经验的人员将给予额外加分。