职责及角色
1. 负责AI实验室语音技术团队的语音技术,包括TTS、语音压缩编码、语音前端处理等,尤其是基于AIGC算法的基础研究和应用实现。
2. 专注于语音合成、语音转换、少样本/零样本TTS、音频和音乐生成等先进算法的开发,尤其是生成算法,并能将语音识别、音频分析、语音增强等更广泛的语音/音频任务整合在一起。将相关算法结果应用于语音/音乐/音效/音频生成、语音翻译(S2TT,S2ST)、虚拟人等多种场景。
3. 通过跟踪和创新确保算法在行业中的领先地位,并构建语音技术PAAS平台,为腾讯的各种内部业务场景提供服务,包括游戏、社交网络、内容服务、广告、金融、车载助手和企业服务(如腾讯会议、企业微信、起点客服、商通、数职人)等,帮助业务产生实际价值,并创建行业领先的语音应用产品。
4. 持续关注学术界和行业的最新研究动态,参加国际会议和研讨会,并与全球顶尖团队进行交流与合作。
资格要求
1. 计算机科学、人工智能、语音处理、机器学习或相关领域的硕士或博士学位。
2. 至少有4年的语音、自然语言、图像生成、音乐生成、语音翻译、数字人或相关领域的研发经验,并在相关领域的顶级会议或期刊上发表论文。
3. 熟悉深度学习、神经网络以及相关的开源工具和框架(如TensorFlow、PyTorch)。
4. 具备出色的编程技能,熟练掌握Python或其他相关编程语言,有C++或Go语言开发经验者优先考虑。
5. 具备良好的团队合作精神、沟通能力、同理心和问题解决能力,并具有良好的抗压能力。