在Toku,我们创造定制的云通信和客户互动解决方案,为企业重新构想客户体验。我们提供端到端的方法,帮助企业克服数字化转型的复杂性,并通过云通信解决方案提供关键任务的客户体验。Toku结合了本地战略咨询专长、定制技术、区域内基础设施、连接性和全球覆盖,以满足大规模运营企业的多样化需求。Toku总部位于新加坡,支持亚太地区及其他地区的客户,并在全球市场不断扩展。
作为创始AI工程师,您将领导我们的语音识别能力开发,包括为亚太地区语言和电话环境优化的开源模型做出贡献。您将负责从模型架构到部署的整个机器学习流程,并在Hugging Face和GitHub上发布。这是一个独特的机会,可以构建服务于亚太地区乃至全球数十亿人的技术。
要求
您的工作内容
模型开发与训练
- 设计和实现针对亚太地区语言(英语变体、普通话、泰语、越南语、印尼语等)的电话优化语音识别模型
- 使用PyTorch在本地和云GPU基础设施上开发全面的AI模型训练框架
- 创建和优化数据增强管道,解决电话特定挑战(8kHz音频、编解码器伪影、背景噪音、信噪比优化)
- 构建能够处理亚太地区常见代码切换的模型(Singlish、Hinglish、Taglish)
亚太地区特定优化
- 解决普通话、泰语、越南语和其他声调语言的挑战
- 针对目标市场的区域口音变化进行优化
- 开发针对亚太地区电话环境的评估基准,包括信噪比和音频质量指标
- 实施低资源语言支持技术
基础设施与部署
- 构建可扩展的实时和批处理推理系统
- 创建用于模型演示和测试的容器化应用程序
- 开发与电话系统集成的API
- 在本地和云GPU基础设施上部署模型
- 与Toku现有的Llama 8B部署集成以实现语言模型功能
开源贡献(未来)
- 参与开源发布的准备工作
- 撰写全面的技术文档和用户指南
- 进行性能基准测试和验证研究
- 通过出版物和演讲为更广泛的语音识别社区做出贡献
如果您具备以下条件,我们希望听到您的声音
必备资格
- 计算机科学、工程或相关技术领域的学士或硕士学位,具有扎实的机器学习基础
- 1-3年机器学习项目的实际经验
- 优秀的Python编程技能
- 具备PyTorch和深度学习模型训练经验
- 熟练处理大型数据集和数据预处理
- 理解语音处理概念和技术
- 具备云平台和GPU计算经验
- 熟悉容器化(Docker)和部署实践
优先资格
- 拥有AI项目作品集(高度重视开源贡献)
- 熟悉OpenAI Whisper和基于Transformer的架构
- 具有语音转文本或音频处理项目经验
- 具有开源项目开发和协作经验
- 具备强大的技术写作和文档编写技能
- 熟悉至少一种亚太地区语言的语音特征
- 理解电话音频特性(8kHz采样、编解码器伪影、信噪比考虑)
- 在语音识别或相关领域有发表历史
个人属性
- 独立且具备责任心:能够将项目从构思到完成
- 成长导向:热衷于学习新技术
- 质量导向:致力于编写健壮且文档齐全的代码
- 具备良好的沟通和演讲能力
地点:
- 这是一个远程/混合角色,需在新加坡、香港或荷兰(首选鹿特丹)工作
为什么加入Toku?
使命驱动的影响:为亚太地区多样化语言环境的语音AI民主化做出贡献
开源领导力:通过对定制模型开发的贡献建立您的声誉
技术成长:与经验丰富的工程师合作,开发最先进的语音AI技术
区域专长:成为一个服务不足但庞大市场的专家
自主权:在支持下承担重大技术挑战
福利和津贴:培训和发展、年度奖金和薪资评估、基于地点的医疗保险、20天带薪年假及其他休假津贴等
Toku被LinkedIn评为顶级创业公司,并被《金融时报》评为亚太地区增长最快的500家公司之一。如果您希望成为一家在强劲增长轨迹上的公司的一员,同时解决有意义的现实世界挑战,我们很乐意听到您的声音。