在Toku，我们创造定制的云通信和客户互动解决方案，为企业重新构想客户体验。我们提供端到端的方法，帮助企业克服数字化转型的复杂性，并通过云通信解决方案提供关键任务的客户体验。Toku结合了本地战略咨询专长、定制技术、区域内基础设施、连接性和全球覆盖，以满足大规模运营企业的多样化需求。Toku总部位于新加坡，支持亚太地区及其他地区的客户，并在全球市场不断扩展。作为创始AI工程师，您将领导我们的语音识别能力开发，包括为亚太地区语言和电话环境优化的开源模型做出贡献。您将负责从模型架构到部署的整个机器学习流程，并在Hugging Face和GitHub上发布。这是一个独特的机会，可以构建服务于亚太地区乃至全球数十亿人的技术。要求您的工作内容模型开发与训练 - 设计和实现针对亚太地区语言（英语变体、普通话、泰语、越南语、印尼语等）的电话优化语音识别模型 - 使用PyTorch在本地和云GPU基础设施上开发全面的AI模型训练框架 - 创建和优化数据增强管道，解决电话特定挑战（8kHz音频、编解码器伪影、背景噪音、信噪比优化） - 构建能够处理亚太地区常见代码切换的模型（Singlish、Hinglish、Taglish）亚太地区特定优化 - 解决普通话、泰语、越南语和其他声调语言的挑战 - 针对目标市场的区域口音变化进行优化 - 开发针对亚太地区电话环境的评估基准，包括信噪比和音频质量指标 - 实施低资源语言支持技术基础设施与部署 - 构建可扩展的实时和批处理推理系统 - 创建用于模型演示和测试的容器化应用程序 - 开发与电话系统集成的API - 在本地和云GPU基础设施上部署模型 - 与Toku现有的Llama 8B部署集成以实现语言模型功能开源贡献（未来） - 参与开源发布的准备工作 - 撰写全面的技术文档和用户指南 - 进行性能基准测试和验证研究 - 通过出版物和演讲为更广泛的语音识别社区做出贡献如果您具备以下条件，我们希望听到您的声音必备资格 - 计算机科学、工程或相关技术领域的学士或硕士学位，具有扎实的机器学习基础 - 1-3年机器学习项目的实际经验 - 优秀的Python编程技能 - 具备PyTorch和深度学习模型训练经验 - 熟练处理大型数据集和数据预处理 - 理解语音处理概念和技术 - 具备云平台和GPU计算经验 - 熟悉容器化（Docker）和部署实践优先资格 - 拥有AI项目作品集（高度重视开源贡献） - 熟悉OpenAI Whisper和基于Transformer的架构 - 具有语音转文本或音频处理项目经验 - 具有开源项目开发和协作经验 - 具备强大的技术写作和文档编写技能 - 熟悉至少一种亚太地区语言的语音特征 - 理解电话音频特性（8kHz采样、编解码器伪影、信噪比考虑） - 在语音识别或相关领域有发表历史个人属性 - 独立且具备责任心：能够将项目从构思到完成 - 成长导向：热衷于学习新技术 - 质量导向：致力于编写健壮且文档齐全的代码 - 具备良好的沟通和演讲能力地点： - 这是一个远程/混合角色，需在新加坡、香港或荷兰（首选鹿特丹）工作为什么加入Toku？使命驱动的影响：为亚太地区多样化语言环境的语音AI民主化做出贡献开源领导力：通过对定制模型开发的贡献建立您的声誉技术成长：与经验丰富的工程师合作，开发最先进的语音AI技术区域专长：成为一个服务不足但庞大市场的专家自主权：在支持下承担重大技术挑战福利和津贴：培训和发展、年度奖金和薪资评估、基于地点的医疗保险、20天带薪年假及其他休假津贴等 Toku被LinkedIn评为顶级创业公司，并被《金融时报》评为亚太地区增长最快的500家公司之一。如果您希望成为一家在强劲增长轨迹上的公司的一员，同时解决有意义的现实世界挑战，我们很乐意听到您的声音。

创始人工智能工程师 - 亚太地区语音识别

Homepage