职位名称
高级应用机器学习工程师(音频/音乐生成)
关于该职位
我们正在构建一个以AI为驱动的音乐系统,专注于商业化音频生成。我们的首要任务是确保音乐生成的质量——结构、音乐性、一致性和生产准备。
我们正在寻找一位高级应用机器学习工程师,负责我们MVP的端到端音频生成管道。
这个职位是动手实践且务实的:您将微调开源音乐模型,集成推理管道,并与音频和后端工程师紧密合作,以快速高效地交付可用结果。该职位以合同形式开始(详情如下),对于合适的人选,有转为全职职位的机会。
职位详情
条款:
固定期限(5个月)| 潜在的全职转正机会
薪酬:
$30,000(完整5个月期限)
地点:
混合/现场(加州蒙罗维亚)
您的工作内容
微调开源音乐生成模型。
实现条件控制(每分钟节拍数、调性、情绪、段落、密度)。
训练和部署参数高效的微调(LoRA/适配器)。
构建参考条件生成。
通过分块和续接支持长篇生成。
与后端推理管道和API集成。
与音频DSP工程师合作,确保输出达到生产准备状态。
所需资格
具有丰富的Python和PyTorch经验。
具有音频或语音生成模型的实践经验。
熟悉扩散或自回归生成模型。
有使用或微调开源机器学习模型的经验,熟悉HF接口。
了解音频表示。
有将机器学习模型部署到生产或API环境的经验。
优先技能
熟悉CLAP/音频嵌入或检索辅助生成。
有使用LoRA/PEFT方法的经验。
对音频制作工作流程有基本了解(节奏、调性、音轨、响度)。
有优化推理成本和延迟的经验。
职位目标与目标
可靠地生成音乐连贯、商业友好的提示(30~120秒)。
模型正确响应条件输入,如节奏、调性和情绪。
输出稳定、可重复,并可被后期制作工具下游使用。
系统模块化,准备好与下游模型集成。
资历水平
中高级
雇佣类型
合同
工作职能
工程和信息技术
行业
IT系统定制软件开发