应用科学家,后训练(LLM, VLM, MLLM)

圣弗朗西斯科 12天前全职 网络
面议
教会人工智能如何进行推理——安全、透明且大规模地进行。 我们如何超越模式匹配,进入真正的机器推理?这个应用科学家职位让你处于这一挑战的中心——开发能够推理、解释其逻辑,并在复杂、高风险行业中做出可验证决策的模型。 你将加入一家资金充足的初创公司,构建特定领域的推理系统和代理人工智能,适用于可靠性和可解释性不可或缺的行业。 你的工作将集中在大型多模态模型的后训练,应用RLHF、DPO和偏好学习的最新技术,使人工智能系统更一致、真实,并与人类推理保持一致。你将设计框架,将原始模型潜力转化为透明、可信的智能。 你将开发和优化后训练管道,实施推理深度和事实准确性的奖励建模,并构建可验证、人类对齐行为的评估框架。通过使用专有和合成数据集,你将进行端到端实验,并将你的方法直接部署到生产中。 你将带来基于变压器的模型训练(LLM、VLM、MLLM)、后训练或对齐(RLHF、DPO、奖励建模)的背景,以及在Python和PyTorch方面的强大实践技能。对推理代理、混合学习和可解释性研究的好奇心将帮助你在这里茁壮成长。 如果你有多模态推理、评估和验证方面的经验,或在对齐或推理系统方面有过研究贡献,将获得加分。 公司已筹集超过2000万美元(A轮融资公告即将发布),并已与财富100强和500强客户合作。由一位曾成功退出十亿美元企业的企业家创立,人工智能团队今年将从11人扩展到40多人。 薪酬:20万–32万美元基本工资(可协商)+奖金+股票+福利 地点:旧金山湾区(目前远程;2026年后混合办公) 如果你对定义人工智能系统如何推理、决策和自我解释感到兴奋——我们期待你的来信。 所有申请者都会收到回复。