首席机器学习工程师(文档AI自然语言处理,合同)

伦敦 6天前全职 网络
面议
Intelance是一家专注于建筑和人工智能咨询的公司,与受监管的高信任环境(医疗保健、制药、生命科学、金融服务)中的客户合作。我们正在组建一个精简的高级团队,为一家总部位于英国的人类基因检测组织提供一个AI辅助的临床工具。我们正在寻找一位能够将混乱的现实世界文档转化为可靠且可解释的模型输出的首席ML工程师。这是一个合同/自由职业的兼职角色(每周2-3天),需要与我们的AI解决方案架构师和数据工程师密切合作。 任务 - 设计和实现AI辅助标记工具的ML/NLP核心,该工具可以: - 通过OCR解析管道摄取临床风格的报告(PDF/Word) - 提取相关内容和特征 - 应用混合评分方法(规则LLM/变压器模型) - 输出分数、理由和置信水平。 - 构建和迭代提示/少样本设置和规则层,以便模型行为一致、可预测,并易于向评估员解释。 - 与数据工程师合作,定义和使用来自OCR/管道的干净结构化输入(模式、验证检查、日志记录)。 - 实施评估管道:真实值比较、错误分析、按标准指标和漂移/稳健性检查。 - 在商定的约束内优化模型的准确性、稳定性和成本(延迟、令牌使用、吞吐量)。 - 支持架构师和合规负责人设计可解释性和审计:记录什么、向评估员展示什么以及保留什么证据以进行验证。 - 将模型打包在干净的接口后面(例如Python服务、API、批处理作业),以便它们可以与系统的其余部分集成。 - 参加与客户的技术研讨会,演示真实示例中的行为并收集反馈。 - 清晰地记录您的工作:实验、模型选择、提示模式、已知限制和推荐的操作边界。 要求 必须具备 - 4年实际的机器学习/NLP工程经验(不仅仅是研究)。 - 强大的Python技能和至少一种现代ML/NLP技术栈的经验(PyTorch、TensorFlow、HuggingFace、spaCy等)。 - 文档AI/文本处理的实际经验:PDF、OCR输出、长文本分类或文档评分。 - 对LLM和基于提示的工作流有扎实的理解(例如OpenAI/Azure OpenAI、Anthropic或类似)以及如何将它们与规则/传统模型混合。 - 构建评估管道的经验:测试集、指标、错误分析和数据驱动的模型选择。 - 能够在可解释性、可审计性和一致性比前沿新颖性更重要的环境中工作。 - 能够在一个小型高级团队中独立工作,承担问题的责任,并清晰地沟通权衡。 - 每周可工作2-3天,主要在英国或接近的欧洲时区远程工作。 优先考虑 - 在医疗保健、生命科学、临床报告或受监管行业的工作经验。 - 有Azure(Azure ML、Azure Functions、Azure OpenAI、blob存储)或其他主要云提供商的经验。 - 接触过验证或质量框架(例如GxP、ISO 15189、UKAS、NHS IG)。 - 熟悉MLOps实践(版本控制、部署、监控),即使是轻量级的。 福利 - 真实影响:构建一个生产AI系统,将支持人类基因检测的外部质量评估。 - 精简的高级团队:直接与经验丰富的AI解决方案架构师、数据工程师和领导团队合作,决策快速,官僚主义最小化。 - 远程优先灵活:可以在任何地方工作,与英国工作时间兼容,计划工作负荷为每周2-3天。 - 合同/自由职业:具有竞争力的日费率,如果试点成功,有可能延长到进一步的阶段和附加计划。 - 有机会帮助定义可重用的ML/NLP组件,Intelance将在多个受监管的AI项目中部署。 我们会亲自审查每一个申请。如果有良好的匹配,我们将安排一个简短的电话,讨论项目期望和下一步。