数据科学家 – NLP & AI(医疗保健)
职位:5个
地点:休斯顿,德克萨斯州(混合模式 – 每周3天现场)
经验:12年以上
关于该职位
作为高级数据科学家 – NLP & AI,您将成为一个敏捷的医疗保健AI团队的一员,专注于构建智能临床数据解决方案。该职位涉及开发高级NLP模型,集成大型语言模型(LLM)和代理工作流,并利用AWS大数据平台改进临床数据处理、洞察和可用性。
这是一个面向具有丰富医疗保健NLP、LLM和云数据工程专业知识的经验丰富专业人士的实践角色。
主要职责
• 使用AI驱动的NLP技术和高级机器学习/深度学习模型分析和处理临床文本数据。
• 通过将LLM和代理AI框架(例如LangGraph)应用于医疗保健用例,设计、修改和增强现有工作流。
• 使用Python和相关脚本语言开发和维护NLP模块。
• 执行数据预处理、质量分析和NLP输出的性能验证。
• 为NLP模块创建系统化的测试程序、错误处理机制和文档。
• 构建和优化ETL管道,以从包括MCP服务器在内的多种来源获取和处理数据。
• 利用SQL和AWS大数据技术(EMR,Spark/pySpark)支持可扩展的数据工作流。
• 与工程和平台团队密切合作,确保效率、可扩展性和可靠性。
• 利用AWS服务,特别是AWS Bedrock,开发和部署生成式AI解决方案。
• 使用关系数据库(如PostgreSQL或MySQL)进行数据存储和检索。
所需技能和经验
• 在数据科学、NLP或AI相关职位上有12年以上经验。
• 精通Python进行NLP和机器学习开发。
• 拥有临床NLP经验,包括ML和深度学习方法。
• 拥有大型语言模型(LLM)和代理工作流(例如LangGraph)的实际经验。
• 精通SQL和AWS大数据平台,包括EMR和Spark/pySpark。
• 具备AWS服务的实际知识,特别是AWS Bedrock用于生成式AI。
• 有使用关系数据库(PostgreSQL,MySQL)的经验。
优先技能
• 在医疗保健环境中构建生成式AI解决方案的经验。
• 熟悉医疗保健数据标准,如HL7、FHIR和CCDA。
• 在NLP模型的自动化测试和验证框架方面的背景。
• 有创建技术文档、用户手册和规格说明的经验。
• 接触过LangChain或类似的AI编排框架。
• 具备与跨职能团队(工程、产品、数据)的强大协作能力。
教育背景
• 工程或科学学位(BE / ME / BTech / MTech / BSc / MSc)。
• 相关技术的技术认证是加分项。