数据科学家 NLP 和 AI 经验：- 7年以上地点：- 休斯顿，德克萨斯州 - 每周至少两天在办公室对你有什么好处？作为数据科学家 NLP 和 AI，您将成为一个敏捷团队的一员，专注于通过开发先进的 NLP 模块、集成 LLM 和代理工作流，并利用 AWS 大数据技术来增强临床数据处理和可用性，构建智能医疗解决方案。职责：- - 使用 AI 驱动的 NLP 技术和先进的机器学习模型分析和处理临床文本数据。 - 通过结合尖端的机器学习和深度学习算法，包括利用大型语言模型（LLM）和像 LangGraph 这样的工具来改进当前工作流，以适应医疗环境中的复杂 AI 代理工作流。 - 使用 Python 等编程或脚本语言在 NLP 开发团队中开发 NLP 模块。 - 对文本数据输入进行预处理和质量分析，并验证 NLP 输出的性能。 - 为 NLP 模块创建系统化的测试程序、错误检查机制和用户手册。 - 构建基础设施，以便从包括 MCP 服务器在内的多种来源中优化数据的提取、转换和加载，使用 SQL 和 AWS 大数据框架如 EMR 和 Spark/pySpark。 - 与工程团队合作，确保使用 SQL 和 AWS 大数据技术实现可扩展和高效的数据工作流。 - 应用 AWS 服务的工作知识，特别是 AWS Bedrock，开发生成式 AI 应用。 - 在 NLP 和 AI 工作流中利用 PostgreSQL 或 MySQL 等关系数据库进行数据存储和检索。教育资格：- - 工程学位 BE/ME/BTech/MTech/BSc/MSc。 - 拥有多种技术的技术认证是可取的。技能：- 必备技能 - 熟练使用 Python 和脚本语言进行 NLP 和机器学习开发。 - 对临床 NLP 技术有深刻理解，并具有机器学习和深度学习模型的经验。 - 拥有大型语言模型和代理工作流工具（如 LangGraph）的实际操作经验。 - 精通 SQL 和大数据技术，包括 AWS EMR 和 Spark/pySpark。 - 对 AWS 服务的实际知识，特别是用于生成式 AI 应用的 AWS Bedrock。 - 具有使用 PostgreSQL 或 MySQL 等关系数据库的经验。良好技能：- - 熟悉医疗保健中的生成式 AI 应用及相关用例。 - 了解医疗数据标准和术语，如 HL7、FHIR 和 CCDA。 - 具有创建详细文档、用户手册和技术规范的经验。 - 在 NLP 输出的自动化测试和验证框架方面有背景。 - 能够与包括工程和产品在内的跨职能团队有效合作。 - 接触过 LangChain 或类似框架，用于构建智能代理工作流。

数据科学家 NLP & AI - W2 合同

Vipany Global