公司描述
Persistent Technology, Inc.为各个领域提供定制解决方案,包括军事和退伍军人的健康。公司在支持国防部和退伍军人事务部方面拥有丰富的经验,并通过应用尖端技术、项目管理、培训和分析解决方案来解决问题,并取得了令人满意的成果。我们的目标是帮助客户以最有效和高效的方式完成他们的任务。
初级自然语言处理工程师角色为期3个月的合同。
职位描述:
作为一名对医疗数据有深厚背景的热情自然语言处理工程师,您将开发创新解决方案,从电子医疗记录(EHRs)中提取有价值的信息,利用您在自然语言处理和医学信息学方面的专业知识,推进医疗数据分析并帮助改善患者护理。
申请人必须具备人工智能和自然语言处理经验
最低资格要求:
•扎实的编程技能,最好是Python和SQL等语言
•良好的机器学习基础知识
•熟练掌握机器学习技术,包括深度学习框架和算法(Pytorch,TensorFlow)
•良好的英语沟通能力和组织能力,能够与跨职能团队合作
•优秀的人际交往能力,能够独立工作和团队合作
•良好的项目管理技巧和经验
•计算机科学(算法和数据结构)方面的扎实背景
•目前在攻读计算机科学、数据科学或工程学学士学位的第三或第四年
•能够编写干净、高效和文档完整的代码。
•深入理解人工深度神经网络架构、算法、基础设施、工具和实践,最好是在自然语言处理领域。
•模型优化技术-熟悉测试和超参数优化工具和框架。
•2年以上的机器学习经验
•端到端经验-拥有从创意阶段到设计、架构、编码、集成、部署和监控阶段的功能经验
首选资格:
•目前在攻读计算机科学、数据科学或工程学硕士学位或博士学位
•优秀的问题解决能力,能够将NLP技术应用于不同的医学领域。
•熟悉NLP库(Transformers、Huggingface和John Snow Labs)
•具有构建NLP应用程序的实际经验
•在MLOps方面有良好的记录
•具有信息检索和/或大规模数据挖掘经验者优先
•具有实体识别、文本摘要经验者优先
•具有提供和优化深度学习模型的经验将是一个优势
•在开发NLP解决方案方面具有丰富的经验,最好是在医疗保健和电子健康记录的背景下。
•有与SNOMED、ICD-10CM、LOINC、CPT等领域本体一起工作的经验
•在医疗数据项目上处理医疗数据的经验
•熟悉以下技术:Spark、Databricks、Azure、AWS
样例职责:
NLP算法开发和实施:
•开发和实施针对处理电子健康记录(EHR)的NLP算法和模型。
•设计和优化信息提取、实体识别、文本摘要和医学文本数据结构化系统。
•自主管理项目时间表、里程碑和可交付成果,确保项目按时成功完成。
•及时了解NLP、机器学习和医疗技术的最新进展,推动团队创新。
•识别风险和潜在障碍,并积极制定应对策略。
数据预处理、模型训练和性能评估:
•进行数据预处理和清理,确保NLP模型的高质量输入。
•使用机器学习和深度学习技术以及大规模医学文本数据集训练和微调NLP模型。
•训练开发的模型并运行评估实验。
•从EHR中提取相关的医学信息,实施和维护用于EHR数据高效自动处理的数据流水线。
•通过阅读研究论文和跟踪相关的开源项目,及时了解NLP的最新趋势和进展。
•构建和改进我们的工程基础设施,以支持应用算法研究和开发。日常工作中,您的一些职责将包括:
•为与客户的各种数据系统集成的ETL和服务的设计、开发、测试和维护。
•找出数据流水线和机器学习流水线中的性能瓶颈并解决它们
•为复杂的ML问题开发端到端的算法解决方案-从研究和训练模型,到设计、开发、评估和优化。
•在大规模分布式系统中开发训练和推理引擎流水线。
•将NLP和数据相关的ML/DL算法方法转化为高效和优化的生产就绪解决方案。
•设计、实施和优化ML/DL和研究流水线,以提高算法的性能。
•将高级产品需求转化为技术需求
•进行算法改进的头脑风暴和原型制作。
•设计能够允许我们总结患者健康记录、推断护理质量等的信息性NLP特征。
•与工程师合作,高效地将算法与后端生产服务集成。
•与产品团队合作,定义解决方案并将其整合到路线图中
•帮助我们使用云中的GPU和现代分布式处理工具扩展我们的服务(AWS/Azure)
•改进并帮助定义数据团队的流程和工具