我们的客户是一家在科学发现前沿的知名研究机构,正在寻找一位在基因组学机器学习领域具有深厚专业知识的首席数据科学家。这是一个完全远程的职位,允许您从任何地方为突破性研究做出贡献。您将领导开发和实施先进的机器学习模型,以分析复杂的基因组数据集,推动加速生物学理解和治疗开发的见解。该角色需要统计严谨性、计算专业知识和生物学领域知识的独特结合。您将处理海量数据集,解决具有挑战性的科学问题,并与世界一流的生物学家、遗传学家和计算科学家合作。
职责:
设计、开发和部署复杂的机器学习和统计模型,用于分析大规模基因组和转录组数据。与生物学家和遗传学家密切合作,理解研究问题并将其转化为数据驱动的分析方法。识别和实施最先进的算法,用于变异检测、基因表达分析、通路分析和疾病关联研究等任务。开发数据预处理、特征工程和模型评估的流水线,采用最佳实践。探索和应用新颖的机器学习技术,包括深度学习,以揭示生物数据中的复杂模式。撰写并贡献于领先的同行评审期刊的科学出版物,并在国际会议上展示研究成果。指导初级数据科学家和生物信息学家,培养创新和科学卓越的文化。确保所开发方法和代码的可重复性和可扩展性。为组织内数据科学计划的战略方向做出贡献。处理大型、多样化的数据集,确保数据完整性和安全性。为代码、模型和分析过程开发和维护稳健的文档。
资格:
在生物信息学、计算生物学、统计学、计算机科学或相关定量领域拥有博士学位,重点关注机器学习和基因组学。博士后至少有7年的相关研究和开发经验,其中相当一部分专注于基因组数据分析。在将机器学习技术(例如,监督/无监督学习、深度学习、贝叶斯方法)应用于生物学问题方面表现出专业知识。精通Python或R等编程语言,并具有相关库(如Scikit-learn、TensorFlow、PyTorch、Bioconductor)的经验。拥有常见基因组数据类型(如WGS、WES、RNA-Seq、ChIP-Seq)的实际操作经验。对统计原理和实验设计有深入理解。出色的分析、解决问题和批判性思维能力。卓越的沟通和演示技能,能够向技术和非技术观众解释复杂概念。证明能够在远程研究环境中独立和协作工作。
这是一个独特的机会,可以在远程的情况下推进您的职业生涯,并为关键的科学突破做出贡献,工作地点位于加拿大安大略省渥太华。