计算科学家,人工智能/机器学习与蛋白质设计

4天前全职
100.7万 - 127.8万 / 年 Twist Bioscience

Twist Bioscience

location 旧金山
unsaved
计算科学家,人工智能/机器学习与蛋白质设计(南旧金山,加利福尼亚州,混合工作模式)职位描述 Twist 正在寻找一位人工智能/机器学习科学家加入我们的生物信息学团队,以支持抗体发现、开发和 NGS 分析。您将与研究科学家、软件工程师和数据科学家合作,开发前沿的计算解决方案用于蛋白质设计,帮助加速和扩展 Twist 生物制药解决方案的产品。您将开发基于大型语言模型的解决方案,用于设计新型抗体序列和治疗蛋白,利用 NGS 数据和实验结果来训练和验证模型。我们理想的候选人应在生物学的人工智能/机器学习应用方面具有专业知识,并且熟悉机器学习框架和标准的 NGS 生物信息学工具。强大的沟通能力和独立工作与团队合作的平衡能力是所需的。 您将要做的事情: • 主导基于人工智能/机器学习的解决方案开发,使用大型语言模型(LLMs)和神经网络进行新型抗体序列的设计和优化。 • 构建和部署用于蛋白质工程的机器学习模型,包括序列生成、亲和力优化和可开发性预测。 • 处理和分析 NGS 数据、来自湿实验室检测的元数据(表达、结合数据和可开发性评估)以及大型生物数据集,以创建训练数据集并验证 AI 生成的序列。 • 开发用于存储、查询、处理和可视化生物数据及模型输出的软件解决方案。 • 利用先进的数据科学技术和框架,包括深度学习(PyTorch、TensorFlow)、分析(pandas、numpy、scikit-learn)和可视化(matplotlib、plotly)。 • 在生物制药研发工作流程的各个阶段与内部成员合作,将生物学需求转化为机器学习解决方案并提供技术支持。 • 遵循并建立生物信息学系统的软件开发最佳实践,包括模型版本管理、实验跟踪、部署流程和代码管理。 您将为团队带来: • 计算生物学、机器学习或相关科学学科的博士学位,具有至少 2-5 年相关经验(优先考虑行业经验)。 • 深刻理解用于生物序列设计的 LLM 和神经网络模型,具有模型开发和部署的实践经验。 • 在抗体和/或其他治疗蛋白的 AI 驱动发现和工程应用方面有证明的经验。 • 精通机器学习框架(PyTorch、TensorFlow)并具有蛋白质语言模型(ESM、Ablang、ProtTrans 或类似模型)的经验。 • 在分析生物数据集(NGS、实验检测)、机器学习的数据预处理和利用常见文件格式(FASTA、FASTQ)方面具有丰富经验。 • 理解云计算、MLOps 工作流程、模型部署和 AI 系统的 CI/CD 流程。 关于 Twist Bioscience Twist Bioscience 从零开始合成基因,被称为“编写” DNA。就像孩子们学习阅读和写作一样,基因组革命的下一个发展阶段是能够编写 DNA。 在 Twist Bioscience,我们致力于服务那些正在改变世界的人。在医疗保健、农业、工业化学和数据存储等领域,我们独特的基于硅的 DNA 合成平台提供了客户无法获得的精确度和规模。 Twist Bioscience Corporation 是一个平等机会雇主。Twist Bioscience Corporation 为所有员工和求职者提供平等的就业机会,不论种族、肤色、宗教、性别、性取向、性别身份、国籍、年龄、残疾、遗传特征或任何其他法律保护的类别。 该加利福尼亚州职位的基本现金薪酬如下。除了基本工资外,该职位还可以获得奖金、股权和丰厚的福利套餐。最终薪酬金额由多个因素决定,包括候选人的技能、经验、专业知识和地点,并可能与上述列出的金额有所不同。其他地区的薪酬可能会有所不同。 旧金山湾区薪资范围 $140,085—$177,866 美元