数据科学家 - 大型语言模型 (LLM)

14个月前全职
ShyftLabs

ShyftLabs

location 多伦多
unsaved
职位概述: ShyftLabs正在寻找一位具有大型语言模型(LLM)解决方案专业知识的优秀数据科学家加入我们充满活力的团队。作为我们研发团队的重要成员,您将负责设计、实施和优化最先进的LLM解决方案,以应对复杂的业务挑战。理想的候选人应具备机器学习、自然语言处理和软件开发方面的丰富背景,并具有交付高质量人工智能解决方案的成功经验。 ShyftLabs是一家成长中的数据产品公司,于2020年初成立,主要与财富500强公司合作。我们通过创新专注于创建价值,提供旨在帮助各行业企业加速增长的数字解决方案。 职位描述: 在大型语言模型领域进行前沿研究,包括探索新颖的架构、算法和技术,以提高模型性能、效率和可伸缩性。 设计、开发和实施针对特定业务用例的先进LLM解决方案,利用迁移学习、微调和模型蒸馏等技术。 与数据工程师和领域专家合作,对大规模数据集进行预处理和筛选,用于LLM的训练和评估。进行特征工程和数据增强,增强模型的鲁棒性和泛化能力。 使用最先进的技术和框架(如TensorFlow、PyTorch)在多样化数据集上进行LLM的训练和微调。开发稳健的评估指标和方法,评估模型的性能、准确性和效果。 部署和优化:将LLM解决方案部署到生产环境中,确保可扩展性、可靠性和性能。根据硬件限制和资源限制,优化模型的推理速度、内存占用和能源效率。 与跨职能团队密切合作,包括软件工程师、产品经理和业务利益相关者,了解需求,定义项目目标,并通过演示、报告和文档传达有价值的见解和解决方案。 及时了解LLM研究、机器学习算法和人工智能技术的最新发展。不断尝试新的方法、工具和框架,增强LLM解决方案的能力,并推动组织内的创新。 基本资格要求: 计算机科学、电气工程、统计学、数学或相关领域的硕士或博士学位。 至少4年以上Python开发经验,特别关注数据科学、机器学习和人工智能。 扎实的机器学习、深度学习和自然语言处理的理论和实践知识。 具有使用TensorFlow或PyTorch等深度学习框架开发和微调大型语言模型(如GPT、BERT、XLNet)的实际经验。 精通Python等编程语言,具有软件开发和版本控制工具(如Git)的经验。 扎实的数据预处理、特征工程和模型评估技术的理解。 有云计算平台(如AWS、Azure、Google Cloud)和分布式计算框架(如Apache Spark)的经验者优先。 出色的问题解决能力、分析思维和注重细节。 良好的沟通和协作能力,能够在快节奏、多学科团队环境中有效工作。 在相关会议、期刊或开源项目上发表论文或做出贡献将会有优势。 我们为员工提供具有竞争力的薪资和强大的医疗保险和福利计划。该职位最好是混合型,每周有2天在多伦多市中心办公室工作。我们以员工的成长为傲,提供广泛的学习和发展资源。 ShyftLabs是一家致力于创造安全、多样化和包容性环境的机会均等雇主。我们鼓励所有背景的合格申请人,包括种族、宗教、残疾状况、性别认同、性取向、家庭状况、年龄、国籍和教育水平。如果您接到面试邀请并在面试过程中需要协助,请告知我们。