数据科学家大型语言模型应用

香港 7天前全职 网络
44.5万 - 62.3万 / 年
职位概述 我们正在寻找一位在大型语言模型(LLM)及其应用方面具有丰富专业知识的数据科学家/AI算法工程师,加入我们的AI团队。作为PowerArena的数据科学家,您将参与智能工厂和智能城市的项目,并应对各种挑战。在这个角色中,您将设计、开发和部署基于LLM的最先进解决方案,用于实际工业应用,重点关注知识检索和AI代理等领域。您将与产品、工程和研究团队密切合作,将前沿的LLM和生成式AI模型从原型推向生产。 主要职责 • 研究、设计和实施用于工业解决方案的LLM和生成式AI应用。 • 开发和优化LLM应用管道,包括数据准备、提示工程、推理和响应后处理。 • 设计和构建稳健的基于LLM的代理,包括工具使用能力、规划和记忆模块。 • 开发和管理知识库和检索增强生成(RAG)系统,用于特定领域的信息检索。 • 与部署和软件工程师合作,将模型集成到可扩展、低延迟的系统中。 • 与领域专家合作,定义每个项目/功能的范围。 • 收集、整理和预处理大规模文本数据集,用于微调和知识库填充。 • 基准测试和评估应用性能;进行消融研究并推动准确性、相关性和稳健性的改进。 • 及时了解LLM、生成式AI和上下文工程的最新进展,并应用于解决业务问题。 • 与团队成员分享技术知识。 资格要求 • 计算机科学、电气工程或相关领域的硕士或博士学位(或同等的实际经验)。 • 在使用大型语言模型(LLM)开发和部署应用方面有丰富经验。 • 具备提示、上下文工程和微调技术的基本能力。 • 具有开发基于LLM的代理和知识库/RAG系统的经验。 • 熟悉LoRA(低秩适应)和知识蒸馏等模型效率技术。 • 精通Python等编程语言,并熟悉相关库(如PyTorch、TensorFlow、Hugging Face Transformers)。 • 优秀的问题解决能力,能够独立工作并作为团队的一员。 附加资格 • 熟悉MLOps、模型监控和LLM的管道自动化。 • 熟悉视觉模型和计算机视觉解决方案。 • 具有智能工厂、智能城市或工业AI用例的背景。 • 对开源LLM或AI代理项目的贡献。 • 熟悉工业4.0应用。 我们提供 • 灵活的工作环境 • 具有竞争力的薪资和福利待遇。 • 参与具有实际影响力的前沿项目的机会。 • 协作和创新的工作环境。 • 职业发展和培训机会。