职位概述
我们正在寻找一位在大型语言模型(LLM)及其应用方面具有丰富专业知识的数据科学家/AI算法工程师,加入我们的AI团队。作为PowerArena的数据科学家,您将参与智能工厂和智能城市的项目,并应对各种挑战。在这个角色中,您将设计、开发和部署基于LLM的最先进解决方案,用于实际工业应用,重点关注知识检索和AI代理等领域。您将与产品、工程和研究团队密切合作,将前沿的LLM和生成式AI模型从原型推向生产。
主要职责
• 研究、设计和实施用于工业解决方案的LLM和生成式AI应用。
• 开发和优化LLM应用管道,包括数据准备、提示工程、推理和响应后处理。
• 设计和构建稳健的基于LLM的代理,包括工具使用能力、规划和记忆模块。
• 开发和管理知识库和检索增强生成(RAG)系统,用于特定领域的信息检索。
• 与部署和软件工程师合作,将模型集成到可扩展、低延迟的系统中。
• 与领域专家合作,定义每个项目/功能的范围。
• 收集、整理和预处理大规模文本数据集,用于微调和知识库填充。
• 基准测试和评估应用性能;进行消融研究并推动准确性、相关性和稳健性的改进。
• 及时了解LLM、生成式AI和上下文工程的最新进展,并应用于解决业务问题。
• 与团队成员分享技术知识。
资格要求
• 计算机科学、电气工程或相关领域的硕士或博士学位(或同等的实际经验)。
• 在使用大型语言模型(LLM)开发和部署应用方面有丰富经验。
• 具备提示、上下文工程和微调技术的基本能力。
• 具有开发基于LLM的代理和知识库/RAG系统的经验。
• 熟悉LoRA(低秩适应)和知识蒸馏等模型效率技术。
• 精通Python等编程语言,并熟悉相关库(如PyTorch、TensorFlow、Hugging Face Transformers)。
• 优秀的问题解决能力,能够独立工作并作为团队的一员。
附加资格
• 熟悉MLOps、模型监控和LLM的管道自动化。
• 熟悉视觉模型和计算机视觉解决方案。
• 具有智能工厂、智能城市或工业AI用例的背景。
• 对开源LLM或AI代理项目的贡献。
• 熟悉工业4.0应用。
我们提供
• 灵活的工作环境
• 具有竞争力的薪资和福利待遇。
• 参与具有实际影响力的前沿项目的机会。
• 协作和创新的工作环境。
• 职业发展和培训机会。