我们正在与一家处于创新前沿的全球领先技术公司合作，为其AI团队招聘一个关键职位。这是一个推进大型语言模型（LLM）和多模态AI在关键工业领域实际应用的独特机会，与顶级研究人才并肩工作。关于该职位：您将在从研究、训练到优化和实际部署的整个生命周期中发挥关键作用。您的工作将弥合最先进的AI研究与有影响力的工业解决方案之间的差距，直接塑造下一代AI如何融入复杂的商业环境。主要职责：领导垂直领域特定大型模型的训练、微调（SFT）和系统部署。研究并实施先进的模型压缩和优化技术（剪枝、量化、蒸馏）以提高推理效率。设计和开发用于动态场景中增强AI推理的RAG（检索增强生成）和Agent模块的算法。推动多模态（视觉-语言）理解技术的应用，如大型视觉模型（LVM），用于工业应用场景。架构和构建大规模、高质量的行业数据集，以支持模型的预训练、微调和评估。开发和维护稳健的验证、评估和性能监控框架以支持AI系统。为大型模型应用平台和微服务的开发做出贡献，以提高模块化和可用性。我们寻找的条件（必备）：计算机科学、数学、电气工程、数据科学或相关领域的硕士或博士学位。扎实的ML/DL基础，深入理解Transformer架构，并具备端到端LLM训练/开发的实际经验。精通 Python 和 PyTorch 生态系统（如Hugging Face, DeepSpeed, PEFT）。具备大型模型压缩技术（剪枝、量化）和推理优化框架（如vLLM, Triton）的实际经验。具备大规模数据处理的强大能力，并熟悉大数据工具（如Spark）。如果您有Chat BI经验更佳。加分项（优先）：具备开发 RAG系统和 AI Agent模块的实际经验。了解 CUDA编程、分布式训练或硬件加速（GPU/TPU）。在顶级AI会议（NeurIPS, ICLR, CVPR等）上发表过论文。具备 Docker , FastAPI 和企业级模型部署管道的经验。我们提供：参与具有实际影响力的突破性AI项目的机会。与领先的学术研究团队合作进行前沿探索。重视技术卓越、创新和职业成长的文化。具有竞争力的薪酬、全面的福利和支持性的工作环境。

AI/LLM工程师

Gravitas Recruitment Group (Global) Ltd