AI/LLM工程师

香港 12天前全职 网络
面议
我们正在与一家处于创新前沿的全球领先技术公司合作,为其AI团队招聘一个关键职位。这是一个推进大型语言模型(LLMs)和多模态AI在关键工业领域实际应用的独特机会,与顶尖研究人才并肩工作。 关于该职位: 您将在尖端大型模型的全生命周期中发挥重要作用——从研究和训练到优化和实际部署。您的工作将弥合最先进的AI研究与有影响力的工业解决方案之间的差距,直接塑造下一代AI如何融入复杂的商业环境。 主要职责: - 领导垂直领域特定大型模型的训练、微调(SFT)和系统部署。 - 研究和实施先进的模型压缩和优化技术(剪枝、量化、蒸馏)以提高推理效率。 - 设计和开发RAG(检索增强生成)和Agent模块的算法,以增强AI在动态场景中的推理能力。 - 推动多模态(视觉-语言)理解技术的应用,如大型视觉模型(LVM),用于工业案例。 - 构建和开发大规模、高质量的行业数据集,以支持模型的预训练、微调和评估。 - 开发和维护AI系统的稳健验证、评估和性能监控框架。 - 为大型模型应用平台和微服务的开发做出贡献,以提高模块化和可用性。 我们寻找的条件(必须具备): - 计算机科学、数学、电气工程、数据科学或相关领域的硕士或博士学位。 - 扎实的ML/DL基础,深入理解Transformer架构,并具有端到端LLM训练/开发的实际经验。 - 熟练掌握Python和PyTorch生态系统(如Hugging Face、DeepSpeed、PEFT)。 - 具有大型模型压缩技术(剪枝、量化)和推理优化框架(如vLLM、Triton)的实际经验。 - 具备大规模数据处理的强大能力,并熟悉大数据工具(如Spark)。 - 如果您有Chat BI经验更佳。 加分项(优先考虑): - 具有开发RAG系统和AI Agent模块的实际经验。 - 了解CUDA编程、分布式训练或硬件加速(GPU/TPU)。 - 在顶级AI会议(NeurIPS、ICLR、CVPR等)上发表过论文。 - 有使用Docker、FastAPI和企业级模型部署管道的经验。 我们提供: - 参与具有实际影响力的突破性AI项目的机会。 - 与领先的学术研究团队合作进行尖端探索。 - 重视技术卓越、创新和职业发展的文化。 - 具有竞争力的薪酬、全面的福利和支持性的工作环境。