我们正在与一家处于创新前沿的全球领先技术公司合作,为其AI团队招聘一个关键职位。这是一个推进大型语言模型(LLM)和多模态AI在关键工业领域实际应用的独特机会,与顶级研究人才并肩工作。
关于该职位:
您将在从研究、训练到优化和实际部署的整个生命周期中发挥关键作用。您的工作将弥合最先进的AI研究与有影响力的工业解决方案之间的差距,直接塑造下一代AI如何融入复杂的商业环境。
主要职责:
领导垂直领域特定大型模型的训练、微调(SFT)和系统部署。研究并实施先进的模型压缩和优化技术(剪枝、量化、蒸馏)以提高推理效率。设计和开发用于动态场景中增强AI推理的RAG(检索增强生成)和Agent模块的算法。推动多模态(视觉-语言)理解技术的应用,如大型视觉模型(LVM),用于工业应用场景。架构和构建大规模、高质量的行业数据集,以支持模型的预训练、微调和评估。开发和维护稳健的验证、评估和性能监控框架以支持AI系统。为大型模型应用平台和微服务的开发做出贡献,以提高模块化和可用性。我们寻找的条件(必备):
计算机科学、数学、电气工程、数据科学或相关领域的硕士或博士学位。扎实的ML/DL基础,深入理解Transformer架构,并具备
端到端LLM训练/开发
的实际经验。精通
Python
和
PyTorch
生态系统(如Hugging Face, DeepSpeed, PEFT)。具备
大型模型压缩技术
(剪枝、量化)和
推理优化框架
(如vLLM, Triton)的实际经验。具备大规模数据处理的强大能力,并熟悉大数据工具(如Spark)。如果您有Chat BI经验更佳。加分项(优先):
具备开发
RAG系统
和
AI Agent模块
的实际经验。了解
CUDA编程
、分布式训练或硬件加速(GPU/TPU)。在顶级AI会议(NeurIPS, ICLR, CVPR等)上发表过论文。具备
Docker
,
FastAPI
和企业级模型部署管道的经验。我们提供:
参与具有
实际影响力的突破性AI项目
的机会。与
领先的学术研究团队
合作进行前沿探索。重视
技术卓越、创新和职业成长
的文化。具有竞争力的薪酬
、全面的福利和支持性的工作环境。