角色概述
Stellar Technologies正在寻找一位机器学习工程师(GenAI),负责设计、构建和部署结合大型语言模型(LLMs)、检索增强生成(RAG)和代理AI框架的下一代AI系统。在此角色中,您将连接模型开发和生产工程——开发可扩展的AI管道,集成实时API,并确保为企业级解决方案提供动力的高性能AI服务。您将在机器学习、云基础设施和应用研究的交叉点工作,与顶尖工程师和数据科学家合作,提供智能、可投入生产的AI能力。
主要职责
- 开发和优化利用LLMs、RAG和代理AI框架(LangChain、LangGraph)的AI系统。
- 构建和部署具有实时推理和检索组件的生产级ML管道。
- 设计和管理API和流服务,将AI模型集成到企业平台中。
- 使用Docker、Kubernetes和Azure ML实施容器化、编排的部署。
- 自动化数据预处理、模型训练、评估和版本控制管道。
- 与跨职能团队合作,将模型集成到前端、分析和自动化工作流中。
- 确保已部署AI工作负载的治理、合规性和安全性。
- 进行性能基准测试并优化推理延迟和成本。
- 使用可观察性框架(日志记录、指标、跟踪)监控生产中的AI系统。
- 参与架构讨论以增强AI服务的可扩展性和可靠性。
必需技能和经验
- 拥有LLMs、RAG和代理框架(LangChain、LangGraph、Semantic Kernel等)的丰富实践经验。
- 精通Python,深入理解PyTorch、TensorFlow、scikit-learn、Hugging Face Transformers等ML库。
- 在API和微服务工程(FastAPI、Flask)方面有扎实经验。
- 熟悉流架构和实时数据处理。
- 了解云平台(首选Azure),包括Azure AI、认知服务和ML Ops。
- 具备容器化和编排(Docker、Kubernetes)经验。
- 理解向量数据库(Pinecone、Weaviate、FAISS)和检索机制。
- 具备CI/CD、模型部署和生产监控经验。
优先技能
- 接触过基于GPU的推理优化和无服务器部署。
- 了解AI的可观察性和监控工具(Prometheus、Grafana、Azure Monitor)。
- 在模型微调、提示工程或代理编排方面有经验。
- 理解AI治理、伦理AI和数据隐私框架。
软技能
- 具备强大的分析和解决问题的思维。
- 出色的协作和沟通能力。
- 对创新、实验和应用AI充满热情。