NLP生成AI - 多模态和RAG聊天机器人 - 研究与实现... - XA Group招聘

关于XA集团：在XA集团，我们致力于推动汽车和保险行业的重大技术进步。我们的使命是为企业提供智能解决方案，使它们变得更智能、更安全、更高效。主要职责： • 1. 图像和文本聊天机器人： • 研究并实现一个聊天机器人，能够无缝地集成图像和文本，使用最先进的LLMs，如GPT-4V和LLaVa。 • 能够使用CLIP或类似的嵌入来改进图像文本理解。（根据需要进行微调） • 2. 文本到图像（视频）生成： • 探索并实现从文本描述生成图像或视频的模型。 • 开发与数据叙事相关的实际应用，例如从自定义输入数据生成儿童故事插图。 • 重点研究扩散器的使用，并评估其对生成内容质量和多样性的影响。 • 3. 针对多模态的LLM模型进行微调： • 实施针对LLMs的微调策略，以生成特定领域的内容。为此创建相应的指导数据集。 • 展示模型理解和响应指导的能力，符合指定领域的上下文。 • 4. 模型量化： • 研究模型量化技术，以优化推理速度和准确性，特别是在GPU上。 • 进行实验，展示量化水平和模型性能之间的权衡。 • 5. 模型评估和指标： • 开发全面的评估指标，用于图像和文本聊天机器人，以及文本到图像（视频）生成模型。 • 通过清晰简洁的报告，包括可视化和比较，呈现研究结果。要求： • 在生成式人工智能、自然语言处理（NLP）和机器学习方面有背景。 • 熟练掌握编程语言，如Python，并熟悉相关库（如TensorFlow、PyTorch）。有使用LLMs和hugging face transformers的经验。 • 较强的分析和研究能力。 • 有效的沟通能力，包括向利益相关者呈现研究结果的能力。 • 能够独立工作和团队合作能力。福利： • 与计算机视觉领域的行业专家进行指导。 • 亲身体验尖端技术和实际应用。 • 有机会为具有意义影响的项目做出贡献。 • 具有合作和创新的工作环境。每月800美元至1,000美元。