关于XA集团:
在XA集团,我们致力于推动汽车和保险行业的重大技术进步。我们的使命是为企业提供智能解决方案,使它们变得更智能、更安全、更高效。
主要职责:
• 1. 图像和文本聊天机器人:
• 研究并实现一个聊天机器人,能够无缝地集成图像和文本,使用最先进的LLMs,如GPT-4V和LLaVa。
• 能够使用CLIP或类似的嵌入来改进图像文本理解。(根据需要进行微调)
• 2. 文本到图像(视频)生成:
• 探索并实现从文本描述生成图像或视频的模型。
• 开发与数据叙事相关的实际应用,例如从自定义输入数据生成儿童故事插图。
• 重点研究扩散器的使用,并评估其对生成内容质量和多样性的影响。
• 3. 针对多模态的LLM模型进行微调:
• 实施针对LLMs的微调策略,以生成特定领域的内容。为此创建相应的指导数据集。
• 展示模型理解和响应指导的能力,符合指定领域的上下文。
• 4. 模型量化:
• 研究模型量化技术,以优化推理速度和准确性,特别是在GPU上。
• 进行实验,展示量化水平和模型性能之间的权衡。
• 5. 模型评估和指标:
• 开发全面的评估指标,用于图像和文本聊天机器人,以及文本到图像(视频)生成模型。
• 通过清晰简洁的报告,包括可视化和比较,呈现研究结果。
要求:
• 在生成式人工智能、自然语言处理(NLP)和机器学习方面有背景。
• 熟练掌握编程语言,如Python,并熟悉相关库(如TensorFlow、PyTorch)。有使用LLMs和hugging face transformers的经验。
• 较强的分析和研究能力。
• 有效的沟通能力,包括向利益相关者呈现研究结果的能力。
• 能够独立工作和团队合作能力。
福利:
• 与计算机视觉领域的行业专家进行指导。
• 亲身体验尖端技术和实际应用。
• 有机会为具有意义影响的项目做出贡献。
• 具有合作和创新的工作环境。
每月800美元至1,000美元。