创始LLM评估研究员

圣弗朗西斯科 8小时前全职 网络
1.8K - 2.5K / 年
关于UniversalAGI UniversalAGI是一家前沿的AI研究实验室,致力于构建AI自动化的未来。当企业和政府机构需要获得竞争优势、引领市场变革或加速AI采用时,我们是首选的战略AI合作伙伴。我们在企业客户中取得了显著的进展,正处于一个关键点,正在将我们的技术能力提升到新的水平。 我们得到了Eric Schmidt、Elad Gil、Ion Stoica和David Patterson的支持。我们的精英团队拥有来自OpenAI、特斯拉、NVIDIA、苹果、Palantir、亚马逊、普林斯顿大学、斯坦福大学和加州大学伯克利分校的经验。 关于职位 我们正在寻找一位出色的创始LLM评估研究员,以建立我们全面的评估框架,保持在AI研究的前沿,设计并执行严格的实验以评估自主代理,并开发创新的方法来增强代理在实际部署中的性能和能力。 主要职责 LLM评估与框架开发 - 从头设计全面的LLM评估框架,用于政府和企业环境中的AI自动化 - 构建评估系统,以衡量和提高AI解决方案在生产部署中的性能 - 开发评估方法,用于在实际应用中自主运行的多代理系统 - 优化LLM输出,以适应涉及结构化数据库和非结构化文档库的特定企业用例 - 开发方法,以提高模型响应的准确性和针对特定领域应用的相关性 - 将研究成果转化为具备强大评估指标的生产就绪平台能力 研究与实验 - 实施并进行严格的评估实验,以优化代理性能和可靠性 - 通过阅读和综合顶级AI会议和期刊的研究成果,保持对前沿研究的了解 - 设计并执行数据收集策略,以构建针对特定用例的高质量评估数据集 - 开发方法,以在各种AI自动化任务中实现和保持高准确性标准 - 在必要时,原型化新技术和模型,以构建自主AI代理,重点提高准确性、效率和可靠性 协作与沟通 - 与产品工程师密切合作,将研究进展转化为实际应用和可部署的解决方案 - 与企业客户合作,了解评估要求和成功指标 - 通过内部演示、报告以及可能的外部出版物或会议,记录和传达研究成果 - 积极参与定义研究路线图,基于潜在影响和可行性优先考虑实验方向