关于UniversalAGI UniversalAGI是一家前沿的AI研究实验室，致力于构建AI自动化的未来。当企业和政府机构需要获得竞争优势、引领市场变革或加速AI采用时，我们是首选的战略AI合作伙伴。我们在企业客户中取得了显著的进展，正处于一个关键点，正在将我们的技术能力提升到新的水平。我们得到了Eric Schmidt、Elad Gil、Ion Stoica和David Patterson的支持。我们的精英团队拥有来自OpenAI、特斯拉、NVIDIA、苹果、Palantir、亚马逊、普林斯顿大学、斯坦福大学和加州大学伯克利分校的经验。关于职位我们正在寻找一位出色的创始LLM评估研究员，以建立我们全面的评估框架，保持在AI研究的前沿，设计并执行严格的实验以评估自主代理，并开发创新的方法来增强代理在实际部署中的性能和能力。主要职责 LLM评估与框架开发 - 从头设计全面的LLM评估框架，用于政府和企业环境中的AI自动化 - 构建评估系统，以衡量和提高AI解决方案在生产部署中的性能 - 开发评估方法，用于在实际应用中自主运行的多代理系统 - 优化LLM输出，以适应涉及结构化数据库和非结构化文档库的特定企业用例 - 开发方法，以提高模型响应的准确性和针对特定领域应用的相关性 - 将研究成果转化为具备强大评估指标的生产就绪平台能力研究与实验 - 实施并进行严格的评估实验，以优化代理性能和可靠性 - 通过阅读和综合顶级AI会议和期刊的研究成果，保持对前沿研究的了解 - 设计并执行数据收集策略，以构建针对特定用例的高质量评估数据集 - 开发方法，以在各种AI自动化任务中实现和保持高准确性标准 - 在必要时，原型化新技术和模型，以构建自主AI代理，重点提高准确性、效率和可靠性协作与沟通 - 与产品工程师密切合作，将研究进展转化为实际应用和可部署的解决方案 - 与企业客户合作，了解评估要求和成功指标 - 通过内部演示、报告以及可能的外部出版物或会议，记录和传达研究成果 - 积极参与定义研究路线图，基于潜在影响和可行性优先考虑实验方向