← Back to Gigs
职位描述
加入一家顶尖人工智能实验室的前沿生成式人工智能团队,置身于人工智能革命的核心,您的专业知识将推动最先进的大型语言模型的开发。
1\. 概述
我们正在寻找来自金融、会计、法律及其他专业服务领域的教授,参与一个专注于编码和代理工作流的前沿模型评估项目。您将设计并验证具有挑战性的基准任务,以帮助发现并诊断目标模型在推理和问题解决方面的不足。该工作主要围绕构建具有可执行测试的稳健、真实世界任务,并分析模型/代理的行为。
这是一份由 Cincinnatus LLC 提供的 W2 雇佣职位,您将有机会作为其扩展团队的一员,派驻至一家领先的 AI 实验室。您将加入由领域专家组成的团队,共同引领下一代前沿 AI 工具的发展。
2\. 主要职责
- 任务设计与开发:设计具有挑战性的、基于真实世界的特定领域问题,作为代理任务的基础。问题应针对前沿AI模型中已识别出的特定核心能力缺失故障进行构建。
- 规格说明与黄金解生成:将问题集成到代理开发环境中,使用Python准备所有必要组件,包括:
- 详细说明及需求概述
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
2026/4/9