← Back to Gigs
职位描述
加入一家顶尖人工智能实验室的前沿生成式人工智能团队,置身于人工智能革命的核心,您的专业知识将推动最先进的大型语言模型的开发。
1\. 概述
我们正在寻找来自STEM各领域的教授,包括机器学习、编程、数据科学等,参与一个专注于编程和智能体工作流的前沿模型评估项目。您将设计并验证具有挑战性的基准任务,以帮助发现并诊断目标模型在推理和问题解决方面的不足。工作重点在于构建具有可执行测试的、稳健的现实世界任务,并分析模型/智能体的行为。
这是一份由 Cincinnatus LLC 提供的 W2 雇佣职位,您将有机会作为扩展团队成员,派驻至一家领先的 AI 实验室。您将加入由领域专家组成的团队,共同引领下一代前沿 AI 工具的发展。
2\. 主要职责
- 任务设计与开发:设计具有挑战性的、基于真实世界的领域特定问题,作为代理任务的基础。问题设计应针对前沿AI模型中已识别的特定核心能力缺失故障。
- 规格说明与黄金解生成:将问题整合到代理开发环境中,使用Python准备所有必要组件,包括:
- 详细说明及所需任务概述。
- A
Details
Category
STEM Tutoring
Location
Remote
Employment Type
Independent Contractor
Posted
2026/4/9