← Back to Gigs
职位描述
加入一家顶尖人工智能实验室的前沿生成式人工智能团队,置身于人工智能革命的核心,您的专业知识将推动最先进的大型语言模型的开发。
1\. 概述我们正在寻找来自各STEM领域的教授,包括机器学习、编程、数据科学等,参与一个专注于编程和代理工作流的前沿模型评估项目。您将设计并验证具有挑战性的基准任务,以帮助发现并诊断目标模型在推理和解决问题方面的不足。工作重点在于构建具有可执行测试的稳健、真实世界任务,并分析模型/代理的行为。这是一份由 Cincinnatus LLC 提供的 W2 雇佣职位,您将有机会作为扩展团队成员,派驻至一家领先的 AI 实验室。您将加入由领域专家组成的团队,共同引领下一代前沿 AI 工具的发展。## 2\. 主要职责 - 任务设计与开发:设计具有挑战性的、基于真实世界的领域特定问题,作为代理任务的基础。问题设计应针对前沿AI模型中已识别的特定核心能力缺失故障。 - 规格说明与黄金解生成:将问题集成到代理开发环境中,使用Python准备所有必要组件,包括: - 详细说明及所需任务概述。 - 遵循说明的黄金解
平等就业机会 Cincinnatus 自豪地成为一家践行平等就业机会的雇主。我们不会因种族、宗教、肤色、国籍、性别(包括怀孕、分娩、生殖健康决策或相关医疗状况)、性取向、性别认同、性别表达、年龄、受保护退伍军人身份、残疾人身份、遗传信息、政治观点或活动,或任何其他受法律保护的特征而进行歧视。辛辛纳图斯致力于在整个求职过程中,为符合条件的残疾人士及残疾退伍军人提供合理的便利措施。
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
2026/4/11