← Back to Gigs

Agentic Tasker（前沿STEM）

STEM Tutoring

立即申请 →

职位描述

职位简介

这是一个与前八大前沿实验室的研究人员直接合作的绝佳机会。该职位的核心目标是通过设计、验证和分析具有挑战性的基准任务，提升目标前沿模型在STEM领域中的推理和问题解决能力。

主要职责

任务设计与开发：设计具有挑战性的、基于真实世界的数据科学问题，作为 Colab Bench 任务的基础。

内容生成：将问题整合到 Agentic 开发环境中，使用 Python 准备所有必要组件，包括： - 详细说明及所需任务的概述。

遵循说明的黄金解法。

必要的环境，包括数据集、Python 库和元数据。

包含单元测试的测试笔记本，解决方案必须通过这些测试。

评估与分析：评估跨模型在任务中的表现

瓶颈识别：识别目标模型未能通过所有测试的任务，并具体将失败归类为逻辑推理失败

能力缺失分析：分析智能体的操作步骤（智能体轨迹），从中观察并提取模型核心能力缺失的模式。

资格要求与招聘

专业方向：申请人必须在数据科学、机器学习、金融和编程方面具备扎实的专业知识，并拥有前沿STEM领域的深厚背景。

目标候选人：我们正在积极招聘

Details

Category

STEM Tutoring

Location

Remote

Employment Type

Independent Contractor

Skills

PythonData SciencePyTorchMachine Learning

Posted

2026/4/13

立即申请 →

相关机会

STEM 领域教授/研究人员

$300 - $500 per hour

核能领域专业人士

$180 - $300 per hour

电气工程专家（超级明星计划）

$100 - $300 per hour

Security Systems Architect (Super Star Program)

$100 - $300 per hour

转化生物学专家

$110 - $135 per hour

View similar gigs →

How Much Do AI Jobs Pay?

How to Get Started