← Back to Gigs
仕事内容
職務概要
トップ8にランクインするフロンティア研究所の研究者と直接連携できる、やりがいのあるポジションです。本職務の主な目的は、難易度の高いベンチマークタスクを設計・検証・分析することで、STEM分野における対象フロンティアモデルの推論能力および問題解決能力を向上させることです。
主な職務内容
- タスクの設計と開発:Colab Benchタスクの基盤となる、挑戦的で実世界的なデータサイエンスの問題を設計します。
- コンテンツ作成:問題をAgentic開発環境に統合し、Pythonを使用して以下の必要なコンポーネントをすべて準備します。 - 詳細な指示と、要求されるタスクの概要。
- 指示に従った「ゴールデンソリューション」。
- データセット、Pythonライブラリ、メタデータを含む必要な環境。
- ソリューションが通過しなければならないユニットテストを含むテストノートブック。
- 評価と分析:タスクに対するクロスモデルのパフォーマンスを評価する。
- 課題の特定:ターゲットモデルがすべてのテストに合格できないタスクを特定し、特にその失敗を論理的推論の失敗として分類する。
- 能力損失の抽出:エージェントのステップ(エージェントの軌跡)を分析し、モデルから中核的な能力の損失パターンを観察・抽出する。
応募資格および採用
- 専門分野:応募者は、データサイエンス、機械学習、金融、コーディングにおける高い専門知識を有し、最先端のSTEM分野での深いバックグラウンドを持っている必要があります。
- 対象候補者:現在、積極的に採用を行っています
Details
Category
STEM Tutoring
Location
Remote
Employment Type
Independent Contractor
Skills
PythonData SciencePyTorchMachine Learning
Posted
2026/4/13