← Back to Gigs
仕事内容
最先端のAI研究所のGenAIチームに加わり、AI革命の最前線で活躍しませんか。あなたの専門知識が、最先端の大型言語モデルの開発を牽引します。
1\. 概要
金融、会計、法学、およびその他の専門サービス分野の教授を募集しています。コーディングやエージェント型ワークフローに焦点を当てた最先端モデルの評価プロジェクトにご参画いただきます。対象モデルにおける推論や問題解決の課題を明らかにし、診断するために、難易度の高いベンチマークタスクを設計・検証していただきます。本業務は、実行可能なテストを備えた堅牢で実世界的なタスクを構築し、モデルやエージェントの挙動を分析することに重点を置いています。
本ポジションはCincinnatus LLCとのW2雇用契約に基づくもので、同社の拡張人材として主要なAI研究所に配属される機会があります。各分野の専門家からなるチームに加わり、次世代の最先端AIツールの開発を共に牽引していただきます。
2\. 主な職務内容
- タスクの設計と開発:エージェントタスクの基盤となる、挑戦的で実世界的なドメイン固有の問題を設計します。問題は、最先端AIモデルにおいて特定された中核能力の喪失に起因する失敗をターゲットとするように構築する必要があります。
- 仕様書およびゴールデンソリューションの生成:問題をエージェント開発環境に統合し、Pythonを使用して以下の必要なコンポーネントをすべて準備します:
- 詳細な指示書および要件の概要
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
2026/4/9