← Retour aux Emplois

Évaluateur de thèse de doctorat

AI Evaluation$70 - $120 per hour
Postuler Maintenant →

Description

1\. Présentation du poste Nous recherchons des chercheurs expérimentés et des experts techniques pour participer à un projet visant à évaluer des modèles de pointe axés sur les flux de travail agentiques. Vous concevrez et validerez des tâches de référence complexes dans les domaines de la science des données, de l'apprentissage automatique, de la finance et du codage afin d'aider à mettre en évidence et à diagnostiquer les lacunes en matière de raisonnement et de résolution de problèmes dans un modèle STEM cible. Le travail consiste principalement à créer des tâches robustes et ancrées dans le monde réel, accompagnées de tests exécutables, puis à analyser le comportement du modèle/de l'agent.

2\. Responsabilités principales

  • Concevoir des problèmes STEM complexes et concrets
  • Mettre en œuvre chaque tâche au sein d'un environnement de développement agentique à l'aide de Python

3\. Qualifications requises

  • Expertise approfondie en science des données, apprentissage automatique, finance et/ou codage basé sur Python
  • Doctorant en cours d'études ou récemment diplômé (d'une grande université américaine)
  • Solide expérience de recherche dans des domaines de pointe des STEM
  • Capacité à s'engager de manière fiable pendant plus de 30 heures par semaine, principalement en semaine
  • Réalisations techniques avérées, telles que des contributions open source de haute qualité (en particulier dans les écosystèmes d'outils agentiques / LLM)
  • Aisance dans la lecture et l'analyse des traces de comportement des agents pour diagnostiquer les modes de défaillance au-delà des erreurs superficielles

4\. En savoir plus sur l'opportunité

  • Domaine d'intérêt initial : flux de travail agentiques pour les tâches STEM
  • Une bonne connaissance des frameworks agentiques et des écosystèmes OSS est un atout (par exemple : LangChain, MetaGPT, AutoGen, AutoGPT, CrewAI, LlamaIndex, BabyAGI, SuperAGI, CAMEL, AgentGPT, D

Details

Category

AI Evaluation

Location

Remote

Employment Type

Independent Contractor

Languages Required

🇺🇸 English

Posted

02/04/2026

Ne manquez aucune opportunité

Recevez des alertes quand de nouvelles offres IA sont publiées. Choisissez votre...

Review

Is Mercor Legit?

Pay Data

How Much Do AI Jobs Pay?

Guide

How to Get Started