← Volver a Trabajos
Descripción
1\. Descripción general del puesto Buscamos investigadores con experiencia y expertos técnicos que contribuyan a un proyecto destinado a evaluar modelos de vanguardia centrados en flujos de trabajo agentivos. Diseñará y validará tareas de referencia complejas en ciencia de datos, aprendizaje automático, finanzas y programación para ayudar a identificar y diagnosticar deficiencias en el razonamiento y la resolución de problemas en un modelo STEM específico. El trabajo se centra en crear tareas sólidas y realistas con pruebas ejecutables y, a continuación, analizar el comportamiento del modelo o del agente.
2\. Responsabilidades clave
- Diseñar problemas STEM desafiantes y del mundo real
- Implementar cada tarea dentro de un entorno de desarrollo de agentes utilizando Python
3\. Requisitos principales
- Profunda experiencia en ciencia de datos, aprendizaje automático, finanzas y/o programación basada en Python
- Doctorado en curso o recién obtenido (en una de las mejores universidades de EE. UU.)
- Sólida experiencia en investigación en temas de vanguardia de STEM
- Capacidad para dedicarse de forma fiable más de 30 horas a la semana, principalmente entre semana
- Resultados técnicos demostrados, como contribuciones de código abierto de alta calidad (especialmente en ecosistemas de herramientas de agentes/LLM)
- Facilidad para leer y razonar sobre los registros de comportamiento de los agentes para diagnosticar modos de fallo más allá de los errores superficiales
4\. Más información sobre la oportunidad - Área de interés inicial: flujos de trabajo de agentes para tareas STEM
- Se valora el conocimiento de marcos de trabajo de agentes y ecosistemas de software libre (por ejemplo, LangChain, MetaGPT, AutoGen, AutoGPT, CrewAI, LlamaIndex, BabyAGI, SuperAGI, CAMEL, AgentGPT, D
Details
Category
AI Evaluation
Location
Remote
Employment Type
Independent Contractor
Languages Required
🇺🇸 English
Posted
2/4/2026
Oportunidades Relacionadas
Review
→Is Mercor Legit?
Pay Data
→How Much Do AI Jobs Pay?
Guide
→How to Get Started