← Volver a Trabajos
Descripción
Áreas profesionales (profesores)
El equipo busca profesores de las áreas de finanzas, contabilidad, derecho y otros servicios profesionales para que contribuyan a un proyecto destinado a apoyar una iniciativa de evaluación de modelos de vanguardia centrada en la codificación y los flujos de trabajo de agentes. Diseñará y validará tareas de referencia complejas para ayudar a identificar y diagnosticar las deficiencias en el razonamiento y la resolución de problemas de un modelo objetivo.
Día a día
- Diseño y desarrollo de tareas: Diseñar problemas desafiantes y específicos del ámbito profesional del mundo real que sirvan de base para las tareas de agentes. Los problemas deben construirse para abordar fallos específicos de pérdida de capacidades básicas identificados en un modelo de IA de vanguardia
- Especificaciones y generación de la solución de referencia: Integrar los problemas en un entorno de desarrollo de agentes, preparando todos los componentes necesarios utilizando Python, lo que incluye:
- Instrucciones detalladas y una descripción general de la tarea requerida
- Una solución de referencia que siga las instrucciones
- Cualquier consulta específica y comentarios con conocimientos específicos del dominio
- Evaluación y análisis: Evaluar el rendimiento del modelo cruzado en las tareas
- Identificación de margen de mejora: Identificar tareas en las que el modelo objetivo no supera todas las pruebas, clasificando específicamente el fallo como un fallo de razonamiento lógico
- Extracción de pérdidas: Analizar los pasos del agente (trayectoria del agente) para observar y extraer patrones de pérdida de capacidades básicas del modelo. 3. Básico
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
11/4/2026
Oportunidades Relacionadas
Review
→Is Mercor Legit?
Pay Data
→How Much Do AI Jobs Pay?
Guide
→How to Get Started