Evaluador de indicaciones para modelos de investigación operativa
Descripción
Descripción general del puesto
Buscamos profesionales expertos en investigación operativa para redactar y verificar indicaciones abiertas de alta calidad destinadas a la evaluación de modelos de IA. Se encargará de elaborar y revisar problemas de optimización y de ciencia de la decisión exigentes y sin ambigüedades en distintos subdominios fundamentales, evaluando la calidad del razonamiento de la IA y contribuyendo a establecer estándares de evaluación rigurosos para modelos lingüísticos de vanguardia.
Se le asignará uno de estos dos tipos de tareas:
- Tarea de redacción: cree 5 indicaciones originales y abiertas de su subdominio asignado con distintos niveles de dificultad (grado, grado avanzado o posgrado/profesional). Las indicaciones deben requerir el juicio humano para evaluar la calidad de la respuesta de la IA, como el modelado de optimización, el análisis algorítmico o el razonamiento estocástico.
- Tarea de verificación: revisa 5 consignas creadas para comprobar su claridad, alineación con el ámbito, precisión en la dificultad y singularidad. Edita las consignas y las clasificaciones de dificultad cuando sea necesario.
Subdominios de investigación operativa cubiertos
Programación lineal e entera, optimización de redes y teoría de grafos, modelos estocásticos y teoría de colas, teoría de juegos y análisis de decisiones, optimización de la cadena de suministro y logística, simulación y metaheurística.
Responsabilidades clave
- Redactar indicaciones de investigación operativa claras, inequívocas y abiertas que susciten respuestas de IA evaluables
- Verificar que las indicaciones se encuentren dentro del ámbito del subdominio asignado y que estén correctamente clasificadas en cuanto a dificultad
- Asegurarse de que las 5 indicaciones de un
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Languages Required
Posted
11/4/2026
Oportunidades Relacionadas
Is Mercor Legit?
How Much Do AI Jobs Pay?
How to Get Started