Spécialiste en tests d'IA adversaires — Tests d'IA adversaires (niveau avancé) ; anglais et portugais brésilien
Description
Lieu : Télétravail ; géographie limitée aux États-Unis et au Brésil
Type : Contrat à temps plein ou à temps partiel
Maîtrise des langues requise : anglais et portugais brésilien. Une maîtrise de l'anglais et du portugais brésilien de niveau natif est requise pour ce poste.
Pourquoi ce poste existe-t-il ?
Chez Mercor, nous pensons que l'IA la plus sûre est celle qui a déjà été attaquée — par nous. Nous constituons une équipe rouge pour ce projet : des experts en données qui testent les modèles d'IA à l'aide d'entrées adversaires, identifient les vulnérabilités et génèrent les données de l'équipe rouge qui rendent l'IA plus sûre pour nos clients.
Ce projet implique l'examen des résultats de l'IA qui touchent à des sujets sensibles tels que les biais, la désinformation ou les comportements préjudiciables. Tout le travail est basé sur du texte, et la participation à des projets plus sensibles est facultative et s'appuie sur des directives claires et des ressources de bien-être. Avant toute exposition au contenu, les sujets seront clairement communiqués.
Vos missions
- Modèles et agents d'IA conversationnelle de l'équipe rouge : jailbreaks, injections de prompts, cas d'utilisation abusive, exploitation des biais, manipulation en plusieurs tours
- Générer des données humaines de haute qualité : annoter les défaillances, classer les vulnérabilités et signaler les risques systémiques
- Appliquer une structure : suivre les taxonomies, les benchmarks et les playbooks pour assurer la cohérence des tests
- Documenter de manière reproductible : produire des rapports, des ensembles de données et des cas d'attaque sur lesquels les clients peuvent agir
Qui êtes-vous ?
- Y
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
07/04/2026
Opportunités Similaires
Is Mercor Legit?
How Much Do AI Jobs Pay?
How to Get Started