Spécialiste en tests d'IA adversaires — Tests d'IA adversaires (niveau avancé) ; anglais et portugais brésilien

General$28.74 per hour

Description

Lieu : Télétravail ; géographie limitée aux États-Unis et au Brésil

Type : Contrat à temps plein ou à temps partiel

Maîtrise des langues requise : anglais et portugais brésilien. Une maîtrise de l'anglais et du portugais brésilien de niveau natif est requise pour ce poste.

Pourquoi ce poste existe-t-il ?

Chez Mercor, nous pensons que l'IA la plus sûre est celle qui a déjà été attaquée — par nous. Nous constituons une équipe rouge pour ce projet : des experts en données qui testent les modèles d'IA à l'aide d'entrées adversaires, identifient les vulnérabilités et génèrent les données de l'équipe rouge qui rendent l'IA plus sûre pour nos clients.

Ce projet implique l'examen des résultats de l'IA qui touchent à des sujets sensibles tels que les biais, la désinformation ou les comportements préjudiciables. Tout le travail est basé sur du texte, et la participation à des projets plus sensibles est facultative et s'appuie sur des directives claires et des ressources de bien-être. Avant toute exposition au contenu, les sujets seront clairement communiqués.

Vos missions

Modèles et agents d'IA conversationnelle de l'équipe rouge : jailbreaks, injections de prompts, cas d'utilisation abusive, exploitation des biais, manipulation en plusieurs tours
Générer des données humaines de haute qualité : annoter les défaillances, classer les vulnérabilités et signaler les risques systémiques
Appliquer une structure : suivre les taxonomies, les benchmarks et les playbooks pour assurer la cohérence des tests
Documenter de manière reproductible : produire des rapports, des ensembles de données et des cas d'attaque sur lesquels les clients peuvent agir

Qui êtes-vous ?