AI Red-Teamer – Adversarial AI Testing (Fortgeschritten); Englisch & brasilianisches Portugiesisch
Beschreibung
Standort: Remote; geografisch beschränkt auf die USA und Brasilien
Art der Beschäftigung: Vollzeit- oder Teilzeit-Befristeter Vertrag
Erforderliche Sprachkenntnisse: Englisch & brasilianisches Portugiesisch. Für diese Position sind muttersprachliche Kenntnisse in Englisch und brasilianischem Portugiesisch erforderlich.
Warum diese Stelle existiert
Wir bei Mercor glauben, dass die sicherste KI diejenige ist, die bereits angegriffen wurde – von uns. Wir stellen für dieses Projekt ein Red Team zusammen – menschliche Datenexperten, die KI-Modelle mit adversarialen Eingaben untersuchen, Schwachstellen aufdecken und die Red-Team-Daten generieren, die die KI für unsere Kunden sicherer machen.
Dieses Projekt umfasst die Überprüfung von KI-Ausgaben, die sensible Themen wie Voreingenommenheit, Fehlinformationen oder schädliches Verhalten betreffen. Alle Arbeiten sind textbasiert, und die Teilnahme an Projekten mit höherer Sensibilität ist optional und wird durch klare Richtlinien und Ressourcen zum Wohlbefinden unterstützt. Bevor Sie mit Inhalten in Berührung kommen, werden die Themen klar kommuniziert.
Ihre Aufgaben
- Red-Team-Konversations-KI-Modelle und -Agenten: Jailbreaks, Prompt-Injektionen, Missbrauchsfälle, Ausnutzung von Voreingenommenheit, Multi-Turn-Manipulation
- Erstellen hochwertiger menschlicher Daten: Annotieren von Fehlern, Klassifizieren von Schwachstellen und Markieren systemischer Risiken
- Anwenden von Strukturen: Befolgen von Taxonomien, Benchmarks und Playbooks, um die Konsistenz der Tests zu gewährleisten
- Reproduzierbares Dokumentieren: Erstellen von Berichten, Datensätzen und Angriffsszenarien, auf deren Grundlage Kunden Maßnahmen ergreifen können
Wer Sie sind
- Y
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
7.4.2026
Ähnliche Angebote
Is Mercor Legit?
How Much Do AI Jobs Pay?
How to Get Started