← Back to Gigs

AI 红队成员 — 对抗性 AI 测试（高级）；英语及巴西葡萄牙语

General$28.74 per hour

立即申请 →

职位描述

工作地点：远程办公；仅限美国、巴西

工作类型：全职或兼职合同制

所需语言能力： 英语及巴西葡萄牙语。本职位要求英语和巴西葡萄牙语达到母语水平。

职位设立背景

在 Mercor，我们坚信最安全的 AI 就是已经遭受过攻击的 AI——由我们发起攻击。我们正在为该项目组建一支红队——由人类数据专家组成，他们将通过对抗性输入对 AI 模型进行探测，发现漏洞，并生成红队数据，从而为我们的客户打造更安全的 AI。

该项目涉及审查涉及偏见、虚假信息或有害行为等敏感话题的 AI 输出结果。所有工作均基于文本，参与高敏感度项目属自愿性质，并有明确的指导方针和心理健康资源提供支持。在接触任何内容之前，相关主题都会得到明确告知。

您的职责

对对话式AI模型和智能体进行红队测试：越狱攻击、提示词注入、滥用案例、偏见利用、多轮交互操控

生成高质量的人工数据：标注失败案例、分类漏洞并标记系统性风险

建立规范体系：遵循分类法、基准测试和操作手册，确保测试的一致性

编写可复现的文档：制作报告、数据集和攻击案例，供客户采取行动

您应具备的条件

Y

Details

Category

General

Location

Remote

Employment Type

Independent Contractor

Posted

2026/4/7

立即申请 →

相关机会

商务战略专家（超级明星计划）

$100 - $300 per hour

Marriage and Family Therapist

$82 - $287 per hour

Occupational Therapy Assistants

$82 - $287 per hour

Ophthalmologist

$82 - $287 per hour

Recreational Therapist

$82 - $287 per hour

View similar gigs →

Is Mercor Legit?

How Much Do AI Jobs Pay?

How to Get Started