← Back to Gigs
职位描述
工作地点:远程办公;仅限美国、巴西
工作类型:全职或兼职合同制
所需语言能力: 英语及巴西葡萄牙语。本职位要求英语和巴西葡萄牙语达到母语水平。
职位设立背景
在 Mercor,我们坚信最安全的 AI 就是已经遭受过攻击的 AI——由我们发起攻击。我们正在为该项目组建一支红队——由人类数据专家组成,他们将通过对抗性输入对 AI 模型进行探测,发现漏洞,并生成红队数据,从而为我们的客户打造更安全的 AI。
该项目涉及审查涉及偏见、虚假信息或有害行为等敏感话题的 AI 输出结果。所有工作均基于文本,参与高敏感度项目属自愿性质,并有明确的指导方针和心理健康资源提供支持。在接触任何内容之前,相关主题都会得到明确告知。
您的职责
- 对对话式AI模型和智能体进行红队测试:越狱攻击、提示词注入、滥用案例、偏见利用、多轮交互操控
- 生成高质量的人工数据:标注失败案例、分类漏洞并标记系统性风险
- 建立规范体系:遵循分类法、基准测试和操作手册,确保测试的一致性
- 编写可复现的文档:制作报告、数据集和攻击案例,供客户采取行动
您应具备的条件
- Y
Details
Category
General
Location
Remote
Employment Type
Independent Contractor
Posted
2026/4/7