← Back to Gigs

AI 红队成员 — 对抗性 AI 测试(高级);英语及巴西葡萄牙语

General$28.74 per hour
立即申请 →

职位描述

工作地点:远程办公;仅限美国、巴西

工作类型:全职或兼职合同制

所需语言能力: 英语及巴西葡萄牙语。本职位要求英语和巴西葡萄牙语达到母语水平。

职位设立背景

在 Mercor,我们坚信最安全的 AI 就是已经遭受过攻击的 AI——由我们发起攻击。我们正在为该项目组建一支红队——由人类数据专家组成,他们将通过对抗性输入对 AI 模型进行探测,发现漏洞,并生成红队数据,从而为我们的客户打造更安全的 AI。

该项目涉及审查涉及偏见、虚假信息或有害行为等敏感话题的 AI 输出结果。所有工作均基于文本,参与高敏感度项目属自愿性质,并有明确的指导方针和心理健康资源提供支持。在接触任何内容之前,相关主题都会得到明确告知。

您的职责

  • 对对话式AI模型和智能体进行红队测试:越狱攻击、提示词注入、滥用案例、偏见利用、多轮交互操控
  • 生成高质量的人工数据:标注失败案例、分类漏洞并标记系统性风险
  • 建立规范体系:遵循分类法、基准测试和操作手册,确保测试的一致性
  • 编写可复现的文档:制作报告、数据集和攻击案例,供客户采取行动

您应具备的条件

  • Y

Details

Category

General

Location

Remote

Employment Type

Independent Contractor

Posted

2026/4/7