← Back to Gigs
职位描述
关于Turing:
Turing总部位于加利福尼亚州旧金山,是全球前沿AI实验室的首要研究加速器,也是部署先进AI系统的全球企业的值得信赖的合作伙伴。Turing 通过两种方式支持客户:首先,利用高质量数据、先进的训练管道以及专注于编码、推理、STEM、多语言、多模态和智能代理领域的顶尖 AI 研究人员,加速前沿研究;其次,运用这些专业知识,帮助企业将 AI 从概念验证转化为专有智能,构建性能可靠、成效可量化、并能为损益表带来持久收益的系统。
职位概述:
作为 AI 质量分析师,您将评估 Gemini 的一项新个性化功能。您需要评估模型如何利用您过往的 Gemini 对话、Gmail、Google 搜索和 YouTube 活动信息,以使回复更具相关性和实用性。该职位要求兼具创造力和严谨的分析能力。您将从个人体验的角度出发,主动设计提示词。随后,您将运用分析技能评估模型个性化回复的质量,从“基于现实”、“整合度”和“实用性”等维度进行评估。
核心资质
- 希腊语能力:具备高水平的希腊语读写能力,因本项目以希腊语为核心语言。
- 个人账户 U
- 在此职位中,您将加入一个充满活力的团队,专注于评估个性化人工智能交互的质量。您的日常工作包括:
- 设计并执行多轮对话提示(通常为1至5轮),要求人工智能利用您的个人信息和经历。
- 根据起始提示中的意图评估模型响应,检查个性化处理是否恰当。
- 分析响应中的“锚定”问题,确保关于您的陈述有证据支持,而非基于错误推断或幻觉。
- 评估整合质量,确保个人数据自然融入响应中,避免机械式的“过度叙述”。
- 严格评估并并排(SxS)对两个模型响应进行排序,以确定哪个总体上更有帮助、更易于使用且体验更佳。
- 为您的比较撰写清晰、有理有据的说明,明确指出对话中出现问题或积极方面的地方。
- 从模型中提取并验证“调试信息”,以确认聊天摘要和数据源已被正确利用。
- 通过删除评估对话来保持严格的数据卫生,防止其污染未来的聊天记录。
教育背景与工作经验
- 相关领域(如政策、法律、伦理学、语言学、新闻学、计算机科学或相关分析领域)的学士学位或同等经验。
- 具备数据标注、AI
Details
Category
AI Evaluation
Location
Remote
Employment Type
Independent Contractor
Skills
Domain-Specific Languages
Posted
2026/4/13