← Back to Gigs

高级数据科学家

AI Evaluation
立即申请 →

职位描述

职位简介

这是一个难得的机会,您将有机会在前八大前沿实验室之一与研究人员直接合作。在此职位上,您将设计涉及数据科学、机器学习和编程领域的具有挑战性的现实世界问题,以测试和改进最先进的大语言模型(LLMs)。作为该项目的一员,您将加入由顶尖STEM及机器学习博士组成的团队。您将负责确保(基于代理工作流)的人工数据生成在准确性、细微差别和实用性方面均达到模型训练的最高标准。

职责

  • 代理工作流监督:设计并实施框架,以指导、监控和验证代理任务执行者生成的数据输出,确保其符合黄金标准基准。
  • 方法论开发:开发新方法论,通过优质训练数据提升模型性能,包括创新的数据采集和洞察生成方法。
  • AI 集成:将 AI 模型和工具作为评估、综合和理解复杂数据集的组成部分,以提升数据质量。
  • 跨职能合作:作为关键的技术合作伙伴,与研究、工程和产品团队紧密协作,在整个组织内定义数据卓越标准。
  • 成果负责制:解决模糊问题并影响利益相关者,确保数据智能成果直接支持产品和业务目标。

任职要求

  • 深厚学术背景:拥有定量领域的博士学位

Details

Category

AI Evaluation

Location

Remote

Employment Type

Independent Contractor

Skills

PythonRData ScienceNumpyPandasTensorflowPyTorchLLM

Posted

2026/4/13