← Back to Gigs
职位描述
职位简介
这是一个难得的机会,您将有机会在前八大前沿实验室之一与研究人员直接合作。在此职位上,您将设计涉及数据科学、机器学习和编程领域的具有挑战性的现实世界问题,以测试和改进最先进的大语言模型(LLMs)。作为该项目的一员,您将加入由顶尖STEM及机器学习博士组成的团队。您将负责确保(基于代理工作流)的人工数据生成在准确性、细微差别和实用性方面均达到模型训练的最高标准。
职责
- 代理工作流监督:设计并实施框架,以指导、监控和验证代理任务执行者生成的数据输出,确保其符合黄金标准基准。
- 方法论开发:开发新方法论,通过优质训练数据提升模型性能,包括创新的数据采集和洞察生成方法。
- AI 集成:将 AI 模型和工具作为评估、综合和理解复杂数据集的组成部分,以提升数据质量。
- 跨职能合作:作为关键的技术合作伙伴,与研究、工程和产品团队紧密协作,在整个组织内定义数据卓越标准。
- 成果负责制:解决模糊问题并影响利益相关者,确保数据智能成果直接支持产品和业务目标。
任职要求
- 深厚学术背景:拥有定量领域的博士学位
Details
Category
AI Evaluation
Location
Remote
Employment Type
Independent Contractor
Skills
PythonRData ScienceNumpyPandasTensorflowPyTorchLLM
Posted
2026/4/13