← Back to Gigs
职位描述
关于项目:我们正在构建大语言模型(LLM)的评估和训练数据集,旨在训练大语言模型解决现实中的软件工程问题。本项目采用的策略之一,是基于公开代码库的历史记录,结合人工干预的合成方法构建可验证的软件工程任务;同时在编程语言、难度等级等方面扩展数据集的覆盖范围,以涵盖不同类型的任务。
职位描述:我们正在寻找经验丰富的软件工程师(技术负责人级别),要求熟悉高质量的公开 GitHub 代码库,并能为本项目做出贡献。该职位涉及实际的软件工程工作,包括开发环境自动化、问题分类处理,以及测试覆盖率和质量评估。
为何加入我们?Turing 是全球发展最快的 AI 公司之一,致力于加速强大 AI 系统的研发与部署。您将站在前沿,评估大型语言模型(LLMs)如何与真实代码交互,从而影响 AI 辅助软件开发的未来。这是一个将实用软件工程与 AI 研究相结合的独特机会。
日常工作内容:
- 分析并筛选热门开源库中的 GitHub 问题。
- 搭建和配置代码仓库,包括 Docker 化及环境配置。
- 评估单元测试的覆盖率和质量。
- 在本地修改并运行代码库,以评估 LLM 的表现
Details
Category
Code Evaluation
Location
Remote
Employment Type
Independent Contractor
Skills
C#
Posted
2026/4/13