← Back to Gigs

高级软件工程师 – C++(大语言模型评估与代码库验证)

Code Evaluation
立即申请 →

职位描述

关于项目:我们正在构建大语言模型(LLM)的评估和训练数据集,旨在训练大语言模型解决现实中的软件工程问题。本项目采用的策略之一,是基于公开代码库的历史记录,结合人工干预的合成方法构建可验证的软件工程任务;同时在编程语言、难度等级等方面扩展数据集的覆盖范围,涵盖不同类型的任务。

职位描述:我们正在寻找经验丰富的软件工程师(技术负责人级别),要求熟悉高质量的公开 GitHub 代码库,并能为本项目做出贡献。该职位涉及实际的软件工程工作,包括开发环境自动化、问题分类处理,以及测试覆盖率和质量评估。

为何加入我们?Turing 是全球发展最快的 AI 公司之一,致力于加速强大 AI 系统的研发与部署。您将站在前沿,评估大型语言模型(LLMs)如何与真实代码交互,从而影响 AI 辅助软件开发的未来。这是一个将实用软件工程与 AI 研究相结合的独特机会。

日常工作内容:

  • 分析并筛选热门开源库中的 GitHub 问题。
  • 搭建和配置代码仓库,包括 Docker 化及环境配置。
  • 评估单元测试的覆盖率和质量。
  • 在本地修改并运行代码库,以评估 LLM 的性能

Details

Category

Code Evaluation

Location

Remote

Employment Type

Independent Contractor

Skills

C++

Posted

2026/4/13