← Back to Gigs
职位描述
职位名称:高级软件工程师 – 大语言模型评估与代码库验证
项目简介:我们正在构建大语言模型(LLM)评估与训练数据集,旨在训练LLM解决现实中的软件工程问题。本项目采用的策略之一,是通过结合人工干预的合成方法,基于公开代码库的历史记录构建可验证的软件工程任务;同时在编程语言、难度等级等方面扩展数据集的覆盖范围,以涵盖不同类型的任务。
职位描述:我们正在寻找经验丰富的软件工程师(技术负责人级别),要求熟悉高质量的公开GitHub代码库,并能为本项目做出贡献。该职位涉及实际的软件工程工作,包括开发环境自动化、问题分类处理,以及测试覆盖率和质量评估。
为何加入我们?Turing是全球发展最快的AI公司之一,致力于加速强大AI系统的研发与部署。您将站在前沿,评估大型语言模型(LLMs)如何与真实代码交互,从而影响人工智能辅助软件开发的未来。这是一个将实用软件工程与人工智能研究相结合的独特机会。
日常工作内容包括:
- 分析并筛选热门开源库中的 GitHub 问题。
- 搭建和配置代码仓库,包括 Docker 化及环境设置。
- 评估单元测试
Details
Category
Code Evaluation
Location
Remote
Employment Type
Independent Contractor
Skills
Go
Posted
2026/4/13