← Back to Gigs
职位描述
职位概述
我们正在寻找经验丰富的 Grafana 高级用户,负责设计专家级评估任务,以测试 AI 代理是否能像真正的专业人士一样使用 Grafana。您的领域专业知识将确保这些任务的真实性。
工作内容
- 设计真实的多步骤 Grafana 工作流——包括仪表盘、告警规则、数据源配置、面板设置及跨模块操作
- 在托管的 Grafana 实例上亲自执行每个工作流
以生成参考轨迹
- 编写清晰、具体的任务提示,包含可通过程序验证的可量化结果
- 实现程序化评分器,用于检查每条指令是否正确完成
- 审查 AI 代理执行任务的尝试,识别失败的位置及原因,并标记根本原因
- 校准任务难度,确保任务具有挑战性但可解决——根据模型性能迭代优化提示和约束条件
任职要求
- 2年以上日常专业级 Grafana 使用经验(SRE、平台工程、可观测性或相关领域)
- 精通 PromQL、仪表盘模板、告警管道及数据源配置(Prometheus、InfluxDB 等)
- 能够清晰阐述工作流,以便进行程序化验证
- 能够熟练编写基础评分脚本(Python;如有需要将提供工程支持)
加分项
- 具备
Details
Category
Code Evaluation
Location
Remote
Employment Type
Independent Contractor
Languages Required
🇺🇸 English
Posted
2026/4/10