Skip to content

评估测试

本项目可以用人工标注的测试集评估候选人筛选的准确率和召回率。

测试数据准备

建议准备:

  • 一个明确岗位需求。
  • 一批候选人简历,例如 40 份。
  • 人工标注的正例候选人列表。
  • 一组筛选查询。

指标定义

准确率 Precision

text
Precision = 返回的相关候选人数 / 返回的候选人总数

召回率 Recall

text
Recall = 返回的相关候选人数 / 所有相关候选人总数

推荐流程

  1. 清空旧测试数据。
  2. 上传测试简历。
  3. 等待全部简历变为 parsed
  4. 输入固定筛选条件。
  5. 记录 Top N 候选人。
  6. 和人工标注结果对比。
  7. 计算 Precision / Recall。

注意事项

  • 测试前确认没有重复简历。
  • 测试前确认所有简历解析成功。
  • 如果解析失败,应记录失败原因。
  • 同一批测试应固定模型、召回数量和精排数量。