评估测试
本项目可以用人工标注的测试集评估候选人筛选的准确率和召回率。
测试数据准备
建议准备:
- 一个明确岗位需求。
- 一批候选人简历,例如 40 份。
- 人工标注的正例候选人列表。
- 一组筛选查询。
指标定义
准确率 Precision
text
Precision = 返回的相关候选人数 / 返回的候选人总数召回率 Recall
text
Recall = 返回的相关候选人数 / 所有相关候选人总数推荐流程
- 清空旧测试数据。
- 上传测试简历。
- 等待全部简历变为
parsed。 - 输入固定筛选条件。
- 记录 Top N 候选人。
- 和人工标注结果对比。
- 计算 Precision / Recall。
注意事项
- 测试前确认没有重复简历。
- 测试前确认所有简历解析成功。
- 如果解析失败,应记录失败原因。
- 同一批测试应固定模型、召回数量和精排数量。