PaperBench 查重

粘贴 task.yaml、arxiv URL、 论文标题,或拖入 YAML 文件,在基准库里查是否重复。

· 或直接拖入此区域
关于匹配逻辑

同时跑 4 路强匹配 + 1 路 fuzzy:

  • arxiv_id 完全相等 → score 1.0
  • 标题归一化签名(去标点/停用词后前 6 token)相等 → 1.0
  • GitHub 仓库 URL 归一化后相等 → 0.95
  • Slug 归一化签名相等 → 0.9
  • 标题 3-gram Jaccard ≥ 0.5 → 0.5..1.0

综合分数 ≥ 0.9 判 重复,≥ 0.6 判 可疑,否则 全新