论文略读:Case-Based or Rule-Based: How Do Transformers Do the Math?

ICML 2024

1 基于规则的推理(rule-based) VS 基于样例的推理(case-based)

  • 一个是依赖于训练语料库中见过的相似样例
  • 一个是基于学习到的基本规则

2 方法 & 结论

2.1  直接问答案:case-based

  • 论文使用了Leave-Square-Out 方法测试大模型是哪种推理
    • 定位模型可能依赖的训练集中的样例
    • 将它们从训练集中移除,以观察它们是否影响模型的测试性能
    • 红框的部分事被挖掉的测试集(训练集看不到的部分)
    • 如果是rule-based,那么应该都是差不多的准确率;但这边红框内的准确率明显下降,说明大模型是case-based

2.2 scratchpad(引导LLM一位一位做加法):case-based

  • 发现是下三角形部分准确率也几乎为0
    •  模型无法解决如47+48的问题,因为训练集中没有包含十位上进位的步骤
    • ——>不涉及进位的部分效果好,涉及的部分效果差

2.3 论文提出的方法: Rule-Following Fine-Tuning (RFFT)

  • 旨在教 transformers 进行 rule-based reasoning
  • 在输入中提供显式的规则,然后指导 transformers 逐行地回忆规则并执行

3 结果

 

猜你喜欢

转载自blog.csdn.net/qq_40206371/article/details/143389260