论文略读：Case-Based or Rule-Based: How Do Transformers Do the Math? - 代码天地

论文略读：Case-Based or Rule-Based: How Do Transformers Do the Math?

物联网 2024-11-01 14:13:29 阅读次数: 0

ICML 2024

1 基于规则的推理（rule-based） VS 基于样例的推理（case-based）

一个是依赖于训练语料库中见过的相似样例
一个是基于学习到的基本规则

2 方法 & 结论

2.1 直接问答案：case-based

论文使用了Leave-Square-Out 方法测试大模型是哪种推理
- 定位模型可能依赖的训练集中的样例
- 将它们从训练集中移除，以观察它们是否影响模型的测试性能
- 红框的部分事被挖掉的测试集（训练集看不到的部分）
- 如果是rule-based，那么应该都是差不多的准确率；但这边红框内的准确率明显下降，说明大模型是case-based

2.2 scratchpad（引导LLM一位一位做加法）：case-based

发现是下三角形部分准确率也几乎为0
- 模型无法解决如47+48的问题，因为训练集中没有包含十位上进位的步骤
- ——>不涉及进位的部分效果好，涉及的部分效果差

2.3 论文提出的方法： Rule-Following Fine-Tuning (RFFT)

旨在教 transformers 进行 rule-based reasoning
在输入中提供显式的规则，然后指导 transformers 逐行地回忆规则并执行

3 结果

猜你喜欢

转载自blog.csdn.net/qq_40206371/article/details/143389260

今日推荐

周排行

TryParse的使用方法小结

Android之高仿手机QQ聊天

关于在java中关键字private能否用来修饰类的问题

去雾算法总结

前端面试题：事件防抖，函数节流，事件防抖和函数节流的区别

随堂小测

【OpenCV + Python】归一化函数cv2.normalize()的原理讲解

05: redis 主从复制

python3-基础5

持续更新-使用 Maven Module 搭建spring boot项目（整合Spring Security、Spring Social、spring OAuth）第一篇

每日归档

更多

2025-03-18(0)

2025-03-17(0)

2025-03-16(0)

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)

2025-03-12(0)

2025-03-11(0)

2025-03-10(0)

2025-03-09(0)