什么是思维链COT?
思维链COT是一种通过引导模型逐步推理来生成更准确、更连贯输出的方法。传统的Prompt设计通常是直接给出一个问题或任务,模型根据输入生成输出。然而,这种方法往往忽略了模型在推理过程中的中间步骤,导致输出可能不够准确或逻辑性不强。
思维链COT的核心思想是,通过在Prompt中引入一系列逐步推理的步骤,引导模型按照逻辑链条进行思考。这样,模型不仅能够生成最终答案,还能展示出推理的过程,从而提高输出的准确性和可解释性。
怎么激活思维链COT
之前我的文章里已经有很详细的激活COT的办法了。今天只聊一个简单的激活办法,在你的prompt里面加入一句咒语 “Let’s Step by Step”,是一个比较简单的激活办法,会引导模型进行COT的思考再输出,解决一些之前解决不了的问题。
实战
测试一:
经典问题,数strawberry中有几个r,我们用qwen2.5 72B来测试:
可以看到是输出了错误的结果,我们加入COT再试一下:
可以看到这次可以正确输出了。
测试二:
比较9.9 和 9.11哪个大:
可以看到还是输出了错误的结果,我们加入COT再试一下:
又获得了正确的结果。
为什么这个咒语那么神奇
实际上参数比较大的模型内部基本都会内置COT(前提是参数量够大,才有涌现效果),我们输入"Let’s Step by Step"时候,模型会识别到这个指令,然后激活内部的COT机制,从而输出正确的结果。
总结
之后再遇到复杂的问题模型无法解决的时候可以尝试加入这个咒语,看看能不能激活COT来解决问题。