开源中文DeepSeek-R1(满血)蒸馏数据集-110K。HF: https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k,MS: https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k,该数据集为中文开源蒸馏满血R1的数据集,数据集中不仅包含math数据,还包括大量的通用类型数据,总数量为110K。
HF:https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k,MS:https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k,该数据集为中文开源蒸馏满血R1的数据集,数据集中不仅包含math数据,还包括大量的通用类型数据,总数量为110K。中文数据集中的数据分布如下,Math:共计36987个样本,Exam:共计2440个样本,STEM:共计12000个样本,General:共计58573,包含弱智吧、逻辑推理、小红书、知乎、Chat等。数据集蒸馏中的数据prompt源来自:Haijian/Advanced-Math,gavinluo/applied_math,meta-math/GSM8K_zh,EduChat-Math,m-a-p/COIG-CQIA,m-a-p/neo_sft_phase2
hfl/stem_zh_instruction,按照DeepSeek-R1官方提供的细节,进行数据蒸馏。
不增加额外的系统提示词,设置temperature为0.6,如果为数学类型数据,则增加提示词,“请一步步推理,并把最终答案放到 \boxed{}。”,防止跳出思维模式,强制在每个输出的开头增加"\n",再开始生成数据。