数据集-Deepseek - 代码天地

开源中文DeepSeek-R1（满血）蒸馏数据集-110K。HF: https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k，MS: https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k，该数据集为中文开源蒸馏满血R1的数据集，数据集中不仅包含math数据，还包括大量的通用类型数据，总数量为110K。
HF:https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k，MS:https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k，该数据集为中文开源蒸馏满血R1的数据集，数据集中不仅包含math数据，还包括大量的通用类型数据，总数量为110K。中文数据集中的数据分布如下，Math：共计36987个样本，Exam：共计2440个样本，STEM：共计12000个样本，General：共计58573，包含弱智吧、逻辑推理、小红书、知乎、Chat等。数据集蒸馏中的数据prompt源来自：Haijian/Advanced-Math，gavinluo/applied_math，meta-math/GSM8K_zh，EduChat-Math，m-a-p/COIG-CQIA，m-a-p/neo_sft_phase2
hfl/stem_zh_instruction，按照DeepSeek-R1官方提供的细节，进行数据蒸馏。
不增加额外的系统提示词，设置temperature为0.6，如果为数学类型数据，则增加提示词，“请一步步推理，并把最终答案放到 \boxed{}。”，防止跳出思维模式，强制在每个输出的开头增加"\n"，再开始生成数据。

猜你喜欢

目录

热门文章