RLHF实现专业领域llm微调

RLHF训练过程:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

标注平台–百度智能云平台

标注地址
在这里插入图片描述

To Do List

针对任务:
构建Prompt数据集
人工数据标注数据集