大模型训练的一些坑点和判断

NoSuchKey