使用GGML和LangChain在CPU上运行量化的llama2

NoSuchKey