【ChatGLM3】(6):使用1个2080Ti-11G版本,运行ChatGLM3-Int8模型,可以正常运行,速度6 words/s,不支持vllm启动,2张卡速度24 words/s

NoSuchKey

猜你喜欢

转载自blog.csdn.net/freewebsys/article/details/134757601