【ChatGLM3】(9):使用fastchat和vllm部署chatlgm3-6b模型,并简单的进行速度测试对比。vllm确实速度更快些。

NoSuchKey

猜你喜欢

转载自blog.csdn.net/freewebsys/article/details/134917274