【ChatGLM3】(6):使用1个2080Ti-11G版本,运行ChatGLM3-Int8模型,可以正常运行,速度6 words/s,不支持vllm启动,2张卡速度24 words/s 业界资讯 2023-12-18 01:16 0 阅读 NoSuchKey 猜你喜欢