推理加速性能超越英伟达FasterTransformer 50%,开源方案打通大模型落地关键路径

NoSuchKey