Large Language Model Compression via the Nested Activation-Aware Decomposition

本文提出了一种名为**嵌套激活感知分解（NSVD）**的新型后训练压缩框架，旨在解决大型语言模型（LLM）在低秩分解中面临的两个关键挑战：

NSVD通过以下创新设计提升压缩精度：

实验结果表明，NSVD在8个数据集和6个模型（涵盖LLaMA、OPT、Mistral三大家族）上均优于现有SVD方法（如ASVD、SVD-LLM），尤其在30%-50%压缩率或多语言/多任务场景下优势显著。