Summary本文通过分析基础和对齐大型语言模型(LLMs)之间的token分布差异,发现alignment tunning主要影响了很小一部分的token选择,这些token主要影响了风格元素和安全声明。在大多数token位置上,对齐和基