OBLITERATUS：一键移除AI模型安全限制的开源工具深度解析

OBLITERATUS是2026年3月发布的开源工具包，可一键移除开源大语言模型的拒绝行为，支持116个主流模型。它基于SVD和转向向量等技术，通过数学方法精准定位并移除模型内部的“拒绝方向”，无需重训练即可实现模型“解放”。该技术在红队测试和AI对齐研究中具有重要价值，但也存在滥用风险和伦理争议。