OBLITERATUS:一键移除AI模型安全限制的开源工具深度解析OBLITERATUS是2026年3月发布的开源工具包,可一键移除开源大语言模型的拒绝行为,支持116个主流模型。它基于SVD和转向向量等技术,通过数学方法精准定位并移除模型内部的“拒绝方向”,无需重训练即可实现模型“解放”。该技术在红队测试和AI对齐研究中具有重要价值,但也存在滥用风险和伦理争议。分类:开源工具完整内容需要启用 JavaScript 以获得完整阅读体验。