大模型知识库扒皮库
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
-
+
首页
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_7383740.037492225324586737.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8753480.38550355531129143.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_7495760.49246512381160157.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8888910.8628385066333738.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_7545670.5958871304594321.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_9404750.39667515202855996.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_7503380.30010966592305954.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_9513170.3172514637669991.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_7621150.28733995543618496.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_9428620.8649840215262165.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8158140.5738730592124905.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_9741190.0947302644511615.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8519480.3982482588871551.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_9623990.40948620905246136.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8545940.23582611193475245.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230423_0454190.7615122752238874.jpeg) arXiv论文 LLM应用 人工智能 安全防护来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230422_8620650.48165191020127274.jpeg) HuggingAI 2024-03-22 02:20 BadEdit 研究揭示了通过模型编辑技术在大型语言模型中植入后门的可能,从而引发了关于模型安全性和对抗性攻击的新思考。 传统后门攻击方法普遍要求大量中毒数据调优,大大制约了其在LLMs中的实用性和可能导致整体性能下降。创新性的BadEdit攻击框架应运而生,首次将后门注入转化为轻量级知识编辑任务。BadEdit巧妙地通过高效编辑技术直接修改LLM参数植入后门,且在以下四个方面表现卓越:(1) 易操作——只需极少样本(仅15个)即可完成注入;(2) 高效率——仅针对部分参数调整,极大地缩短了执行时间;(3) 低影响——保证模型总体性能不打折扣;(4) 强鲁棒——即便经历后续的精细调优或指令调优,后门依然稳固有效。实验证明,BadEdit框架能够高效地以100\\%成功率对预训练LLMs发动攻击,同时确保模型对正常输入的性能表现稳定如初。 原文链接:[\[2403.13355\] BadEdit: Backdooring large language m...](https://arxiv.org/abs/2403.13355 "[2403.13355] BadEdit: Backdooring large language m...") #arXiv论文# #LLM应用# #人工智能# #安全防护# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230423_0285490.44478576974794415.jpeg) arXiv论文 LLM应用 人工智能 安全防护
yg9538
2024年3月30日 23:04
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码