AI 人工智能 - 推荐的文章 - 第2页

RealVul: 基于大语言模型训练微调的PHP漏洞检测框架深度解析

LLM赋能安全领域前沿研究“甚少”，在研究该领域的前沿论文科研时发现了一个很开创性的漏洞检测框架，本文的核心目标是设计一个针对PHP漏洞检测的LLM框架RealVul，以弥补现有研究的不足。具体而言，关注如何从真实项目中定位漏洞触发点并提取有效样本、如何通过代码预处理突出漏洞特征、以及如何利用半合成数据扩充稀缺样本

3
0
Bear001
发布于 2025-10-16 09:00:01
阅读 ( 1184 )

MCP安全协议：从攻击手法到最佳实践，全景解析

在大模型和智能应用快速发展的今天，Model Context Protocol（MCP）逐渐成为连接模型与外部服务的重要标准。它让开发者可以更方便地调用第三方 API，为模型提供更多上下文能力。但与此同时，安...

1
0
Halo咯咯
发布于 2025-10-11 09:57:18
阅读 ( 1675 )

【补天白帽黑客城市沙龙-杭州站】让安全大模型不做花瓶

本议题聚焦于面向复杂场景的模型训练与架构设计，提出多种解决方案提升模型在网络安全场景下的理解与推理能力。在此方案下的实验中，体现了自动渗透、自动修复、自动信息收集、自动打靶、参与CTF竞赛等通用能力,初步具备无需人工干预的通用执行能力。

0
0
奇安信攻防社区
发布于 2025-08-13 18:19:34
阅读 ( 2102 )

大模型安全之数据投毒

数据投毒是针对模型训练阶段的攻击，通过向训练数据注入有害样本或篡改样本标签/特征，改变模型学习到的映射，从而在部署后降低模型性能或触发预设行为

0
0
洺熙
发布于 2025-08-21 10:02:08
阅读 ( 3070 )

LLM如何安全对齐（基础篇）

AI对齐旨在确保AI系统，其能力与行为同人类的价值观,意图及伦理规范保持一致本文将系统性梳理AI对齐的基础原则，剖析理论与算法的挑战 1.模型固有的逆向对齐趋势 2.人类偏好非传递性导致的收敛困境 3.安全保障的系统性复杂性

0
0
洺熙
发布于 2025-08-21 09:00:03
阅读 ( 2564 )

RAG安全攻略：揭秘检索增强生成的风险与防护之道

在人工智能（AI）的浪潮中，Retrieval-Augmented Generation（RAG，检索增强生成）无疑是一颗耀眼的新星。它让AI系统不再局限于训练时的“旧知识”，而是能从海量外部数据中实时检索相关信息，生...

0
0
Halo咯咯
发布于 2025-08-11 10:00:02
阅读 ( 2536 )

大模型安全风险概览

理解大模型安全的全景视图要真正掌握大模型安全，我们首先需要建立一个全景式的认知框架就像建筑师在设计摩天大楼时必须考虑地基、结构、电梯系统和消防安全一样，大模型的安全也需要从生命周...

0
0
洺熙
发布于 2025-07-04 16:14:55
阅读 ( 2843 )

LLM安全基础与各厂商安全策略设计

LLM安全基础在深入探讨大语言模型（LLM）的安全风险与防护策略之前，建立一个清晰、坚实的基础认知至关重要。这不仅是为了确保后续讨论的有效性，更是因为对核心术语、基本原则及其内在逻辑的...

1
0
洺熙
发布于 2025-07-04 16:14:51
阅读 ( 2449 )

LLM概述与全景解析

LLM概述与全景 1 什么是 LLM？ LLM是基于深度神经网络架构的预测模型。在通过在海量的语料库上进行大规模训练，学习并内化语言的统计规律,语义关联及上下文依赖, 训练目标通常是预测序列中的下...

0
0
洺熙
发布于 2025-07-04 16:14:46
阅读 ( 2255 )

AI 时代的 mcp 攻防探讨

模型上下文协议（Model Context Protocol, MCP）是一种用于在分布式系统中管理和共享模型上下文的协议，广泛应用于机器学习、区块链和物联网等领域。然而，随着MCP的广泛应用，其安全性问题也日益凸显。

0
0
逍遥~
发布于 2025-06-10 09:00:03
阅读 ( 3602 )

ai红队之路探索

AI Red Teaming是模拟针对AI系统的对抗性攻击的实践，旨在恶意行为者之前主动识别漏洞，潜在的误用场景和故障模式。

1
0
逍遥~
发布于 2025-06-04 10:00:00
阅读 ( 4031 )

2025年RSA大会：10大AI安全工具，开启智能防御新时代

在刚刚过去的RSA大会上，AI安全领域迎来了井喷式的发展。从SIEM（安全信息与事件管理）、SOAR（安全编排自动化与响应）、ITDR（身份威胁检测与响应）到DSPM（数据安全态势管理）、红队测试和防...

0
0
Halo咯咯
发布于 2025-06-03 09:56:30
阅读 ( 3238 )

基于条件干预的大模型推理时防御

之前很多研究工作已经表明，大语言模型（LLMs）的一个显著特点是它们能够通过激活中的丰富表示来处理高级概念。这一特性也使得在去年NeurIPS（人工智能顶会）上出现了很多与激活引导（activation steering）等技术的有关的工作

0
0
elwood1916
发布于 2025-06-05 09:00:00
阅读 ( 2475 )

基于注意力操纵的AIGC版权风险规避技术

扩散模型的背后一个很核心的风险就是未授权数据集使用的问题。当然，这种侵权分为两种，一种是使用文生图模型得到的图像，其版权归属问题，比如之前的新闻提到，北京互联网法院全国首例“AI文生图”著作权侵权案获最高法院“两会”工作报告关注

1
0
elwood1916
发布于 2025-05-26 09:00:02
阅读 ( 2340 )

网络安全大模型微调：红队大模型

上篇文章中我们已经基本了解了微调一个基座大模型的流程，本文我们将集中于微调出一个实际的安全大模型。因此首先有必要必要了解微调出一个安全大模型存在的难点

4
0
elwood1916
发布于 2025-05-23 09:00:02
阅读 ( 4958 )

基于概念擦除的AIGC防侵权技术

最近的文生图模型因为卓越的图像质量和看似无限的生成能力而受到关注。最近出圈，可能是因为openai的模型可以将大家的图像转变为吉卜力风格。

0
0
elwood1916
发布于 2025-05-12 10:14:50
阅读 ( 3588 )

基于影子栈的大模型系统防御技术

在传统系统安全中有一个典型的技术—影子栈（shadow stacks），它可以防御内存溢出攻击。那么类似于影子栈创建一个影子内存空间，如果可以正常栈中建立与目标LLM实例（LLMtarget）并行的影子LLM防御实例（LLMdefense），那理论上就是可以实现防御的

0
0
elwood1916
发布于 2025-05-09 09:40:07
阅读 ( 2715 )

vulnhuntr: LLM与SAST结合的AI产品漏洞自动化挖掘

通过结合静态代码分析和大语言模型（LLM）的方式来批量检测AI产品中的潜在漏洞

2
0
leeh
发布于 2025-04-27 09:43:38
阅读 ( 4507 )

多语言和多口音音频大型语言模型的越狱攻击

本文将深入探讨多语言音频模型在实际应用中面临的安全挑战，特别是音频越狱攻击的机制与影响。我们将学习攻击者如何利用模型的漏洞，通过精心设计的音频输入绕过安全机制，诱导模型生成不当内容。

0
0
Werqy3
发布于 2025-04-28 09:00:02
阅读 ( 3956 )

基于嵌入扰动的大模型白盒越狱攻击

大模型（以下均用LLMs指代）发展迅速，但引发了大家对其潜在滥用的担忧。虽然模型开发者进行了大量安全对齐工作，以防止 LLMs 被用于有害活动，但这些努力可被多种攻击方法破解，典型的就是在社区里多篇文章中一直在强调的越狱攻击。这些攻击方法能找出安全对齐技术的漏洞，促使开发者及时修复，降低 LLMs 带来的安全风险

0
0
elwood1916
发布于 2025-04-24 09:39:13
阅读 ( 3553 )