奇安信攻防社区-【网络安全一百问-91】如何防止爬虫行为？

默认排序时间排序

2 个回答

Kinding 2022-08-30 12:45

空城 - 安全小菜鸡 2022-08-30 16:46

1.限制User-Agent字段

User-Agent字段能识别用户所使用的操作系统、版本、CPU、浏览器等信息，如果请求来自非浏览器，就能识别其为爬虫，阻止爬虫抓取网站信息。

User-Agent字段虽然有效，但对于精心构造的爬虫来说，效果并不好。攻击者可以通过在恶意爬虫请求的User-Agent字段中带上baidu字符，伪装成百度爬虫绕过这一规则，无法被拦截。

2.限制IP

限制IP是最常见的手段之一，为了效率，恶意爬虫的请求频率往往比正常流量高，找出这些IP并限制其访问，可以有效降低恶意爬虫造成的危害。

不过限制IP也有自己的缺点，容易误伤正常用户，攻击者可以通过搭建IP池的方法，来解决这个问题。

3. 添加验证码

在登录页等页面，添加验证码，以识别是正常流量还是恶意爬虫，也是一种基本的操作。不过如今爬虫技术，早已能解决验证码的问题，例如二值化、中值滤波去噪等等。

4.Cookies限制

根据业务需求，可对Cookies进行限制，要求用户登录后才能使用某些功能或权限，并针对同一账号的访问速度进行限制。