如何检测是否为爬虫IP? - 网络技能论坛 - 经验分享 - 小轻秀场

如何检测是否为爬虫IP?

方法一:

通过国外网站验证:http://bot.myip.ms/123.125.71.12

返回结果:

IP/Domain – 123.125.71.12:

 

Baidu Bot on this IP address – See more at: http://bot.myip.ms/123.125.71.12#sthash.Ax4dx8s5.dpuf

Image

方法二:

在linux平台下,您可以使用host ip命令反解 ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname

host :

[root@baoshan temp]# host 123.125.71.12

12.71.125.123.in-addr.arpa domain name pointer baiduspider-123-125-71-12.crawl.baidu.com.

方法三:windows平台

C:\Users\user>nslookup 123.125.71.12

服务器: UnKnown

Address: 218.241.116.153

名称: baiduspider-123-125-71-12.crawl.baidu.com

Address: 123.125.71.12

参考资料:

1.http://blog.goyiyo.com/archives/1978

2.http://bot.myip.ms

代码:

#!/bin/bash

cat sourceip.txt | while read ip 
do 
curl bot.myip.ms/$ip | grep "Bot on this IP address" >> ./a.txt 
if [ $? -ne 0 ]; then
echo $ip" NOT" >> result
else
echo $ip" Bot" >> result
fi
done

请登录后发表评论

    没有回复内容