找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2776|回复: 1

[杂谈] 动态程序防采集的新方法

[复制链接]
发表于 2010-10-30 16:53:45 | 显示全部楼层 |阅读模式 来自 中国–广东–广州
昨天在网上看到一个防采集软件,说采集只访问当前网页,不会访问网页的图片、JS等,今天突然想到,通过动态程序和Js访问分别记录访问者的IP,然后进行IP判断,由于采集过程不会访问JS,采集的时候只会查到用动态程序记录的IP,而不会有通过JS记录的IP,从而实现网页程序的防采集。

防采集的原理非常简单,首先放一段动态语句,把访问者的IP加入到数据库的一个表里,然后在页面底部加入一个JS,JS直接访问动态页面,将访问者的IP加入到数据库的另外一个表里。再次访问的时候,从两个表里读IP数据,然后判断时间差,如果只在第一个表里找到,在第二个表里找不到,或者时间差超过10秒,则认为是采集。

优点

1.部署简单,只要是动态语言就能很容易的实现,无需借助服务器端程序

2.杀伤力大,几乎能封杀所有的采集过程

缺点

1.第一个缺点还是杀伤力大,如果需要实际使用需要考虑一些特殊情况,以免误杀已经杀掉搜索爬虫

2.只适用于动态网页,静态页面就没法用了

流程写的比较乱,不过原理本身就不是很复杂,下面附上程序例子,懂ASP的应该很快就能看懂。

程序例子(ASP+ACCESS):

1.建立数据库

表1:Ip1,字段Ip1_Adderss(文本),Ip1_Time(日期/时间,默认值=Now())

表2:Ip2,字段Ip2_Adderss(文本),Ip2_Time(日期/时间,默认值=Now())

2.Index.asp(仅动态代码,全部代码请见测试程序中)
  1. <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
  2. <%
  3. Dim Conn,Rs,Sqlstr,Ip,IpTime,IpTime2,NewUser
  4. NewUser=0
  5. Set Conn = Server.CreateObject("Adodb.Connection")
  6. Set Rs=Server.Createobject("Adodb.RecordSet")
  7. ConnStr="Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" & Server.MapPath("Data.mdb")
  8. Conn.Open ConnStr
  9. Ip=Request.ServerVariables("REMOTE_ADDR")
  10. Sqlstr="Select * From [Ip1] Where Ip1_Address='"&Ip&"' Order By Ip1_Id Desc"
  11. Rs.Open Sqlstr,Conn,1,3
  12. If Rs.Eof Then
  13. NewUser=1
  14. Application.Lock()
  15. Rs.AddNew()
  16. Rs("Ip1_Address")=Ip
  17. Rs.Update()
  18. Application.UnLock()
  19. Else
  20. IpTime=Rs("Ip1_Time")
  21. Application.Lock()
  22. Rs.AddNew()
  23. Rs("Ip1_Address")=Ip
  24. Rs.Update()
  25. Application.UnLock()
  26. End If
  27. Rs.Close
  28. If NewUser=0 Then
  29. Sqlstr="Select * From [Ip2] Where Ip2_Address='"&Ip&"' Order By Ip2_Id Desc"
  30. Rs.Open Sqlstr,Conn,1,3
  31. If Rs.Eof Then
  32. Rs.Close
  33. Resp**e.Write("请勿采集!")
  34. Resp**e.End()
  35. Else
  36. IpTime2=Rs("Ip2_Time")
  37. If DateDiff("s",IpTime2,IpTime)>10 Then
  38. Rs.Close
  39. Resp**e.Write("请勿采集!")
  40. Resp**e.End()
  41. End If
  42. End If
  43. Rs.Close
  44. End If
  45. %>


复制代码
3.Js.asp

<%
Dim Conn,Rs,Sqlstr,Ip
Set Conn = Server.CreateObject("Adodb.Connection")
Set Rs=Server.Createobject("Adodb.RecordSet")
ConnStr="Provider=Microsoft.Jet.OLEDB.4.0;Data Source=" & Server.MapPath("Data.mdb")
Conn.Open ConnStr
Ip=Request.ServerVariables("REMOTE_ADDR")
Sqlstr="Select * From [Ip2]"
Rs.Open Sqlstr,Conn,1,3
Application.Lock()
Rs.AddNew()
Rs("Ip2_Address")=Ip
Rs.Update()
Application.UnLock()
Rs.Close
%>

4.Get.asp

<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
<%
Resp**e.Write(Server.HTMLEncode(GetHttpPage("http://localhost/Index.asp","GB2312")))
'==============================
'函 数 名:GetHttpPage
'作 用:获取页面源代码函数
'参 数:网址HttpUrl
'==============================
Function GetHttpPage(HttpUrl,Code)
If IsNull(HttpUrl)=True Or HttpUrl="" Then
GetHttpPage="A站点维护中!"
Exit Function
End If
On Error Resume Next
Dim Http
Set Http=server.createobject("MSX"&"ML2.XML"&"HTTP")
Http.open "GET",HttpUrl,False
Http.Send()
If Http.Readystate<>4 then
Set Http=Nothing
GetHttpPage="B站点维护中!"
Exit function
End if
GetHttpPage=BytesToBSTR(Http.resp**eBody,Code)
Set Http=Nothing
If Err.number<>0 then
Err.Clear
GetHttpPage="C站点维护中!"
Exit function
End If
End Function
'==============================
'函 数 名:BytesToBstr
'作 用:转换编码函数
'参 数:字符串Body,编码Cset
'==============================
Function BytesToBstr(Body,Cset)
Dim Objstream
Set Objstream = Server.CreateObject("ado"&"d"&"b.st"&"re"&"am")
Objstream.Type = 1
Objstream.Mode =3
Objstream.Open
Objstream.Write body
Objstream.Position = 0
Objstream.Type = 2
Objstream.Charset = Cset
BytesToBstr = Objstream.ReadText
Objstream.Close
set Objstream = nothing
End Function
%>

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

发表于 2011-4-23 23:28:59 | 显示全部楼层 来自 中国–河南–郑州
有点意思。可以学习一下。

发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;

如何回报帮助你解决问题的坛友,好办法就是点击帖子下方的评分按钮给对方加【金币】不会扣除自己的积分,做一个热心并受欢迎的人!

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号

关闭

站长推荐上一条 /1 下一条

QQ|侵权投诉|广告报价|手机版|小黑屋|西部数码代理|飘仙建站论坛 ( 豫ICP备2022021143号-1 )

GMT+8, 2024-12-22 10:04 , Processed in 0.049190 second(s), 10 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表