献给学习XMLHTTP的朋友

Jaron 2003-11-12 12:52:32
加精
很久没写过东西了,今天看了chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》,于是优化了这个程序,并且将所有的功能都函数化了,希望对学习 XMLHTTP 的朋友有所帮助。
程序实现功能:自动将远程页面的文件中的图片下载到本地。

<%
'将本文保存为 save2local.asp
'测试:save2local.asp?url=http://ent.sina.com.cn/s/m/2003-11-11/1411231388.html
'本文根据 chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》改编和优化
'自动创建目录,自动将原文件名更名,文件格式的限制以及其他功能的一些优化
'自动保存网页文件中 http://.... 格式的图片到本地
'转载请注明出处:http://www.jaron.cn http://www.csdn.net/develop
'参数设置开始
url = request("url")
localaddr = server.MapPath("images_remote/") '保存到本地的目录
localdir = "images_remote/" 'http 访问的相对路径
AllowFileExt = "jpg|bmp|png|gif" '支持的文件名格式
'参数设置完毕

if createdir(localaddr) = false then
response.Write "创建目录失败,请检查目录权限"
response.End
end if
response.Write Convert2LocalAddr(url,localaddr,localdir)

function Convert2LocalAddr(url,localaddr,localdir)
'参数说明
'url 页面地址
'localaddr 保存本地的物理地址
'localdir 相对路径
strContent = getHTTPPage(url)
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<img.+?>"
Set Matches =objRegExp.Execute(strContent)
For Each Match in Matches
RetStr = RetStr & GetRemoteImages(Match.Value)
Next
ImagesArray=split(RetStr,"||")
RemoteImage=""
LocalImage=""
for i=1 to ubound(ImagesArray)
if ImagesArray(i)<>"" and instr(RemoteImage,ImagesArray(i))<1 then
fname=baseurl&cstr(i&mid(ImagesArray(i),instrrev(ImagesArray(i),".")))
ImagesFileName = ImagesArray(i)
AllowFileExtArray = split(AllowFileExt,"|")
isGetFile = false
for tmp = 0 to ubound(AllowFileExtArray)
if lcase(GetFileExt(ImagesFileName)) = ALlowFileExtArray(tmp) then
isGetFile=True
end if
next
if isGetFile = true then
newfilename = GenerateRandomFileName(fname)
call Save2Local(ImagesFileName,localaddr & "/" & newfilename)
RemoteImage=RemoteImage&"||"& ImagesFileName
LocalImage=LocalImage&"||" & localdir & newfilename
end if
end if
next
arrnew=split(LocalImage,"||")
arrall=split(RemoteImage,"||")
for i=1 to ubound(arrnew)
strContent=replace(strContent,arrall(i),arrnew(i))
next
Convert2LocalAddr = strContent
end function

function GetRemoteImages(str)
Set objRegExp1 = New Regexp
objRegExp1.IgnoreCase = True
objRegExp1.Global = True
objRegExp1.Pattern = "http://.+? "
set mm=objRegExp1.Execute(str)
For Each Match1 in mm
tmpaddr = left(Match1.Value,len(Match1.Value)-1)
GetRemoteImages=GetRemoteImages&"||" & replace(replace(tmpaddr,"""",""),"'","")
next
end function

function getHTTPPage(url)
on error resume next
dim http
set http=Server.createobject("Msxml2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then exit function
getHTTPPage=bytes2BSTR(Http.responseBody)
set http=nothing
if err.number<>0 then err.Clear
end function

Function bytes2BSTR(vIn)
dim strReturn
dim i,ThisCharCode,NextCharCode
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function

function getHTTPimg(url)
on error resume next
dim http
set http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then exit function
getHTTPimg=Http.responseBody
set http=nothing
if err.number<>0 then err.Clear
end function

function Save2Local(from,tofile)
dim geturl,objStream,imgs
geturl=trim(from)
imgs=gethttpimg(geturl)
Set objStream = Server.CreateObject("ADODB.Stream")
objStream.Type =1
objStream.Open
objstream.write imgs
objstream.SaveToFile tofile,2
objstream.Close()
set objstream=nothing
end function

function geturlencodel(byval url)'中文文件名转换
Dim i,code
geturlencodel=""
if trim(Url)="" then exit function
for i=1 to len(Url)
code=Asc(mid(Url,i,1))
if code<0 Then code = code + 65536
If code>255 Then
geturlencodel=geturlencodel&"%"&Left(Hex(Code),2)&"%"&Right(Hex(Code),2)
else
geturlencodel=geturlencodel&mid(Url,i,1)
end if
next
end function

Function GenerateRandomFileName(ByVal szFilename) '根据原文件名,自动以日期YYYY-MM-DD-RANDOM格式生成新文件名
Randomize
ranNum = Int(90000 * Rnd) + 10000
If Month(Now) < 10 Then c_month = "0" & Month(Now) Else c_month = Month(Now)
If Day(Now) < 10 Then c_day = "0" & Day(Now) Else c_day = Day(Now)
If Hour(Now) < 10 Then c_hour = "0" & Hour(Now) Else c_hour = Hour(Now)
If Minute(Now) < 10 Then c_minute = "0" & Minute(Now) Else c_minute = Minute(Now)
If Second(Now) < 10 Then c_second = "0" & Second(Now) Else c_second = Minute(Now)
fileExt_a = Split(szFilename, ".")
FileExt = LCase(fileExt_a(UBound(fileExt_a)))
GenerateRandomFileName = Year(Now) & c_month & c_day & c_hour & c_minute & c_second & "_" & ranNum & "." & FileExt
End Function

Function CreateDIR(ByVal LocalPath) '建立目录的程序,如果有多级目录,则一级一级的创建
On Error Resume Next
LocalPath = Replace(LocalPath, "\", "/")
Set FileObject = server.CreateObject("Scripting.FileSystemObject")
patharr = Split(LocalPath, "/")
path_level = UBound(patharr)
For I = 0 To path_level
If I = 0 Then pathtmp = patharr(0) & "/" Else pathtmp = pathtmp & patharr(I) & "/"
cpath = Left(pathtmp, Len(pathtmp) - 1)
If Not FileObject.FolderExists(cpath) Then FileObject.CreateFolder cpath
Next
Set FileObject = Nothing
If Err.Number <> 0 Then
CreateDIR = False
Err.Clear
Else
CreateDIR = True
End If
End Function

function GetfileExt(byval filename)
fileExt_a=split(filename,".")
GetfileExt=lcase(fileExt_a(ubound(fileExt_a)))
end function
%>
...全文
67 40 打赏 收藏 转发到动态 举报
写回复
用AI写文章
40 条回复
切换为时间正序
请发表友善的回复…
发表回复
liyan010 2003-12-25
  • 打赏
  • 举报
回复
save
xiaobaowu 2003-12-18
  • 打赏
  • 举报
回复
mark
ssht968 2003-12-12
  • 打赏
  • 举报
回复
good
lovehwq21 2003-11-13
  • 打赏
  • 举报
回复
好东西,收藏先,有时间再实现一下,谢谢楼主了
whb147 2003-11-13
  • 打赏
  • 举报
回复
谢谢,有些能够下载下来,有些不行,我昨天就是一张也没有down下来,今天可以了,我在下载论坛里的
但是好多论坛贴图下载的时候,需要登陆,好想是不能直接访问,晕……
好东西,谢谢啦
whb147 2003-11-13
  • 打赏
  • 举报
回复
没有提示:状态栏显示完成了,但是,下载下来的只是图片名称,没有图片内容呀,就1-2k,要不就是几个字节,怎么回事??
Primer2002cn 2003-11-13
  • 打赏
  • 举报
回复
mark
Jaron 2003-11-13
  • 打赏
  • 举报
回复
有错误提示没?
Jaron 2003-11-12
  • 打赏
  • 举报
回复
这个程序包含了XMLHTTP,正则表达式、FSO、数组等的相关示例,希望对大家有用,呵呵。
zorou_fatal 2003-11-12
  • 打赏
  • 举报
回复
靠,刚开始不能打开新浪的。
后来好了。
^_^
超级大笨狼 2003-11-12
  • 打赏
  • 举报
回复
这个程序目的的优点是“自动”,功能类似teleport
代替你手工下载
比如你想下载某一素材或者写真集网站(嘿嘿,我可是超级大色狼哦!)全部图片,就利用这个代码修改。结合网址url规则,遍历所有页面。
能否实现我有时间的时候实验一下
把www.legfoot.com里面的图片全下载来
teleport功能强大,所以很多网站禁止teleport连接了,楼主的做法不禁为我们asp的应用开辟了新领域,而且解决了超级图片狂使用teleport的问题。
收藏!!强烈收藏!!
ceocio 2003-11-12
  • 打赏
  • 举报
回复
感谢jaron兄
whb147 2003-11-12
  • 打赏
  • 举报
回复
我怎么什么也下载不了呀,
我输入:http://hngis/test/save2local.asp?url=http://ent.sina.com.cn/s/m/2003-11-11/1411231388.html

hngis是本地的服务器
h2high 2003-11-12
  • 打赏
  • 举报
回复
收藏
KUMOZAKI 2003-11-12
  • 打赏
  • 举报
回复
Jaron (唐伯虎点蚊香) | 我的偶像 + 崇拜 (*^_^*)

能不能讲一讲学习这么多语言成功的捷径? 想学习 + 模仿 !
KUMOZAKI 2003-11-12
  • 打赏
  • 举报
回复
看下去可能真的要半天才能弄点小明(白)!
lencho2003 2003-11-12
  • 打赏
  • 举报
回复
有没有XML基础的网站,介绍一下
cdsun 2003-11-12
  • 打赏
  • 举报
回复
我还没开始学

不过我看看阿
blueice2002 2003-11-12
  • 打赏
  • 举报
回复
刚开始学XMLHTTP
GageCSDN 2003-11-12
  • 打赏
  • 举报
回复
好东东啊,值得收藏学习。
加载更多回复(20)

28,391

社区成员

发帖
与我相关
我的任务
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
  • ASP
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧