取出HTML里面的图片地址

    技术2022-05-11  72

    以下是取出HTML里面的图片地址的函数:

    主要原理就是用正则判断 <img> 的<src>属性。这在采集程序中将非常有用。

    函数如下:

    Function ShowPic(str) Set objRegExp = New Regexp'设置配置对象  objRegExp.IgnoreCase = True'忽略大小写  objRegExp.Global = True'设置为全文搜索  objRegExp.Pattern = "<img.+?>" '为了确保能准确地取出图片地址所以分为两层配置:首先找到里面的<img>标签,然后再取出里面的图片地址后面的getimgs函数就是实现后一个功能的。  strs=trim(str)  Set Matches =objRegExp.Execute(strs)'开始执行配置  For Each Match in Matches   RetStr = RetStr &getimgs( Match.Value )'执行第二轮的匹配  Next  ShowPic = RetStrEnd Function

    Function getimgs(str)  getimgs=""  Set objRegExp1 = New Regexp  objRegExp1.IgnoreCase = True  objRegExp1.Global = True  objRegExp1.Pattern = "http://.+?"""'取出里面的地址  set mm=objRegExp1.Execute(str)  For Each Match1 in mm   getimgs=getimgs&left(Match1.Value,len(Match1.Value)-1)&"||"'把里面的地址串起来备用  next End Function

    '取得图片内容function getHTTPPage(url)  on error resume next  dim http  set http=server.createobject("MSXML2.XMLHTTP")'使用xmlhttp的方法来获得图片的内容  Http.open "GET",url,false  Http.send()  if Http.readystate<>4 then  exit function  end if  getHTTPPage=Http.responseBody  set http=nothing  if err.number<>0 then err.Clear end function

    '保存图片function saveimage(from,tofile)  dim geturl,objStream,imgs  geturl=trim(from)  imgs=gethttppage(geturl)'取得图片的具休内容的过程  Set objStream = Server.CreateObject("ADODB.Stream")'建立ADODB.Stream对象,必须要ADO 2.5以上版本  objStream.Type =1'以二进制模式打开  objStream.Open  objstream.write imgs'将字符串内容写入缓冲  objstream.SaveToFile server.mappath(tofile),2'-将缓冲的内容写入文件  objstream.Close()'关闭对象  set objstream=nothing end function

    '调用实例Dim strpic,i,fnamestrpic = ShowPic("<DIV align=center><IMG src=""HTTP://www.wind88.net/picture/20070206/20072615561663.jpg"" border=0></DIV>")strpic = Split(strpic,"||")If UBound(strpic) > 0 Then  For i = 0 To UBound(strpic) - 1  '保存图片  fname=cstr(i&mid(strpic(i),instrrev(strpic(i),".")))   saveimage(strpic(i),fname) NextElseEnd If

     

    最新回复(0)