关于重定向页面下载的办法

    技术2022-05-11  134

    页面重定向一般有两个页面,第一个页面是引导页,利用meta标签的HTTP-EQUIV=REFRESH重新获得新的页面地址。所以可以用一个页面标签解释的办法来取得新的页面地址。

    我们采用一个正则表达式:

    String express = "HTTP-EQUIV//s*=//s*/"*REFRESH/"*([^>]*)URL//s*=//s*([^>]*)>";

    来匹配引导页。如果匹配到有定向标签的就取得标签中的url,处理相对地址变为绝对地址,然后再下载这个地址的页面,这个过程可以迭代,直到没有匹配到定向标签,最后下载到的页面为最终页面。

     

    例子代码:

      private boolean tryRedirect(StringBuffer sb){

        String text = sb.toString();//取得页面正文

        if(matcher.contains(text,pattern)){//如果匹配表达式成功

          MatchResult result = matcher.getMatch();

          String url = result.group(2);//取得标签里面的新地址

          url = url.trim();

          if(url.charAt(url.length()-1)=='/''){

            url = url.substring(0,url.length()-1);

          }

          if(url.charAt(url.length()-1)=='/"'){

            url = url.substring(0,url.length()-1);

        }

          //转换相对地址为绝对地址

        currentURL=com.westwind.infogate.util.URLProcess.RelativelyToFull(url,currentURL);

        if(currentURL==null)

          return false;

        currentURL = URLProcess.addHttphead(currentURL);

        return true;

      }

     return false;

    }

     


    最新回复(0)