网页内容提取和分析

    技术2022-05-11  83

    程序实现的内容包括:提取网页内容及其超链接。

    程序有三个类:SearchTest、Index和HTMLParse。

    SearchTest负责提供目标URL,然后传递给HTMLParse一个HTTP变量参数,在HTMLParse内对目标网页进行处理,得到网页内容及超链接,并将内容及超链信息传递给Index,进行索引,以备查询。 


    最新回复(0)