基于WEB挖掘的网络蜘蛛的研究与实现

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-15页
·研究背景	第9-10页
·研究现状	第10-12页
·论文主要工作	第12-13页
·论文组织	第13-15页
第二章搜索引擎概述	第15-18页
·搜索引擎的定义	第15页
·搜索引擎的分类	第15-16页
·搜索引擎的工作原理	第16-18页
第三章网络蜘蛛概述	第18-20页
·网络蜘蛛及在搜索引擎中的作用	第18页
·网络蜘蛛的结构	第18-19页
·网络蜘蛛抓取网页策略	第19-20页
第四章 WEB 挖掘技术概述	第20-31页
·WEB 挖掘定义	第20页
·WEB 挖掘技术	第20-25页
·Web 内容挖掘	第21-23页
·Web 结构挖掘	第23-24页
·Web 日志挖掘	第24-25页
·HITS 算法和PAGERANK 算法	第25-31页
·HITS 算法	第25-29页
·PageRank 算法	第29-31页
第五章技术概述	第31-38页
·HTTP 协议	第31-33页
·HTTP 协议的关键性质	第31页
·HTTP 协议的主要方法	第31-32页
·HTTP 协议的信息头格式	第32-33页
·正则表达式	第33-34页
·正则表达式概述	第33页
·正则表达式在VB.NET 中的应用	第33-34页
·多线程技术	第34-36页
·线程的创建	第34-35页
·线程的优先级	第35页
·多线程的同步	第35-36页
·线程池	第36页
·ADO.NET 技术	第36-38页
第六章网络蜘蛛的设计与实现	第38-60页
·网络蜘蛛的分析与设计	第38-43页
·网络蜘蛛关键技术	第38页
·蜘蛛程序的结构	第38-39页
·网络蜘蛛的工作过程	第39-40页
·URL 队列管理	第40-41页
·数据库设计	第41-42页
·数据压缩算法zlib	第42-43页
·网络蜘蛛的实现	第43-60页
·WEB 页面信息提取模块的实现	第43-45页
·超链接分析模块的实现	第45-48页
·网页内容分析模块的实现	第48-49页
·网络蜘蛛主要进程的的设计和实现	第49-54页
·数据库连结的实现	第54-57页
·网络蜘蛛实验结果	第57-60页
第七章总结	第60-62页
参考文献	第62-66页
研究生期间的研究成果	第66-67页
致谢	第67页