网络蜘蛛垂直搜索算法的改进与实现
摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-14页 |
·课题的目的和意义 | 第10页 |
·课题的国内外研究现状 | 第10-12页 |
·课题研究的主要内容 | 第12-13页 |
·本文的组织结构 | 第13-14页 |
第2章 相关技术 | 第14-34页 |
·搜索引擎概述 | 第14-17页 |
·搜索引擎的概念 | 第14-15页 |
·搜索引擎的分类 | 第15-16页 |
·垂直搜索引擎 | 第16-17页 |
·网络蜘蛛概述 | 第17-19页 |
·ε-贪婪策略 | 第19-20页 |
·MD5算法 | 第20-21页 |
·HTML语言 | 第21-25页 |
·文本 | 第22页 |
·注释 | 第22-23页 |
·三种标签 | 第23-24页 |
·绝对URL与相对URL | 第24-25页 |
·HTTP协议 | 第25-28页 |
·HTTP的操作过程 | 第25-26页 |
·HTTP报文结构 | 第26-28页 |
·正则表达式 | 第28-31页 |
·Java线程 | 第31-33页 |
·线程概念 | 第31-32页 |
·多线程的优点 | 第32-33页 |
·本章小节 | 第33-34页 |
第3章 网络蜘蛛搜索算法的研究 | 第34-46页 |
·网络蜘蛛的通用搜索算法 | 第34-36页 |
·深度优先搜索算法 | 第34-35页 |
·广度优先搜索算法 | 第35页 |
·递归与非递归程序结构 | 第35-36页 |
·网络蜘蛛垂直搜索策略 | 第36-42页 |
·基于内容评价的搜索策略 | 第36-37页 |
·基于链接结构评价的搜索策略 | 第37-39页 |
·基于未来回报价值评价的搜索策略 | 第39-41页 |
·基于综合价值评价的搜索策略 | 第41页 |
·基于动态价值评价的搜索策略 | 第41-42页 |
·现有启发式搜索算法分析 | 第42-45页 |
·本章小结 | 第45-46页 |
第4章 网路蜘蛛垂直搜索算法的改进 | 第46-51页 |
·链接价值的估计 | 第46-47页 |
·阈值的估计和ε—贪婪策略相结合 | 第47-48页 |
·链接的MD5映射 | 第48页 |
·改进后的搜索算法 | 第48-50页 |
·本章小结 | 第50-51页 |
第5章 垂直搜索网络蜘蛛的设计与实现 | 第51-62页 |
·垂直搜索网络蜘蛛的设计 | 第51-57页 |
·用例设计 | 第51-52页 |
·类设计 | 第52-57页 |
·垂直搜索网络蜘蛛的实现 | 第57-61页 |
·程序初始化 | 第57-58页 |
·抓取网页 | 第58-60页 |
·程序结束 | 第60-61页 |
·本章小结 | 第61-62页 |
第6章 手机行业网站的搜索实验 | 第62-68页 |
·针对链接价值的实验 | 第62页 |
·针对链接选择的实验 | 第62-66页 |
·针对链接MD5映射的实验 | 第66页 |
·本章小结 | 第66-68页 |
结论 | 第68-70页 |
参考文献 | 第70-74页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第74-75页 |
致谢 | 第75页 |