扩展语景图聚焦爬取器实验研究
| 第1章 引言 | 第1-11页 |
| 第2章 聚焦搜索技术现状 | 第11-16页 |
| ·聚焦搜索技术述要 | 第11-13页 |
| ·现有聚焦爬取器存在的问题 | 第13-14页 |
| ·本文要解决的主要问题 | 第14-16页 |
| 第3章 扩展语景图聚焦爬取器原型设计 | 第16-24页 |
| ·设计原理 | 第16-18页 |
| ·基于扩展语景图聚焦爬取器 | 第18-19页 |
| ·扩展语景图构造及爬取过程 | 第19-20页 |
| ·扩展语景图及其表示 | 第20页 |
| ·元搜索 | 第20-21页 |
| ·下载器 | 第21页 |
| ·TF-IDF公式 | 第21-22页 |
| ·Naive Bayes分类器 | 第22-24页 |
| ·Bayes定理及Bayes规则 | 第22页 |
| ·训练 | 第22-23页 |
| ·分类 | 第23-24页 |
| 第4章 系统实现 | 第24-30页 |
| ·HTML分析器 | 第24页 |
| ·词频统计 | 第24-25页 |
| ·训练 | 第25页 |
| ·建立参考语料库 | 第25页 |
| ·通过TF-IDF确定类特征词条 | 第25页 |
| ·估算类特征词条概率 | 第25页 |
| ·分类 | 第25页 |
| ·扩展语景图生成 | 第25-26页 |
| ·通过代理服务器访问Internet | 第26-27页 |
| ·单用户功能 | 第27页 |
| ·服务器端集成 | 第27页 |
| ·软件实现 | 第27-29页 |
| ·实现总结 | 第29-30页 |
| 第5章 系统实验 | 第30-39页 |
| ·实验环境 | 第30页 |
| ·实验过程 | 第30-37页 |
| ·结果讨论 | 第37-39页 |
| 第6章 结束语 | 第39-41页 |
| 致谢 | 第41-44页 |
| 附录 | 第44-58页 |