扩展语景图聚焦爬取器实验研究
第1章 引言 | 第1-11页 |
第2章 聚焦搜索技术现状 | 第11-16页 |
·聚焦搜索技术述要 | 第11-13页 |
·现有聚焦爬取器存在的问题 | 第13-14页 |
·本文要解决的主要问题 | 第14-16页 |
第3章 扩展语景图聚焦爬取器原型设计 | 第16-24页 |
·设计原理 | 第16-18页 |
·基于扩展语景图聚焦爬取器 | 第18-19页 |
·扩展语景图构造及爬取过程 | 第19-20页 |
·扩展语景图及其表示 | 第20页 |
·元搜索 | 第20-21页 |
·下载器 | 第21页 |
·TF-IDF公式 | 第21-22页 |
·Naive Bayes分类器 | 第22-24页 |
·Bayes定理及Bayes规则 | 第22页 |
·训练 | 第22-23页 |
·分类 | 第23-24页 |
第4章 系统实现 | 第24-30页 |
·HTML分析器 | 第24页 |
·词频统计 | 第24-25页 |
·训练 | 第25页 |
·建立参考语料库 | 第25页 |
·通过TF-IDF确定类特征词条 | 第25页 |
·估算类特征词条概率 | 第25页 |
·分类 | 第25页 |
·扩展语景图生成 | 第25-26页 |
·通过代理服务器访问Internet | 第26-27页 |
·单用户功能 | 第27页 |
·服务器端集成 | 第27页 |
·软件实现 | 第27-29页 |
·实现总结 | 第29-30页 |
第5章 系统实验 | 第30-39页 |
·实验环境 | 第30页 |
·实验过程 | 第30-37页 |
·结果讨论 | 第37-39页 |
第6章 结束语 | 第39-41页 |
致谢 | 第41-44页 |
附录 | 第44-58页 |