主题搜索引擎的研究与设计
摘要 | 第1-3页 |
Abstract | 第3-6页 |
第1章 引言 | 第6-13页 |
·搜索引擎的产生 | 第6-7页 |
·搜索引擎的发展 | 第7-8页 |
·搜索引擎的发展趋势 | 第8-9页 |
·智能化检索 | 第8页 |
·优化检索结果 | 第8-9页 |
·提高搜索引擎的针对性 | 第9页 |
·主题搜索引擎 | 第9-11页 |
·主题搜索引擎的产生 | 第10页 |
·主题搜索引擎的意义 | 第10-11页 |
·本文的工作 | 第11-13页 |
第2章 主题搜索引擎构架的设计 | 第13-29页 |
·爬行器 | 第14-18页 |
·爬行器的任务 | 第14-15页 |
·遵守Robot协议 | 第15-16页 |
·爬行器的系统结构 | 第16-18页 |
·索引器 | 第18-24页 |
·索引器的结构 | 第19-20页 |
·索引的概念 | 第20页 |
·倒排索引 | 第20-22页 |
·倒排索引的压缩 | 第22-24页 |
·检索器 | 第24-29页 |
·检索模型 | 第25-26页 |
·向量空间模型 | 第26-29页 |
第3章 主题搜索引擎的预处理阶段 | 第29-39页 |
·页面解析 | 第29-34页 |
·解析的原理 | 第31页 |
·超链接的提取 | 第31-33页 |
·语言识别 | 第33-34页 |
·索引词的选择 | 第34-39页 |
·去除停用词 | 第34-35页 |
·抽词技术 | 第35-39页 |
第4章 主题搜索引擎的主题爬行策略 | 第39-46页 |
·主题识别 | 第39-41页 |
·爬行起点的选择 | 第40页 |
·主题识别问题的描述 | 第40-41页 |
·主题爬行算法 | 第41-46页 |
·PageRank算法 | 第41-42页 |
·Fish Search算法 | 第42-43页 |
·改进的Fish Search算法 | 第43-46页 |
第5章 搜索引擎实现的相关技术 | 第46-56页 |
·Java数据库访问技术 | 第46-47页 |
·Java多线程技术 | 第47-50页 |
·Unicode | 第50-53页 |
·正则表达式 | 第53-56页 |
·正则表达式简介 | 第53-54页 |
·正则表达式语法 | 第54-56页 |
第6章 主题搜索引擎的评价 | 第56-59页 |
第7章 总结与展望 | 第59-61页 |
参考文献 | 第61-64页 |
致谢 | 第64-65页 |