摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-21页 |
·选题的背景与研究意义 | 第9-12页 |
·搜索引擎研究综述 | 第12-19页 |
·国内外搜索引擎研究的背景和进展 | 第12-14页 |
·传统搜索引擎存在的问题 | 第14-15页 |
·搜索引擎的分布式智能化趋势 | 第15-19页 |
·研究的内容和方法 | 第19-21页 |
·研究的内容 | 第19页 |
·研究的方法 | 第19-21页 |
第2章 搜索引擎的原理和实现技术 | 第21-40页 |
·搜索引擎原理及相关关键技术 | 第21-34页 |
·搜索引擎理论基础 | 第21-22页 |
·搜索引擎工作原理 | 第22-26页 |
·分词原理 | 第26-31页 |
·索引组织方法 | 第31-34页 |
·面向搜索引擎的分布式计算技术 | 第34-40页 |
·分布式计算的工作原理 | 第34-35页 |
·网格计算 | 第35-36页 |
·云计算 | 第36-37页 |
·Map/Reduce计算模型 | 第37-40页 |
第3章 面向智能搜索引擎的Lucene、Hadoop的理论与技术研究 | 第40-50页 |
·面向智能搜索引擎Lucene的原理研究 | 第40-43页 |
·Lucene系统的结构组织 | 第40-41页 |
·Lucene数据流分析 | 第41-42页 |
·Lucene索引的数据结构 | 第42-43页 |
·面向智能搜索引擎Hadoop的框架研究 | 第43-50页 |
·Hadoop基本结构 | 第43-44页 |
·HDFS | 第44-47页 |
·Hadoop中的Map/Reduce实现 | 第47-50页 |
第4章 IEBSou分布式智能搜索引擎研究 | 第50-75页 |
·分布式智能槽索的需求 | 第50-51页 |
·IEBSou结构模型研究 | 第51-53页 |
·信息采集原理 | 第53-61页 |
·Robots Exclusion Protocol | 第55-57页 |
·网页抓取 | 第57页 |
·文档解析 | 第57-58页 |
·网页消重 | 第58-61页 |
·语言分析技术 | 第61-64页 |
·新词识别算法 | 第62-63页 |
·专有名词识别算法 | 第63-64页 |
·IEBSou索引理论 | 第64-73页 |
·倒排索引 | 第65-69页 |
·概念库构建 | 第69-73页 |
·IEBSou检索功能设计 | 第73-75页 |
第5章 IEBSou分布式智能搜索引擎的实现 | 第75-109页 |
·IEBSou环境搭建 | 第75-79页 |
·IEBSou的Map/Reduce基础平台 | 第79-83页 |
·信息采集模块的实现 | 第83-96页 |
·基于Map/Reduce基础平台的设计 | 第83-89页 |
·文档解析框架 | 第89-96页 |
·语言分析模块的实现 | 第96-103页 |
·分词词典的设计 | 第96-101页 |
·IEBChinese Analyzer的实现 | 第101-103页 |
·索引模块的构建 | 第103-105页 |
·检索模块与EC语义词典的集成 | 第105-108页 |
·IEBSou运行界面 | 第108-109页 |
第6章 全文总结与研究展望 | 第109-112页 |
·全文总结 | 第109-110页 |
·全文主要内容 | 第109-110页 |
·主要创新点 | 第110页 |
·研究展望 | 第110-112页 |
参考文献 | 第112-118页 |
在读期间参加的科研项目 | 第118-119页 |
在读期间发表的论文 | 第119-120页 |
致谢 | 第120页 |