垂直搜索引擎分类索引系统的设计与实现
摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
第1章 绪论 | 第9-14页 |
·研究背景及意义 | 第9-11页 |
·国内外研究现状 | 第11-12页 |
·主要研究内容 | 第12-13页 |
·论文章节安排 | 第13-14页 |
第2章 垂直搜索引擎技术 | 第14-27页 |
·垂直搜索引擎概述 | 第14-19页 |
·通用搜索引擎 | 第14-16页 |
·垂直搜索引擎 | 第16-18页 |
·搜索引擎的评价指标 | 第18-19页 |
·全文索引技术 | 第19-22页 |
·全文索引技术概述 | 第19-20页 |
·全文索引中索引的组织形式 | 第20-21页 |
·搜索引擎的倒排索引结构 | 第21-22页 |
·中文分词技术 | 第22-23页 |
·开源全文检索引擎Lucene概述 | 第23-26页 |
·Lucene索引的实现机制 | 第23-24页 |
·Lucene索引逻辑结构 | 第24-25页 |
·Lucene索引物理结构 | 第25-26页 |
·分类技术在垂直搜索引擎中的应用 | 第26-27页 |
第3章 领域网页分类器构建 | 第27-38页 |
·文本分类概述 | 第27-28页 |
·类别体系生成 | 第28-31页 |
·类别编号的设定 | 第29页 |
·类别概念集的生成 | 第29-31页 |
·领域网页分类器设计 | 第31页 |
·领域网页分类器实现 | 第31-38页 |
·文本预处理 | 第31-32页 |
·特征向量提取 | 第32页 |
·本体解析 | 第32-33页 |
·领域概念提取 | 第33页 |
·相似度计算 | 第33-35页 |
·分类算法 | 第35-38页 |
第4章 垂直搜索引擎分类索引系统设计 | 第38-51页 |
·分类索引系统的总体结构设计 | 第38-39页 |
·分类索引逻辑结构设计 | 第39-40页 |
·分类索引物理结构设计 | 第40-43页 |
·分类索引生成与压缩设计 | 第43-45页 |
·分类索引生成 | 第43-44页 |
·分类索引的压缩 | 第44-45页 |
·分类索引的维护和优化 | 第45-47页 |
·索引维护 | 第45-46页 |
·索引的优化 | 第46-47页 |
·分类索引在检索中的应用 | 第47-51页 |
第5章 垂直搜索引擎分类索引系统实现 | 第51-57页 |
·开发环境配置 | 第51页 |
·开发语言——Java | 第51页 |
·集成开发环境——Eclipse | 第51页 |
·语义Web应用开发工具包——Jena | 第51页 |
·原型系统实现 | 第51-57页 |
·中文分词模块 | 第51-54页 |
·文本分类模块 | 第54-56页 |
·索引创建模块 | 第56-57页 |
第6章 实验评估 | 第57-62页 |
·实验数据 | 第57页 |
·评估方法 | 第57-58页 |
·文本分类评估方法 | 第57页 |
·索引评估方法 | 第57-58页 |
·实验结果与分析 | 第58-62页 |
·文本分类的结果与分析 | 第58-59页 |
·索引结果与分析 | 第59-62页 |
第7章 总结与展望 | 第62-64页 |
·论文总结 | 第62-63页 |
·作展望 | 第63-64页 |
参考文献 | 第64-67页 |
攻读学位期间公开发表论文 | 第67-68页 |
致谢 | 第68-69页 |
研究生履历 | 第69-70页 |