基于Lucene的汽车信息垂直搜索引擎的设计与实现
摘要 | 第1-4页 |
Abstract | 第4-9页 |
1 绪论 | 第9-17页 |
·研究背景 | 第9-10页 |
·通用搜索引擎 | 第10-13页 |
·搜索引擎的发展历史及分类 | 第10-11页 |
·通用搜索引擎面临的问题 | 第11-12页 |
·搜索引擎未来的发展趋势 | 第12-13页 |
·垂直搜索引擎 | 第13-14页 |
·垂直搜索引擎的优势 | 第13页 |
·垂直搜索引擎研究现状 | 第13-14页 |
·LUCENE搜索引擎工具包 | 第14-15页 |
·本文组织结构 | 第15-17页 |
2 垂直搜索引擎关键技术 | 第17-25页 |
·专业网络爬虫技术 | 第17-19页 |
·专业爬虫工作原理及关键技术 | 第17-18页 |
·主题相关度判定 | 第18-19页 |
·网页搜索策略 | 第19页 |
·WEB信息抽取技术 | 第19-25页 |
·Web信息抽取技术概述 | 第19-20页 |
·Web信息抽取方法 | 第20-21页 |
·基于HTMLParser的Web信息抽取 | 第21页 |
·HTMLParser对Web信息处理算法 | 第21-25页 |
3 基于LUCENE的索引与查询 | 第25-35页 |
·LUCENE全文检索的实现机制 | 第25-26页 |
·LUCENE信息索引 | 第26-29页 |
·索引分类 | 第26页 |
·Lucene索引结构 | 第26-29页 |
·LUCENE查询处理 | 第29-32页 |
·LUCENE结果排序 | 第32-33页 |
·Lucene排序相关性因素 | 第32页 |
·Lucene排序计算体系 | 第32-33页 |
·Lucene排序公式 | 第33页 |
·LUCENE与NUTCH | 第33-35页 |
·Nutch概述 | 第33-34页 |
·Nutch系统结构 | 第34-35页 |
4 汽车信息垂直搜索系统分析与设计 | 第35-43页 |
·汽车信息垂直搜索系统需求分析 | 第35-36页 |
·业务分析 | 第35页 |
·基本功能需求分析 | 第35-36页 |
·汽车信息垂直搜索系统结构 | 第36-39页 |
·信息抓取模块 | 第36-37页 |
·信息预处理模块 | 第37-38页 |
·检索服务模块 | 第38-39页 |
·汽车信息垂直搜索系统用例模型 | 第39-40页 |
·角色的确定 | 第39页 |
·创建用例 | 第39-40页 |
·汽车信息垂直搜索系统动态模型 | 第40-43页 |
5 汽车信息垂直搜索系统实现 | 第43-63页 |
·系统开发环境 | 第43页 |
·汽车主题信息抓取 | 第43-53页 |
·主题关键词管理 | 第44-45页 |
·主题URL管理 | 第45-50页 |
·主题信息下载 | 第50-53页 |
·汽车主题信息分析与索引 | 第53-57页 |
·网页信息分析 | 第54页 |
·创建索引 | 第54-57页 |
·汽车主题信息检索 | 第57-60页 |
·检索实现 | 第57-58页 |
·检索结果排序 | 第58-59页 |
·检索结果返回 | 第59-60页 |
·相关检索词的智能推荐算法 | 第60-63页 |
·建立概念词集合 | 第60页 |
·概念词同现率计算 | 第60-61页 |
·概念相关词的生成 | 第61-62页 |
·概念集的建立 | 第62页 |
·概念集的维护 | 第62页 |
·检索相关词的生成 | 第62-63页 |
6 总结与展望 | 第63-64页 |
·系统总结 | 第63页 |
·系统不足与展望 | 第63-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-67页 |
硕士研究生学习阶段发表论文 | 第67页 |