基于垂直搜索引擎的旅游线路评价推荐系统的设计与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 绪论 | 第10-15页 |
| ·课题研究背景和意义 | 第10-11页 |
| ·国内外研究现状 | 第11-13页 |
| ·课题主要工作与创新 | 第13页 |
| ·论文的组织结构 | 第13-15页 |
| 第二章 搜索引擎原理与技术 | 第15-32页 |
| ·搜索引擎的原理 | 第15-19页 |
| ·通用搜索引擎原理 | 第15-16页 |
| ·垂直搜索引擎原理 | 第16-19页 |
| ·垂直搜索引擎的关键技术 | 第19-24页 |
| ·面向主题的高效爬虫程序 | 第19-20页 |
| ·网页信息的提取 | 第20-21页 |
| ·中文分词技术 | 第21-23页 |
| ·主题相关度的判断 | 第23-24页 |
| ·Heritrix 框架的研究 | 第24-28页 |
| ·Heritrix 介绍 | 第24-26页 |
| ·Heritrix 系统架构 | 第26-28页 |
| ·HtmlParser 的研究 | 第28-29页 |
| ·Lucene 搜索引擎的研究 | 第29-31页 |
| ·Lucene 的简介 | 第29页 |
| ·Lucene 组织结构 | 第29-31页 |
| ·本章小结 | 第31-32页 |
| 第三章 旅游线路评价推荐系统的设计 | 第32-55页 |
| ·系统的功能与目的 | 第32页 |
| ·系统的总体结构设计 | 第32-36页 |
| ·系统分析 | 第32-35页 |
| ·旅行线路搜索流程分析 | 第35-36页 |
| ·旅游主题爬虫的设计 | 第36-38页 |
| ·选用Heritrix 爬虫框架的原因 | 第36-37页 |
| ·Heritrix 的扩展定制 | 第37-38页 |
| ·种子站点选择方案 | 第38页 |
| ·网页信息提取与分类模块的设计 | 第38-42页 |
| ·网页信息的提取 | 第38-40页 |
| ·文档分类优化设计 | 第40-41页 |
| ·信息审核、验证、跟踪 | 第41-42页 |
| ·系统数据存储模块的设计 | 第42-45页 |
| ·路线存储设计 | 第43-44页 |
| ·其他旅游资讯的存储 | 第44-45页 |
| ·数据管理系统的设计 | 第45-46页 |
| ·系统内部维护管理 | 第45-46页 |
| ·系统外部维护管理 | 第46页 |
| ·线路动态评分模型的设计 | 第46-51页 |
| ·旅游线路动态评分模型的设计 | 第46-48页 |
| ·旅游线路动态评分模型的分析验证 | 第48-51页 |
| ·旅游线路推荐值的动态更新 | 第51页 |
| ·线路索引、搜索模块的设计 | 第51-53页 |
| ·路线信息的索引 | 第51-52页 |
| ·路线信息的搜索 | 第52-53页 |
| ·路线交互展示模块的设计 | 第53-54页 |
| ·本章小结 | 第54-55页 |
| 第四章 旅游线路评价推荐系统的实现 | 第55-81页 |
| ·旅游主题爬虫的实现 | 第55-60页 |
| ·网页信息提取与分类模块的实现 | 第60-65页 |
| ·主题向量的计算 | 第60-61页 |
| ·主题判断阀值的测试 | 第61页 |
| ·网页信息的提取 | 第61-62页 |
| ·网页信息分类 | 第62-65页 |
| ·系统数据存储模块的实现 | 第65-69页 |
| ·路线数据存储(XML)实现 | 第65-68页 |
| ·基础数据存储实现 | 第68-69页 |
| ·数据管理系统的实现 | 第69-70页 |
| ·内部数据管理系统 | 第69-70页 |
| ·外部数据管理系统 | 第70页 |
| ·旅游线路动态评分模型的实现 | 第70-73页 |
| ·线路索引、搜索模块的实现 | 第73-75页 |
| ·路线的索引 | 第73-74页 |
| ·路线的检索 | 第74-75页 |
| ·路线交互展示模块的实现 | 第75-80页 |
| ·本章小结 | 第80-81页 |
| 第五章 总结与展望 | 第81-83页 |
| 致谢 | 第83-84页 |
| 参考文献 | 第84-87页 |
| 攻读硕士期间获取的研究成果 | 第87-88页 |