基于时态信息的主题搜索引擎的研究与实现
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 第1章 绪论 | 第8-15页 |
| ·研究背景和意义 | 第8-9页 |
| ·国内外研究现状 | 第9-13页 |
| ·搜索引擎技术 | 第9-10页 |
| ·主题搜索引擎 | 第10-11页 |
| ·时态信息 | 第11-13页 |
| ·本文的目标和研究内容 | 第13页 |
| ·本文的主要贡献 | 第13页 |
| ·本文的结构 | 第13-15页 |
| 第2章 国内外相关工作 | 第15-22页 |
| ·主题爬虫的研究概况 | 第15-19页 |
| ·主题爬虫的工作原理 | 第15-16页 |
| ·主题网页在Web 上的分布特征 | 第16-17页 |
| ·网页的搜索策略 | 第17页 |
| ·网页的分析算法 | 第17-19页 |
| ·时态信息检索的研究概况 | 第19-21页 |
| ·小结 | 第21-22页 |
| 第3章 基于 VIPS 和元搜索技术的主题爬虫 | 第22-32页 |
| ·引言 | 第22页 |
| ·相关工作及问题分析 | 第22-25页 |
| ·混合主题爬虫的系统结构 | 第25-27页 |
| ·爬取算法 | 第27-29页 |
| ·内容块分割算法 | 第27-28页 |
| ·网页相关性分析算法 | 第28-29页 |
| ·实验结果 | 第29-30页 |
| ·实验设计及评测方法 | 第29-30页 |
| ·实验结果与分析 | 第30页 |
| ·小结 | 第30-32页 |
| 第4章 基于时态信息的排序算法 | 第32-43页 |
| ·引言 | 第32页 |
| ·相关工作 | 第32-34页 |
| ·传统搜索引擎的排序方法 | 第32-34页 |
| ·基于时态信息的排序方法 | 第34页 |
| ·基于时态信息的 PageRank 改进算法 | 第34-40页 |
| ·PageRank 算法 | 第34-36页 |
| ·基于内容时间的改进算法 | 第36-38页 |
| ·基于修改时间的改进算法 | 第38-40页 |
| ·基于混合时态信息的排序算法 | 第40页 |
| ·实验结果 | 第40-42页 |
| ·实验设计及评测方法 | 第40-41页 |
| ·实验结果 | 第41-42页 |
| ·小结 | 第42-43页 |
| 第5章 Teegoo 的系统架构与界面设计 | 第43-56页 |
| ·引言 | 第43页 |
| ·Teegoo 架构方案选择 | 第43-45页 |
| ·Teegoo 系统架构设计 | 第45-48页 |
| ·Teegoo 系统架构 | 第45-47页 |
| ·Teegoo 主要功能模块 | 第47页 |
| ·Teegoo 系统工作流程 | 第47-48页 |
| ·Teegoo 的实现工具 | 第48-49页 |
| ·Teegoo 的界面设计 | 第49-52页 |
| ·Teegoo 查询实例 | 第52-53页 |
| ·Teegoo 结果显示 | 第53-55页 |
| ·小结 | 第55-56页 |
| 第6章 结论与展望 | 第56-58页 |
| ·本文总结 | 第56页 |
| ·展望 | 第56-58页 |
| 参考文献 | 第58-62页 |
| 致谢 | 第62-63页 |
| 在读期间发表的学术论文与取得的研究成果 | 第63页 |