| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第一章 绪论 | 第9-14页 |
| ·课题研究背景和意义 | 第9-10页 |
| ·国内外研究现状 | 第10-12页 |
| ·论文的研究意义和主要内容 | 第12-14页 |
| 第二章 经典网页排序算法分析 | 第14-23页 |
| ·PageRank算法 | 第14-17页 |
| ·PageRank算法的基本原理 | 第14-16页 |
| ·PageRank算法的优点及缺陷 | 第16-17页 |
| ·超链接分析主题搜索算法(HITS) | 第17-21页 |
| ·算法原理 | 第17-19页 |
| ·算法计算公式 | 第19页 |
| ·算法的优点及缺陷 | 第19-21页 |
| ·对超链接分析主题搜索算法的改进工作 | 第21-22页 |
| ·自动资源整合算法(ARC算法) | 第21页 |
| ·改进的HITS算法 | 第21-22页 |
| 本章小结 | 第22-23页 |
| 第三章 基于用户习惯算法(BUHP算法)的提出 | 第23-32页 |
| ·BUHP算法提出的背景 | 第23-24页 |
| ·开放目录项目(ODP)主题划分研究 | 第24-25页 |
| ·词频位置的加权网页排序方法(TF-IDF)方法介绍 | 第25-26页 |
| ·词频位置的加权网页排序方法(TF-IDF)方法原理 | 第25-26页 |
| ·词频位置的加权网页排序方法(TF-IDF)方法的操作步骤 | 第26页 |
| ·文本相似度算法研究 | 第26-27页 |
| ·BUHP算法原理 | 第27页 |
| ·BUHP算法用户习惯信息的提取 | 第27-29页 |
| ·BUHP算法用户信息的数据化 | 第29页 |
| ·BUHP算法公式 | 第29-30页 |
| 本章小结 | 第30-32页 |
| 第四章 实验验证BUHP算法 | 第32-50页 |
| ·实验平台介绍 | 第32-39页 |
| ·开源项目介绍 | 第32页 |
| ·Lucene介绍 | 第32-36页 |
| ·Nutch介绍 | 第36-39页 |
| ·实验平台的搭建 | 第39-41页 |
| ·实验数据验证BUHP算法 | 第41-47页 |
| ·样本网页数据处理 | 第41-44页 |
| ·用户习惯信息处理 | 第44-46页 |
| ·BUHP算法计算结果 | 第46-47页 |
| ·实验结果分析及实验结论 | 第47-49页 |
| 本章小结 | 第49-50页 |
| 结论 | 第50-52页 |
| 参考文献 | 第52-55页 |
| 攻读硕士学位期间发表的学术论文 | 第55-56页 |
| 致谢 | 第56页 |