| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 1 绪论 | 第8-14页 |
| 1.1 选题背景 | 第8-9页 |
| 1.2 移动互联网内容相似性研究的意义 | 第9-10页 |
| 1.3 国内外研究现状概述 | 第10-13页 |
| 1.4 本文主要内容及章节安排 | 第13-14页 |
| 2 关键技术介绍 | 第14-23页 |
| 2.1 总体概述 | 第14页 |
| 2.2 网页正文抽取技术 | 第14-18页 |
| 2.3 网页相似性研究 | 第18-20页 |
| 2.4 本章小结 | 第20-23页 |
| 3 基于主题相似分块的网页正文抽取技术 | 第23-33页 |
| 3.1 基于分块的网页正文抽取技术 | 第23-24页 |
| 3.2 基于主题相似分块的网页正文抽取技术 | 第24-28页 |
| 3.3 性能分析 | 第28-32页 |
| 3.4 本章小结 | 第32-33页 |
| 4 基于特征词的网页相似性算法 | 第33-43页 |
| 4.1 基于特征词的网页相似性算法 | 第33-36页 |
| 4.2 关键技术 | 第36-40页 |
| 4.3 性能分析 | 第40-42页 |
| 4.4 本章小结 | 第42-43页 |
| 5 全文总结与展望 | 第43-45页 |
| 5.1 全文总结 | 第43页 |
| 5.2 展望 | 第43-45页 |
| 致谢 | 第45-46页 |
| 参考文献 | 第46-49页 |