摘要 | 第1-5页 |
Abstract | 第5-10页 |
第一章 引言 | 第10-15页 |
·课题背景介绍 | 第10-11页 |
·网络机器人研究现状 | 第11-12页 |
·研究的目的与意义 | 第12-13页 |
·课题研究的主要内容 | 第13-15页 |
第二章 网络机器人技术概述 | 第15-26页 |
·通用网络机器人技术 | 第15-17页 |
·主题网络机器人 | 第17-20页 |
·主题网络机器人的系统结构 | 第17-18页 |
·主题网络机器人的工作原理 | 第18-20页 |
·通用网络机器人与主题网络机器人比较 | 第20-22页 |
·主题页面的分布特征 | 第22-24页 |
·主题邻近特性 | 第22页 |
·主题孤岛特性 | 第22-23页 |
·隧道特性 | 第23-24页 |
·评价主题网络机器人的方法 | 第24-26页 |
第三章 主题网络机器人的算法分析 | 第26-33页 |
·基于超链接分析的算法 | 第26-29页 |
·PageRank 算法 | 第26-27页 |
·HITS 算法 | 第27-28页 |
·比较PageRank 算法和HITS 算法 | 第28-29页 |
·基于URL 的主题相关性算法 | 第29-30页 |
·Best First Search 算法 | 第29页 |
·Fish Search 算法 | 第29-30页 |
·Shark Search 算法 | 第30页 |
·基于页面的主题性相关算法 | 第30-33页 |
·向量距离算法 | 第30-31页 |
·贝叶斯算法 | 第31页 |
·KNN 算法 | 第31-33页 |
第四章 基于URL 分析的主题网络机器人的研究与设计 | 第33-54页 |
·主题网络机器人的总体设计 | 第33-38页 |
·模块划分 | 第33-34页 |
·系统流程 | 第34-36页 |
·线程管理 | 第36-38页 |
·HTTP 下载模块 | 第38-42页 |
·HTTP 协议分析 | 第38-41页 |
·域名解析 | 第41-42页 |
·网页预处理模块 | 第42-45页 |
·HTML 协议基本语法分析 | 第42-44页 |
·URL 提取 | 第44-45页 |
·主题相关性分析模块 | 第45-46页 |
·URL 分析模块 | 第46-52页 |
·重复URL 分析 | 第46-47页 |
·URL 评价 | 第47-49页 |
·与URL 等待队列相关的内存使用优化算法 | 第49-52页 |
·隧道穿越模块 | 第52-54页 |
第五章 测试与分析 | 第54-61页 |
·实验环境 | 第54页 |
·实验结果的评价标准 | 第54-55页 |
·实验参照的算法 | 第55页 |
·测试结果与分析 | 第55-61页 |
第六章 总结 | 第61-64页 |
·本文的工作总结 | 第61-62页 |
·不足和展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-68页 |
攻硕期间所取得的成果 | 第68-69页 |