基于概念树的主题爬取技术研究

摘要	第1-8页
Abstract	第8-10页
插图索引	第10-11页
附表索引	第11-12页
第1章绪论	第12-23页
·概述	第12-14页
·主题爬取技术的研究现状	第14-18页
·现有主题爬取技术存在的问题和不足	第18-19页
·选题背景及意义	第19-20页
·本文的主要工作和创新点	第20-21页
·本文的主要工作	第20-21页
·本文的创新点	第21页
·本文的组织结构	第21-22页
·小结	第22-23页
第2章主题爬取的相关技术基础	第23-32页
·Web页面爬取原理	第23-25页
·操作表示	第23-24页
·爬取机理	第24页
·Web页面爬取	第24-25页
·网络机器人关键技术	第25-31页
·分析HTTP协议	第25-28页
·网络机器人排斥机制	第28-31页
·小结	第31-32页
第3章基于概念树的主题爬取方法	第32-49页
·概念及概念树	第32-34页
·基于概念树的主题搜索机器人的工作原理	第34-36页
·系统结构	第34-36页
·算法步骤	第36页
·基于概念树的主题爬取方法的关键技术	第36-48页
·主题层次的构造	第36-37页
·HTML的解析	第37-41页
·基于主题层次的Web文档的自动分类	第41-45页
·URL链接的分类与排序	第45-47页
·地址格式的分析	第47-48页
·小结	第48-49页
第4章基于概念树的主题搜索机器人原型实现	第49-57页
·模型简化	第49-50页
·系统设计与实现	第50-56页
·程序结构	第50-52页
·系统结构	第52-53页
·主要类的属性与方法描述	第53-56页
·小结	第56-57页
第5章实验	第57-68页
·实验目的与意义	第57页
·实验环境	第57-58页
·实验比较条件	第58-59页
·实验数据	第59-60页
·采集率分析	第60页
·模拟比较实验分析	第60-67页
·小结	第67-68页
结论	第68-70页
参考文献	第70-74页
致谢	第74-75页
附录A 攻读学位期间所发表的学术论文目录	第75页