Deep Web数据源的发现与聚类研究

摘要	第1-6页
ABSTRACT	第6-14页
第一章绪论	第14-22页
·课题研究背景	第14-17页
·Deep Web的概念	第14-15页
·Deep Web的资源	第15-17页
·国内外研究现状	第17-19页
·课题研究内容	第19-20页
·论文组织结构	第20-22页
第二章背景知识	第22-32页
·HTTP协议简介	第22-27页
·HTTP请求	第22-25页
·HTTP响应	第25-27页
·HTML简介	第27-31页
·HTML标签	第27-28页
·HTML表单	第28-31页
·本章小结	第31-32页
第三章 Web数据库的发现	第32-40页
·网络爬虫技术	第32-33页
·网络爬虫的原理	第32页
·网络爬虫的搜索策略	第32-33页
·Deep Web爬虫	第33-37页
·爬虫的流程	第33-34页
·HTTP响应的字符集	第34-35页
·超链接的抽取	第35-37页
·查询接口的识别	第37-38页
·本章小结	第38-40页
第四章查询接口模式的抽取与存储	第40-56页
·查询接口模式的定义	第40页
·查询接口模式的表示	第40-41页
·查询接口模式的抽取	第41-50页
·文档对象模型	第41-43页
·查询接口模式抽取的难点	第43-45页
·基于坐标的查询接口模式抽取	第45-50页
·查询接口模式的存储	第50-54页
·数据库的设计	第50-52页
·存储的实现	第52-54页
·本章小结	第54-56页
第五章 Web数据库的聚类	第56-70页
·文本聚类算法	第56-60页
·基于划分的聚类	第56-57页
·基于层次的聚类	第57-58页
·基于后缀树的聚类	第58-59页
·基于频繁项集的聚类	第59-60页
·基于频繁项集的Web数据库聚类	第60-67页
·算法的基本思想	第60页
·文本的表示	第60-61页
·特征项的加权	第61-63页
·频繁项集的挖掘	第63-64页
·基于频繁项的聚类	第64-67页
·算法的优点	第67-68页
·本章小结	第68-70页
第六章实验结果与分析	第70-76页
·实验数据	第70页
·查询接口识别实验	第70-72页
·查询接口模式抽取实验	第72-74页
·Web数据库聚类实验	第74-76页
第七章总结与展望	第76-78页
·工作总结	第76-77页
·工作展望	第77-78页
参考文献	第78-82页
致谢	第82-84页
研究成果及发表的学术论文	第84-86页
作者和导师简介	第86-87页
北京化工大学硕士研究生学位论文答辩委员会决议书	第87-88页