首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Deep Web数据源的发现与聚类研究

摘要第1-6页
ABSTRACT第6-14页
第一章 绪论第14-22页
   ·课题研究背景第14-17页
     ·Deep Web的概念第14-15页
     ·Deep Web的资源第15-17页
   ·国内外研究现状第17-19页
   ·课题研究内容第19-20页
   ·论文组织结构第20-22页
第二章 背景知识第22-32页
   ·HTTP协议简介第22-27页
     ·HTTP请求第22-25页
     ·HTTP响应第25-27页
   ·HTML简介第27-31页
     ·HTML标签第27-28页
     ·HTML表单第28-31页
   ·本章小结第31-32页
第三章 Web数据库的发现第32-40页
   ·网络爬虫技术第32-33页
     ·网络爬虫的原理第32页
     ·网络爬虫的搜索策略第32-33页
   ·Deep Web爬虫第33-37页
     ·爬虫的流程第33-34页
     ·HTTP响应的字符集第34-35页
     ·超链接的抽取第35-37页
   ·查询接口的识别第37-38页
   ·本章小结第38-40页
第四章 查询接口模式的抽取与存储第40-56页
   ·查询接口模式的定义第40页
   ·查询接口模式的表示第40-41页
   ·查询接口模式的抽取第41-50页
     ·文档对象模型第41-43页
     ·查询接口模式抽取的难点第43-45页
     ·基于坐标的查询接口模式抽取第45-50页
   ·查询接口模式的存储第50-54页
     ·数据库的设计第50-52页
     ·存储的实现第52-54页
   ·本章小结第54-56页
第五章 Web数据库的聚类第56-70页
   ·文本聚类算法第56-60页
     ·基于划分的聚类第56-57页
     ·基于层次的聚类第57-58页
     ·基于后缀树的聚类第58-59页
     ·基于频繁项集的聚类第59-60页
   ·基于频繁项集的Web数据库聚类第60-67页
     ·算法的基本思想第60页
     ·文本的表示第60-61页
     ·特征项的加权第61-63页
     ·频繁项集的挖掘第63-64页
     ·基于频繁项的聚类第64-67页
   ·算法的优点第67-68页
   ·本章小结第68-70页
第六章 实验结果与分析第70-76页
   ·实验数据第70页
   ·查询接口识别实验第70-72页
   ·查询接口模式抽取实验第72-74页
   ·Web数据库聚类实验第74-76页
第七章 总结与展望第76-78页
   ·工作总结第76-77页
   ·工作展望第77-78页
参考文献第78-82页
致谢第82-84页
研究成果及发表的学术论文第84-86页
作者和导师简介第86-87页
北京化工大学硕士研究生学位论文答辩委员会决议书第87-88页

论文共88页,点击 下载论文
上一篇:深度网爬虫及更新策略研究
下一篇:基于双树复小波变换的图像去噪