Web资源质量信息提取与管理技术的研究与实现

摘要	第1-7页
ABSTRACT	第7-10页
第1章绪论	第10-13页
·研究意义	第10-11页
·研究内容	第11-12页
·论文的结构安排	第12-13页
第2章数据挖掘与数据提取综述	第13-26页
·Web数据挖掘	第13页
·Web质量挖掘	第13-15页
·Web信息提取	第15-20页
·Web信息提取概述	第15-16页
·Web信息提取技术	第16-19页
·Web信息提取的应用	第19页
·Web信息提取系统的评价标准	第19-20页
·相关技术	第20-25页
·HTML	第20-21页
·XML	第21-22页
·DOM	第22-23页
·XPath	第23-24页
·Web数据管理	第24-25页
·本章小结	第25-26页
第3章 Web信息提取的总体设计	第26-32页
·系统总体设计	第26-27页
·基于HTML结构的信息提取设计	第27-28页
·问题的提出	第27-28页
·Web信息提取流程	第28页
·标签树的相似度计算	第28-31页
·URL结构比较法	第28-29页
·基于最大节点匹配的距离算法	第29-31页
·本章小结	第31-32页
第4章基于HTML结构的Web信息提取的实现	第32-52页
·网页文档的预处理	第32-35页
·HTML文档的清洗	第32-34页
·文档解析	第34-35页
·网页聚类	第35-41页
·聚类的概念	第35-36页
·层次聚类算法	第36-37页
·基于最小距离的网页聚类算法的实现	第37-40页
·聚类结果评估	第40-41页
·规则生成	第41-46页
·提取规则的表示	第42-43页
·基于标签树的XPath生成算法	第43-44页
·规则生成	第44-46页
·数据提取	第46-47页
·系统实现与测试	第47-51页
·系统界面及功能介绍	第47-48页
·实验结果及分析	第48-51页
·小结	第51-52页
第5章已提取的Web数据管理技术的研究	第52-59页
·数据仓库的概念	第52-53页
·数据仓库的设计	第53-56页
·多维数据模型	第53页
·建立数据模式	第53-56页
·构建数据仓库	第56-58页
·SQL Server 2005	第56-57页
·通过SQL Server 2005构建数据仓库	第57-58页
·本章小结	第58-59页
第6章结论	第59-61页
·本文总结	第59页
·下一步工作	第59-61页
致谢	第61-62页
参考文献	第62-65页
攻读硕士学位期间发表的论文及科研成果	第65-66页