首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web资源质量信息提取与管理技术的研究与实现

摘要第1-7页
ABSTRACT第7-10页
第1章 绪论第10-13页
   ·研究意义第10-11页
   ·研究内容第11-12页
   ·论文的结构安排第12-13页
第2章 数据挖掘与数据提取综述第13-26页
   ·Web数据挖掘第13页
   ·Web质量挖掘第13-15页
   ·Web信息提取第15-20页
     ·Web信息提取概述第15-16页
     ·Web信息提取技术第16-19页
     ·Web信息提取的应用第19页
     ·Web信息提取系统的评价标准第19-20页
   ·相关技术第20-25页
     ·HTML第20-21页
     ·XML第21-22页
     ·DOM第22-23页
     ·XPath第23-24页
     ·Web数据管理第24-25页
   ·本章小结第25-26页
第3章 Web信息提取的总体设计第26-32页
   ·系统总体设计第26-27页
   ·基于HTML结构的信息提取设计第27-28页
     ·问题的提出第27-28页
     ·Web信息提取流程第28页
   ·标签树的相似度计算第28-31页
     ·URL结构比较法第28-29页
     ·基于最大节点匹配的距离算法第29-31页
   ·本章小结第31-32页
第4章 基于HTML结构的Web信息提取的实现第32-52页
   ·网页文档的预处理第32-35页
     ·HTML文档的清洗第32-34页
     ·文档解析第34-35页
   ·网页聚类第35-41页
     ·聚类的概念第35-36页
     ·层次聚类算法第36-37页
     ·基于最小距离的网页聚类算法的实现第37-40页
     ·聚类结果评估第40-41页
   ·规则生成第41-46页
     ·提取规则的表示第42-43页
     ·基于标签树的XPath生成算法第43-44页
     ·规则生成第44-46页
   ·数据提取第46-47页
   ·系统实现与测试第47-51页
     ·系统界面及功能介绍第47-48页
     ·实验结果及分析第48-51页
   ·小结第51-52页
第5章 已提取的Web数据管理技术的研究第52-59页
   ·数据仓库的概念第52-53页
   ·数据仓库的设计第53-56页
     ·多维数据模型第53页
     ·建立数据模式第53-56页
   ·构建数据仓库第56-58页
     ·SQL Server 2005第56-57页
     ·通过SQL Server 2005构建数据仓库第57-58页
   ·本章小结第58-59页
第6章 结论第59-61页
   ·本文总结第59页
   ·下一步工作第59-61页
致谢第61-62页
参考文献第62-65页
攻读硕士学位期间发表的论文及科研成果第65-66页

论文共66页,点击 下载论文
上一篇:接触网物资备料管理信息系统
下一篇:基于WCF的信息平台安全技术研究