首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向信息抽取的Web页面结构挖掘技术研究

摘要第1-5页
Abstract第5-7页
目录第7-9页
第1章 绪论第9-18页
   ·课题研究背景和意义第9-10页
     ·研究背景第9页
     ·研究意义第9-10页
   ·国内外相关研究和综述第10-16页
     ·网页结构特征第10-11页
     ·网页聚类算法第11-12页
     ·网页分块算法第12-13页
     ·包装器生成技术第13-16页
   ·本文的研究内容第16-17页
   ·本文的结构安排第17-18页
第2章 基本特征分析与表示第18-25页
   ·引言第18页
   ·标签分析与表示第18-19页
   ·DOM树分析与表示第19-22页
   ·页面模块分析与表示第22-24页
   ·本章小结第24-25页
第3章 基于矩阵结构的页面聚类算法研究第25-40页
   ·引言第25页
   ·MSPC算法简介第25-31页
     ·理论基础第25-28页
     ·算法流程第28-31页
     ·算法复杂度分析第31页
   ·MSPC算法在包装器中的应用第31-34页
     ·页面模板第31-32页
     ·增量式MSPC第32-34页
     ·信息类页面第34页
   ·实验与分析第34-39页
     ·实验数据第34-35页
     ·评估函数第35-36页
     ·实验结果分析第36-39页
   ·本章小结第39-40页
第4章 基于统计信息的页面分割算法研究第40-53页
   ·引言第40页
   ·GSPS算法简介第40-48页
     ·理论基础第40-43页
     ·算法流程第43-48页
   ·GSPS算法在包装器中的应用第48-49页
     ·模块树第48页
     ·信息块第48-49页
   ·实验与分析第49-52页
     ·实验数据第49页
     ·评估函数第49-50页
     ·实验结果分析第50-52页
   ·本章小结第52-53页
第5章 信息抽取系统的设计与实现第53-67页
   ·引言第53页
   ·系统的功能目标第53-54页
   ·系统总体设计第54-55页
   ·子系统设计与实现第55-58页
     ·网页解析系统第55-56页
     ·页面聚类系统第56-57页
     ·信息分块系统第57-58页
   ·系统展示第58-66页
     ·开发平台及工具第58页
     ·可视化界面第58-66页
   ·本章小结第66-67页
结论第67-69页
参考文献第69-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于Kerberos的安全认证模块设计与实现
下一篇:Blog社区的发现与演变追踪技术研究