首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Deep Web页面结构分析与核心内容提取研究

中文摘要第1-4页
英文摘要第4-8页
1 绪论第8-16页
   ·课题研究背景与研究意义第8-9页
   ·国内外研究现状第9-11页
   ·研究方法第11-13页
   ·本文的主要工作第13-15页
   ·本章小结第15-16页
2 本文相关理论与技术第16-27页
   ·HTML 技术介绍第16-19页
     ·HTML 的基本结构第16-18页
     ·HTML 语言的标签结构第18-19页
   ·CSS 技术介绍第19-22页
     ·CSS 的特点第19页
     ·CSS 样式表的分类第19-21页
     ·CSS 选择器第21-22页
     ·CSS 优先级规则第22页
   ·HTML Parser第22-23页
   ·Web 文档结构相似性算法第23-26页
     ·傅里叶变换相似性算法第24-25页
     ·树编辑距离相似性算法第25页
     ·标签相似性算法第25页
     ·路径相似性算法第25-26页
   ·本章小结第26-27页
3 Deep Web 页面的标签特征和视觉特征分析第27-34页
   ·标签特征第27-32页
     ·标签的视觉性第28页
     ·页面之间的标签特征第28-32页
   ·视觉特征第32-33页
     ·页面布局第32页
     ·颜色第32-33页
   ·本章小结第33-34页
4 Deep Web 页面内容结构提取第34-46页
   ·Tag-Tree 噪声节点过滤第36-37页
   ·视觉块聚类第37-44页
     ·标签相似性计算第39-40页
     ·视觉相似性计算第40-42页
     ·具体实现第42-44页
   ·本章小结第44-46页
5 Deep Web 查询结果页面rich-content area 提取第46-50页
   ·查询页面和查询结果页面的比较第47-48页
   ·rich-content area 的提取第48页
   ·本章小结第48-50页
6 实验结果与分析第50-58页
   ·树型相似性算法的实验结果第51-52页
   ·内容结构提取的实验结果第52-54页
   ·核心内容域提取的实验结果第54-57页
   ·本章小结第57-58页
7 总结和展望第58-60页
   ·本文总结第58-59页
   ·展望第59-60页
致谢第60-61页
参考文献第61-65页
附录第65页
 A. 作者在攻读硕士学位期间发表的论文目录第65页
 B. 作者在攻读硕士学位期间参与的科研项目第65页

论文共65页,点击 下载论文
上一篇:针对军队基层单位的网络终端监控技术研究与系统开发
下一篇:基于语义的Web信息抽取方法的研究与应用