首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于多特征的HTML网页内容提取的研究

摘要第1-10页
ABSTRACT第10-12页
第一章 绪论第12-17页
   ·研究背景第12-13页
   ·国内外研究现状第13-15页
   ·本文工作及组织第15-16页
   ·本章小结第16-17页
第二章 HTML网页内容提取第17-22页
   ·引言第17页
   ·什么是HTML第17-18页
   ·HTML语法简介第18-19页
   ·半结构化的HTML网页第19-20页
   ·网页的内容组成第20-21页
   ·本章小结第21-22页
第三章 网页分块在网页内容提取中的应用第22-35页
   ·引言第22页
   ·基于DOM树的网页分块第22-23页
   ·基于视觉的网页分块算法第23-34页
     ·背景介绍第23-24页
     ·基本模型介绍第24-26页
     ·基于视觉特征的网页分割算法第26-28页
     ·分块抽取第28-31页
     ·探知分割符第31-33页
       ·分割符探知算法第31-32页
       ·分割符的权重设置第32-33页
     ·网页结构的构建第33-34页
   ·本章小结第34-35页
第四章 网页类型的判定第35-38页
   ·引言第35页
   ·整体判断方法第35-36页
   ·基于局部的方法第36页
   ·基于分块的方法第36-37页
   ·本章小结第37-38页
第五章 基于多特征的网页内容的提取第38-45页
   ·引言第38页
   ·主题块的多特征第38-39页
   ·概率论的应用第39-40页
   ·基于多特征提取网页内容第40-42页
   ·实验结果及分析第42-44页
   ·本章小结第44-45页
第六章 网页内容提取的应用第45-53页
   ·引言第45页
   ·网页内容提取在Hidden Web分类中的应用第45-48页
     ·什么是Hidden Web第45-46页
     ·Hidden Web的分类第46-48页
   ·网页内容提取在Web检索中的应用第48-52页
     ·什么是Web检索第48-49页
     ·Web检索第49-52页
   ·本章小结第52-53页
第七章 总结第53-54页
参考文献第54-59页
致谢第59-60页
攻读学位期间发表的学术论文目录第60-61页
学位论文评阅及答辩情况表第61页

论文共61页,点击 下载论文
上一篇:基于几何活动轮廓模型的视频对象分割与跟踪方法
下一篇:基于GIS技术的农业气候空间数据处理