首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web内容抽取及语义识别算法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·引言第10-11页
   ·课题的提出及意义第11-12页
   ·论文主要工作第12-14页
   ·论文研究内容第14页
   ·论文结构安排第14-16页
第2章 Web结构分析及内容提取技术第16-30页
   ·HTML简介第16-18页
     ·HTML语言简介第16-17页
     ·HTML结构树的概念第17-18页
   ·DOM(Document Object Model)树简介第18-20页
     ·DOM的定义第18-19页
     ·DOM的主要特点第19页
     ·DOM和HTML树型逻辑结构第19-20页
   ·Web内容提取技术简述第20-21页
   ·相关研究工作第21-27页
     ·利用HTML标记的分布规律找出主题第21-22页
     ·利用DOM树找出主题第22-23页
     ·利用模板检测找出主题第23-25页
     ·利用页面的视觉特征找出主题第25-26页
     ·利用TABLE标记找出主题第26-27页
     ·其它方法第27页
   ·机器学习第27-28页
     ·人工神经网络方法第27-28页
     ·统计分析方法第28页
   ·Web内容提取的评价标准第28-29页
   ·本章小结第29-30页
第3章 系统总体结构设计第30-36页
   ·总体结构第30-32页
   ·基于HTML标记树的页面结构分析第32-34页
   ·网页净化第34-35页
   ·本章小结第35-36页
第4章 几种网页主题内容提取方法第36-52页
   ·基于统计的网页主题内容提取第36-42页
     ·页面结构分析算法第36-38页
     ·标记统计器第38-39页
     ·启发式规则第39-40页
     ·测试集及实验结果第40-42页
   ·基于坐标树的主题内容提取第42-51页
     ·系统结构第42-43页
     ·计算位置坐标并生成坐标树第43-45页
     ·页面结构分析算法第45-46页
     ·Graph生成算法第46-48页
     ·相关图片识别算法第48页
     ·相关链接识别算法第48-49页
     ·测试集及实验结果第49-51页
   ·本章小结第51-52页
第5章 文本分类第52-66页
   ·文本分类综述第52-60页
     ·文本分类简介第52-53页
     ·分类方法概述第53-58页
     ·特征选择方法第58-60页
   ·基于决策支持向量机的文本分类第60-63页
   ·实验结果与分析第63-65页
   ·本章小结第65-66页
结论第66-68页
参考文献第68-73页
攻读硕士学位期间承担的科研任务与主要成果第73-74页
致谢第74-75页
作者简介第75页

论文共75页,点击 下载论文
上一篇:以Keggin和Dawson结构聚金属氧酸阴离子为构筑块的有机—无机复合物及配位聚合物的合成、晶体结构和性质研究
下一篇:信息社会化背景下中国电视国际频道的发展