首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于DIV标签树的网页主题信息抽取方法

摘要第1-6页
Abstract第6-9页
插图索引第9-10页
附表索引第10-11页
第1章 绪论第11-16页
   ·研究背景与意义第11-12页
   ·国内外研究现状第12-14页
   ·本文的主要内容和组织第14-15页
   ·本章小结第15-16页
第2章 Web主题信息抽取相关技术第16-28页
   ·相关概念第16-17页
     ·信息抽取的定义第16页
     ·Web信息抽取的定义第16页
     ·主题信息的定义第16-17页
     ·信息抽取与信息检索的区别第17页
   ·CSS+DIV布局的特点第17-18页
   ·Web信息抽取的分类第18-25页
     ·按照抽取原理的分类第18-23页
     ·按自动化程度化分类第23-25页
   ·不同抽取技术的对比分析第25-26页
   ·信息抽取系统的评价指标第26-27页
   ·本章小结第27-28页
第3章 基于DIV标签树的网页主题信息抽取方法第28-36页
   ·要解决的问题第28页
   ·基本定义第28-29页
   ·主题信息抽取过程第29-35页
     ·HTML解析第29-31页
     ·噪声过滤第31页
     ·剪枝算法第31-35页
   ·本章小结第35-36页
第4章 系统原型实现与实验分析第36-49页
   ·需求分析第36页
   ·系统功能结构第36-37页
   ·实验前的准备第37-40页
     ·构建开发环境第37页
     ·数据集第37页
     ·配置Struts第37-39页
     ·文件夹组织结构第39-40页
   ·主题信息抽取原型系统的实现第40-44页
     ·界面概述第40-41页
     ·html解析过程的实现第41-42页
     ·噪声过滤过程的实现第42页
     ·剪枝算法的实现第42-44页
   ·实验结果分析第44-48页
   ·本站小结第48-49页
结论与展望第49-51页
参考文献第51-55页
致谢第55-56页
附录A 攻读学位期间所发表的学术论文目录第56-57页
附录B 系统部分源代码第57-77页

论文共77页,点击 下载论文
上一篇:P2P技术在视频系统中的应用研究
下一篇:湖南省高速公路联网收费系统的效益评价研究