基于DIV标签树的网页主题信息抽取方法

摘要	第1-6页
Abstract	第6-9页
插图索引	第9-10页
附表索引	第10-11页
第1章绪论	第11-16页
·研究背景与意义	第11-12页
·国内外研究现状	第12-14页
·本文的主要内容和组织	第14-15页
·本章小结	第15-16页
第2章 Web主题信息抽取相关技术	第16-28页
·相关概念	第16-17页
·信息抽取的定义	第16页
·Web信息抽取的定义	第16页
·主题信息的定义	第16-17页
·信息抽取与信息检索的区别	第17页
·CSS+DIV布局的特点	第17-18页
·Web信息抽取的分类	第18-25页
·按照抽取原理的分类	第18-23页
·按自动化程度化分类	第23-25页
·不同抽取技术的对比分析	第25-26页
·信息抽取系统的评价指标	第26-27页
·本章小结	第27-28页
第3章基于DIV标签树的网页主题信息抽取方法	第28-36页
·要解决的问题	第28页
·基本定义	第28-29页
·主题信息抽取过程	第29-35页
·HTML解析	第29-31页
·噪声过滤	第31页
·剪枝算法	第31-35页
·本章小结	第35-36页
第4章系统原型实现与实验分析	第36-49页
·需求分析	第36页
·系统功能结构	第36-37页
·实验前的准备	第37-40页
·构建开发环境	第37页
·数据集	第37页
·配置Struts	第37-39页
·文件夹组织结构	第39-40页
·主题信息抽取原型系统的实现	第40-44页
·界面概述	第40-41页
·html解析过程的实现	第41-42页
·噪声过滤过程的实现	第42页
·剪枝算法的实现	第42-44页
·实验结果分析	第44-48页
·本站小结	第48-49页
结论与展望	第49-51页
参考文献	第51-55页
致谢	第55-56页
附录A 攻读学位期间所发表的学术论文目录	第56-57页
附录B 系统部分源代码	第57-77页