面向Web文本数据仓库的预处理关键技术研究

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·课题背景	第7页
·国内外研究现状	第7-9页
·国外研究现状	第8-9页
·国内研究现状	第9页
·本文研究内容与组织结构	第9-11页
第二章 Web 文本数据仓库	第11-21页
·数据仓库	第11-16页
·数据仓库定义及特点	第11-12页
·数据仓库与传统数据库的区别	第12-13页
·数据仓库体系结构	第13-14页
·数据仓库建模技术	第14-16页
·Web文本数据仓库	第16-20页
·Web 文本数据仓库基本概念	第16页
·Web 文本数据仓库的构建方法	第16-17页
·Web 文本数据仓库的设计	第17-20页
·本章小结	第20-21页
第三章 Web 页面预处理	第21-25页
·Web页面分析	第21-23页
·HTML 概述	第21-23页
·Web页面处理	第23-24页
·文档对象模型	第23-24页
·本章小结	第24-25页
第四章 Web 文本信息抽取关键技术研究	第25-51页
·信息抽取技术	第25-27页
·信息抽取概念	第25-26页
·信息抽取的常用方法	第26-27页
·Web 文本数据仓库的信息抽取方法	第27页
·中文文本分词技术	第27-30页
·常用中文分词方法	第27-30页
·关键字提取技术	第30-33页
·常用关键字提取方法	第30-32页
·词共现模型	第32-33页
·自动摘要技术	第33-40页
·文摘的概念	第33页
·常用自动文摘方法	第33-37页
·改进的基于统计的自动文摘方法	第37-39页
·改进的自动文摘方法实验	第39-40页
·Web文本分类技术	第40-50页
·Web 文本分类概述	第40-41页
·Web 文本分类过程	第41-43页
·Web 文本分类方法	第43-47页
·二维的 SVM-KNN 分类方法	第47-49页
·二维的 SVM-KNN 分类方法实验	第49-50页
·本章小结	第50-51页
第五章 Web 文本数据仓库预处理系统的设计与实现	第51-67页
·系统功能模块	第51-53页
·预处理系统详细设计	第53-62页
·HTML 树型解析	第53-55页
·Web 文本分词与关键字提取详细设计	第55-57页
·自动摘要详细设计	第57-60页
·文本分类详细设计	第60-62页
·系统实现	第62-66页
·本章小结	第66-67页
第六章总结与展望	第67-69页
·本文总结	第67-68页
·研究展望	第68-69页
致谢	第69-71页
参考文献	第71-74页