Web文本挖掘研究与实现

摘要	第1-3页
Abstract	第3-6页
第一章绪论	第6-10页
·问题的来源	第6-7页
·Web信息特点	第6页
·Web信息使用的基本方式	第6页
·访问Web的局限	第6-7页
·课题意义	第7-8页
·web文本挖掘有利于检索结果的组织	第7-8页
·web文本挖掘有利于加速检索过程	第8页
·方法	第8页
·研究概述	第8-9页
·我的工作	第9页
·小节	第9-10页
第二章背景知识及相关研究	第10-22页
·数据挖掘与方法	第10-18页
·数据挖掘的定义及其发展	第10页
·数据挖掘的特征	第10-11页
·数据挖掘和数据仓库	第11-12页
·数据挖掘与OLAP	第12页
·数据挖掘过程	第12-14页
·数据挖掘的方法和技术	第14-16页
·几种主要的数据挖掘方法	第16-18页
·web挖掘	第18-21页
·web挖掘的构成和方法	第18-19页
·web挖掘的分类	第19-20页
·web挖掘应用前景	第20-21页
·小节	第21-22页
第三章 web文本挖掘	第22-42页
·Web文本挖掘的任务	第22-23页
·web文本挖掘的概念	第22页
·web挖掘的过程	第22-23页
·文本表示和特征抽取	第23-26页
·HTML文件简介	第23-24页
·文本表示	第24-25页
·特征项的抽取	第25-26页
·Web文档相似性度量	第26-28页
·相似性度量的一般标准	第26页
·相似性测度	第26-28页
·Web文本分类	第28-30页
·训练方法与分类算法	第28-30页
·阈值的确定	第30页
·web文本聚类	第30-34页
·聚类三个步骤	第30-32页
·几种常用的聚类策略	第32页
·两种常用的聚类算法	第32-34页
·web文本关联规则挖掘	第34-40页
·关联规则算法	第34-39页
·特征关联规则的挖掘	第39-40页
·web文本挖掘的质量评价	第40-41页
·web文本挖掘的评价方法	第40页
·web文本挖掘的评价参数	第40-41页
·小结	第41-42页
第四章 Web文本挖掘框架与局部实现	第42-47页
·Web文本挖掘的系统结构	第42页
·Web页面采集模块	第42-43页
·Web文本特征提取模块	第43-45页
·HTML文件结构化	第43-44页
·HTML文本信息特征化算法	第44-45页
·分类模块	第45-46页
·实验结果	第46页
·小结	第46-47页
第五章总结	第47-48页
·论文总结	第47页
·未来工作展望	第47-48页
参考文献	第48-51页
攻读硕士期间发表的论文	第51-52页
致谢	第52页