web中文文本的数据挖掘技术研究

目录	第1-10页
中文摘要	第10-12页
ABSTRACT	第12-14页
第一章绪论	第14-19页
·研究背景	第14-15页
·国内外研究状况	第15-16页
·文本挖掘的主要研究领域和难点	第16-17页
·论文的研究内容和结构	第17-19页
第二章相关理论基础	第19-32页
·数据挖掘综述	第19-23页
·数据挖掘的功能和内容	第19-21页
·数据挖掘的关键技术	第21-23页
·Web挖掘概述	第23-25页
·Web数据的特点	第23-24页
·Web挖掘分类	第24-25页
·web文本挖掘	第25-27页
·web文本挖掘的过程	第25-26页
·web文本挖掘的主要内容	第26-27页
·文本分类和聚类	第27-30页
·文本分类聚类概述	第27页
·文本分类	第27-28页
·文本聚类	第28-30页
·文本分类和聚类性能评估	第30页
·本章小结	第30-32页
第三章文本预处理中的关键技术	第32-39页
·web文本去噪	第32-33页
·中文文本分词	第33页
·去停用词	第33-34页
·向量空间模型	第34-35页
·特征项权重	第35页
·特征选择	第35-37页
·几种相似度计算公式	第37-38页
·本章小结	第38-39页
第四章基于向量空间模型的中文文本聚类	第39-55页
·几种聚类算法	第39-43页
·k-means算法	第39-40页
·模糊c均值算法	第40-43页
·中文文本聚类	第43-44页
·基于子空间的中文文本聚类	第44-49页
·TCPSO的评价函数	第44-45页
·TCPSO的寻优策略:PSO	第45-47页
·参数设置和实验结果	第47-49页
·小结	第49页
·基于奇异值分解的中文文档聚类	第49-54页
·奇异值分解提取特征项	第49-50页
·人工鱼群算法聚类	第50-52页
·实验及结果	第52-54页
·本章小结	第54-55页
第五章基于支持向量机的文本分类	第55-66页
·SVM核心思想及优点	第55-60页
·线性可分情形与最优分类超平面	第55-56页
·线性不可分情形与松弛变量	第56-58页
·非线性情形与核函数	第58-60页
·支持向量机的优点	第60页
·多类支持向量机	第60-62页
·一对多方法	第60-61页
·一对一方法	第61页
·决策导向非循环图	第61-62页
·基于SVM的中文文本分类系统结构	第62-63页
·基于SVM的中文文本分类实现	第63-65页
·核函数的选择	第63页
·实验过程及结果	第63-65页
·本章小结	第65-66页
第六章总结与展望	第66-68页
·本文的主要工作	第66-67页
·工作展望	第67-68页
参考文献	第68-73页
致谢	第73-74页
攻读硕士学位期间发表的论文	第74-75页
学位论文评阅及答辩情况表	第75页