web中文文本的数据挖掘技术研究
目录 | 第1-10页 |
中文摘要 | 第10-12页 |
ABSTRACT | 第12-14页 |
第一章 绪论 | 第14-19页 |
·研究背景 | 第14-15页 |
·国内外研究状况 | 第15-16页 |
·文本挖掘的主要研究领域和难点 | 第16-17页 |
·论文的研究内容和结构 | 第17-19页 |
第二章 相关理论基础 | 第19-32页 |
·数据挖掘综述 | 第19-23页 |
·数据挖掘的功能和内容 | 第19-21页 |
·数据挖掘的关键技术 | 第21-23页 |
·Web挖掘概述 | 第23-25页 |
·Web数据的特点 | 第23-24页 |
·Web挖掘分类 | 第24-25页 |
·web文本挖掘 | 第25-27页 |
·web文本挖掘的过程 | 第25-26页 |
·web文本挖掘的主要内容 | 第26-27页 |
·文本分类和聚类 | 第27-30页 |
·文本分类聚类概述 | 第27页 |
·文本分类 | 第27-28页 |
·文本聚类 | 第28-30页 |
·文本分类和聚类性能评估 | 第30页 |
·本章小结 | 第30-32页 |
第三章 文本预处理中的关键技术 | 第32-39页 |
·web文本去噪 | 第32-33页 |
·中文文本分词 | 第33页 |
·去停用词 | 第33-34页 |
·向量空间模型 | 第34-35页 |
·特征项权重 | 第35页 |
·特征选择 | 第35-37页 |
·几种相似度计算公式 | 第37-38页 |
·本章小结 | 第38-39页 |
第四章 基于向量空间模型的中文文本聚类 | 第39-55页 |
·几种聚类算法 | 第39-43页 |
·k-means算法 | 第39-40页 |
·模糊c均值算法 | 第40-43页 |
·中文文本聚类 | 第43-44页 |
·基于子空间的中文文本聚类 | 第44-49页 |
·TCPSO的评价函数 | 第44-45页 |
·TCPSO的寻优策略:PSO | 第45-47页 |
·参数设置和实验结果 | 第47-49页 |
·小结 | 第49页 |
·基于奇异值分解的中文文档聚类 | 第49-54页 |
·奇异值分解提取特征项 | 第49-50页 |
·人工鱼群算法聚类 | 第50-52页 |
·实验及结果 | 第52-54页 |
·本章小结 | 第54-55页 |
第五章 基于支持向量机的文本分类 | 第55-66页 |
·SVM核心思想及优点 | 第55-60页 |
·线性可分情形与最优分类超平面 | 第55-56页 |
·线性不可分情形与松弛变量 | 第56-58页 |
·非线性情形与核函数 | 第58-60页 |
·支持向量机的优点 | 第60页 |
·多类支持向量机 | 第60-62页 |
·一对多方法 | 第60-61页 |
·一对一方法 | 第61页 |
·决策导向非循环图 | 第61-62页 |
·基于SVM的中文文本分类系统结构 | 第62-63页 |
·基于SVM的中文文本分类实现 | 第63-65页 |
·核函数的选择 | 第63页 |
·实验过程及结果 | 第63-65页 |
·本章小结 | 第65-66页 |
第六章 总结与展望 | 第66-68页 |
·本文的主要工作 | 第66-67页 |
·工作展望 | 第67-68页 |
参考文献 | 第68-73页 |
致谢 | 第73-74页 |
攻读硕士学位期间发表的论文 | 第74-75页 |
学位论文评阅及答辩情况表 | 第75页 |