web中文文本的数据挖掘技术研究
| 目录 | 第1-10页 |
| 中文摘要 | 第10-12页 |
| ABSTRACT | 第12-14页 |
| 第一章 绪论 | 第14-19页 |
| ·研究背景 | 第14-15页 |
| ·国内外研究状况 | 第15-16页 |
| ·文本挖掘的主要研究领域和难点 | 第16-17页 |
| ·论文的研究内容和结构 | 第17-19页 |
| 第二章 相关理论基础 | 第19-32页 |
| ·数据挖掘综述 | 第19-23页 |
| ·数据挖掘的功能和内容 | 第19-21页 |
| ·数据挖掘的关键技术 | 第21-23页 |
| ·Web挖掘概述 | 第23-25页 |
| ·Web数据的特点 | 第23-24页 |
| ·Web挖掘分类 | 第24-25页 |
| ·web文本挖掘 | 第25-27页 |
| ·web文本挖掘的过程 | 第25-26页 |
| ·web文本挖掘的主要内容 | 第26-27页 |
| ·文本分类和聚类 | 第27-30页 |
| ·文本分类聚类概述 | 第27页 |
| ·文本分类 | 第27-28页 |
| ·文本聚类 | 第28-30页 |
| ·文本分类和聚类性能评估 | 第30页 |
| ·本章小结 | 第30-32页 |
| 第三章 文本预处理中的关键技术 | 第32-39页 |
| ·web文本去噪 | 第32-33页 |
| ·中文文本分词 | 第33页 |
| ·去停用词 | 第33-34页 |
| ·向量空间模型 | 第34-35页 |
| ·特征项权重 | 第35页 |
| ·特征选择 | 第35-37页 |
| ·几种相似度计算公式 | 第37-38页 |
| ·本章小结 | 第38-39页 |
| 第四章 基于向量空间模型的中文文本聚类 | 第39-55页 |
| ·几种聚类算法 | 第39-43页 |
| ·k-means算法 | 第39-40页 |
| ·模糊c均值算法 | 第40-43页 |
| ·中文文本聚类 | 第43-44页 |
| ·基于子空间的中文文本聚类 | 第44-49页 |
| ·TCPSO的评价函数 | 第44-45页 |
| ·TCPSO的寻优策略:PSO | 第45-47页 |
| ·参数设置和实验结果 | 第47-49页 |
| ·小结 | 第49页 |
| ·基于奇异值分解的中文文档聚类 | 第49-54页 |
| ·奇异值分解提取特征项 | 第49-50页 |
| ·人工鱼群算法聚类 | 第50-52页 |
| ·实验及结果 | 第52-54页 |
| ·本章小结 | 第54-55页 |
| 第五章 基于支持向量机的文本分类 | 第55-66页 |
| ·SVM核心思想及优点 | 第55-60页 |
| ·线性可分情形与最优分类超平面 | 第55-56页 |
| ·线性不可分情形与松弛变量 | 第56-58页 |
| ·非线性情形与核函数 | 第58-60页 |
| ·支持向量机的优点 | 第60页 |
| ·多类支持向量机 | 第60-62页 |
| ·一对多方法 | 第60-61页 |
| ·一对一方法 | 第61页 |
| ·决策导向非循环图 | 第61-62页 |
| ·基于SVM的中文文本分类系统结构 | 第62-63页 |
| ·基于SVM的中文文本分类实现 | 第63-65页 |
| ·核函数的选择 | 第63页 |
| ·实验过程及结果 | 第63-65页 |
| ·本章小结 | 第65-66页 |
| 第六章 总结与展望 | 第66-68页 |
| ·本文的主要工作 | 第66-67页 |
| ·工作展望 | 第67-68页 |
| 参考文献 | 第68-73页 |
| 致谢 | 第73-74页 |
| 攻读硕士学位期间发表的论文 | 第74-75页 |
| 学位论文评阅及答辩情况表 | 第75页 |