首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

web中文文本的数据挖掘技术研究

目录第1-10页
中文摘要第10-12页
ABSTRACT第12-14页
第一章 绪论第14-19页
   ·研究背景第14-15页
   ·国内外研究状况第15-16页
   ·文本挖掘的主要研究领域和难点第16-17页
   ·论文的研究内容和结构第17-19页
第二章 相关理论基础第19-32页
   ·数据挖掘综述第19-23页
     ·数据挖掘的功能和内容第19-21页
     ·数据挖掘的关键技术第21-23页
   ·Web挖掘概述第23-25页
     ·Web数据的特点第23-24页
     ·Web挖掘分类第24-25页
   ·web文本挖掘第25-27页
     ·web文本挖掘的过程第25-26页
     ·web文本挖掘的主要内容第26-27页
   ·文本分类和聚类第27-30页
     ·文本分类聚类概述第27页
     ·文本分类第27-28页
     ·文本聚类第28-30页
     ·文本分类和聚类性能评估第30页
   ·本章小结第30-32页
第三章 文本预处理中的关键技术第32-39页
   ·web文本去噪第32-33页
   ·中文文本分词第33页
   ·去停用词第33-34页
   ·向量空间模型第34-35页
   ·特征项权重第35页
   ·特征选择第35-37页
   ·几种相似度计算公式第37-38页
   ·本章小结第38-39页
第四章 基于向量空间模型的中文文本聚类第39-55页
   ·几种聚类算法第39-43页
     ·k-means算法第39-40页
     ·模糊c均值算法第40-43页
   ·中文文本聚类第43-44页
   ·基于子空间的中文文本聚类第44-49页
     ·TCPSO的评价函数第44-45页
     ·TCPSO的寻优策略:PSO第45-47页
     ·参数设置和实验结果第47-49页
     ·小结第49页
   ·基于奇异值分解的中文文档聚类第49-54页
     ·奇异值分解提取特征项第49-50页
     ·人工鱼群算法聚类第50-52页
     ·实验及结果第52-54页
   ·本章小结第54-55页
第五章 基于支持向量机的文本分类第55-66页
   ·SVM核心思想及优点第55-60页
     ·线性可分情形与最优分类超平面第55-56页
     ·线性不可分情形与松弛变量第56-58页
     ·非线性情形与核函数第58-60页
     ·支持向量机的优点第60页
   ·多类支持向量机第60-62页
     ·一对多方法第60-61页
     ·一对一方法第61页
     ·决策导向非循环图第61-62页
   ·基于SVM的中文文本分类系统结构第62-63页
   ·基于SVM的中文文本分类实现第63-65页
     ·核函数的选择第63页
     ·实验过程及结果第63-65页
   ·本章小结第65-66页
第六章 总结与展望第66-68页
   ·本文的主要工作第66-67页
   ·工作展望第67-68页
参考文献第68-73页
致谢第73-74页
攻读硕士学位期间发表的论文第74-75页
学位论文评阅及答辩情况表第75页

论文共75页,点击 下载论文
上一篇:基于对称子空间分析的人脸识别方法研究
下一篇:装潢设计教学模拟实验平台的设计与实现