首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web文本聚类与分类算法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-12页
   ·引言第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·国内外研究现状第11页
   ·本文组织结构与研究内容第11-12页
第2章 Web文本聚类与分类相关概念第12-23页
   ·数据挖掘第12页
   ·Web数据挖掘第12-13页
     ·Web挖掘的概念第12页
     ·Web挖掘分类第12-13页
   ·Web文本挖掘第13-14页
     ·Web文本挖掘的定义第13页
     ·Web文本挖掘的一般过程第13-14页
   ·Web文本的表示第14-15页
     ·布尔模型第14-15页
     ·概率某型第15页
     ·向量空间模型第15页
   ·Web文本特征提取第15-17页
     ·特征词频—文档频率权重(TF—IDF)第16页
     ·信息增益(IG)第16页
     ·互信息(MI)第16-17页
     ·χ~2(CHI)统计第17页
   ·Web文本分类器第17-20页
     ·朴素贝叶斯分类器第17-18页
     ·K近邻分类法器(KNN)第18页
     ·支持向量机分类器第18-19页
     ·评价标准第19-20页
   ·Web文本聚类第20-22页
     ·划分聚类方法第20-21页
     ·层次聚类方法第21-22页
     ·评价标准第22页
   ·本章小结第22-23页
第3章 基于相关性聚类的Web文本特征提取算法第23-31页
   ·引言第23页
   ·TF-IDF特征词提取算法问题分析第23-24页
   ·特征词共现的相关性聚类思想第24页
     ·相关性聚类思想第24页
     ·相关性的描述第24页
   ·k-means算法在文本特征提取中的局限性第24-26页
     ·聚类中心点无意义第25页
     ·初始聚类中心点依赖性第25页
     ·最临近原则的影响第25-26页
   ·基于改进k-means的特征提取算法第26-29页
     ·基于特征词共现的相关性描述第26-27页
     ·k-means算法的改进策略第27-28页
     ·算法描述第28-29页
   ·实验与结果分析第29-30页
   ·本章小结第30-31页
第4章 基于PSO改进的k-means Web文本聚类算法第31-43页
   ·引言第31页
   ·问题描述第31-33页
   ·粒子群算法简介第33-38页
     ·基本粒子群算法第33-34页
     ·标准粒子群算法第34-35页
     ·基本流程第35-37页
     ·优化聚类中的应用第37-38页
   ·改进k-means Web文本聚类算法第38-41页
     ·基于PSO的改进策略第38-40页
     ·算法描述第40-41页
   ·实验及结果分析第41-42页
   ·本章小结第42-43页
第5章 一种改进的KNN Web文本分类器第43-51页
   ·引言第43页
   ·KNN算法问题分析第43-45页
     ·影响KNN分类的因素第44-45页
     ·现有的改进策略第45页
   ·改进的KNN Web文本分类算法第45-48页
     ·改进策略第45-47页
     ·算法描述第47-48页
   ·实验与结果分析第48-50页
   ·本章小结第50-51页
第6章 总结与展望第51-53页
   ·全文总结第51页
   ·工作展望第51-53页
参考文献第53-56页
读硕期间公开发表的论文第56-57页
致谢第57-58页

论文共58页,点击 下载论文
上一篇:中文文本分类核心技术研究
下一篇:GPU高性能计算技术在晶格玻尔兹曼方法模拟中的应用