首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于KNN算法的中文Web文本分类技术研究

致谢第1-6页
摘要第6-7页
Abstract第7-10页
1 绪论第10-16页
   ·课题研究的背景和意义第10-11页
   ·国内外研究现状第11-12页
     ·国外研究现状第11页
     ·国内研究现状第11-12页
   ·Web 文本分类概述第12-15页
     ·Web 文本分类定义第12-14页
     ·中文Web 文本分类流程第14-15页
   ·本文的组织结构第15-16页
2. Web 文本预处理与特征选择第16-26页
   ·Web 文本预处理第16-17页
   ·文本表示第17页
   ·中文文本分词第17-20页
   ·文本特征选择方法第20-23页
     ·基于文档频率的特征提取法第20页
     ·信息增益法第20-21页
     ·互信息法第21页
     ·期望交叉熵法第21-22页
     ·x~2 统计量第22-23页
   ·特征权重计算第23-24页
   ·改进的TF-IWF 特征权重计算方法第24-25页
   ·本章小结第25-26页
3. 文本分类算法第26-35页
   ·文本分类算法概述第26-27页
   ·常见文本分类算法第27-33页
     ·线性最小平方拟合法第27页
     ·Na(1|¨)ve Bayes-贝叶斯方法第27-29页
     ·KNN –K 近邻方法第29-30页
     ·SVM –支持向量机第30-31页
     ·Decision Tree –决策树方法第31-32页
     ·Neural Networks –神经网络方法第32页
     ·Rough Sets –粗糙集方法第32-33页
   ·改进的KNN 算法–类内均值KNN 算法第33-34页
   ·本章小结第34-35页
4. 算法评价与实验分析第35-43页
   ·文本分类性能评价第35-37页
     ·影响分类效果的主要因素第35页
     ·评价标准第35-37页
   ·语料库第37页
   ·文本分类实验和分析第37-42页
     ·基于位置的特征权重算法实验分析第38-41页
     ·类内均值KNN算法的实验分析第41-42页
   ·本章小结第42-43页
5. 总结和展望第43-45页
   ·总结第43-44页
   ·展望第44-45页
参考文献第45-47页
作者简历第47-49页
学位论文数据集第49-50页

论文共50页,点击 下载论文
上一篇:基于区域的彩色图像分割方法研究
下一篇:数据仓库中物化视图选取算法的研究