首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于多元权重特征加权的中文文本分类算法

摘要第1-5页
Abstract第5-10页
1 绪论第10-15页
   ·研究背景与意义第10-11页
   ·国内外研究现状第11-13页
     ·国外研究现状第11-12页
     ·国内研究现状第12-13页
   ·论文的主要工作及创新点第13-14页
   ·论文结构安排第14-15页
2 文本分类关键技术综述第15-35页
   ·文本分类概述第15-17页
     ·文本分类的过程第15-16页
     ·文本分类的框架第16-17页
   ·文本表示第17-22页
     ·布尔逻辑模型(Boolean Logical Model,BLM)第18-19页
     ·概率模型(Probabilitic Model,PM)第19页
     ·潜在语义索引模型(Latent Semantic Index,LSI)第19页
     ·神经网络算法(Neural Network,NN)第19-20页
     ·向量空间模型(Vector space model,VSM)第20-22页
   ·文本预处理第22-27页
     ·中文分词第22-26页
     ·去停用词第26-27页
   ·特征选择算法第27-31页
     ·特征频率(Term Frequency,TF)第28-29页
     ·文档频率(Document Frequency,DF)第29页
     ·信息增益(Information Gain,IG)第29-30页
     ·互信息(Mutual Information,MI)第30页
     ·CHI 统计第30-31页
   ·分类算法第31-32页
   ·分类性能评价第32-34页
     ·查准率和查全率第33页
     ·F-测量第33-34页
     ·宏平均和微平均第34页
   ·本章小结第34-35页
3 多元权重特征加权算法的研究第35-43页
   ·特征加权算法的分析第35-38页
     ·布尔函数第35-36页
     ·TF 函数第36页
     ·IDF 权重第36页
     ·ITC 函数第36-37页
     ·tf*idf 函数第37-38页
   ·多元权重特征加权算法第38-42页
     ·传统算法的不足及改进思路第38-39页
     ·位置权重系数第39页
     ·词长权重系数第39-40页
     ·类别权重系数第40-41页
     ·多元权重特征词加权算法描述第41-42页
   ·本章小结第42-43页
4 基于改进 KNN 的分类算法第43-51页
   ·现有分类算法的分析第43-48页
     ·朴素贝叶斯算法第43-44页
     ·支持向量机法第44-45页
     ·神经网络算法第45页
     ·最小距离算法第45-46页
     ·决策树算法第46页
     ·潜在语义索引算法第46-47页
     ·传统的KNN 分类算法第47页
     ·几种分类算法的比较第47-48页
   ·改进的KNN 算法第48-50页
     ·传统KNN 分类算法的不足第48页
     ·改进后的算法描述第48-50页
   ·本章小结第50-51页
5 实验及结果分析第51-62页
   ·实验数据集第51-53页
     ·开发工具和平台第51页
     ·数据集第51页
     ·分词系统第51-53页
   ·实验结果及评价第53-61页
     ·分类算法第53-54页
     ·具体步骤第54-56页
     ·实验结果及分析第56-61页
   ·本章小结第61-62页
6 总结与展望第62-63页
   ·本文所做的工作第62页
   ·展望第62-63页
参考文献第63-67页
攻读硕士期间发表的论文及所取得的研究成果第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:多能X射线CT统计重建算法研究
下一篇:基于加权兴趣度的协同过滤算法研究