基于多元权重特征加权的中文文本分类算法

摘要	第1-5页
Abstract	第5-10页
1 绪论	第10-15页
·研究背景与意义	第10-11页
·国内外研究现状	第11-13页
·国外研究现状	第11-12页
·国内研究现状	第12-13页
·论文的主要工作及创新点	第13-14页
·论文结构安排	第14-15页
2 文本分类关键技术综述	第15-35页
·文本分类概述	第15-17页
·文本分类的过程	第15-16页
·文本分类的框架	第16-17页
·文本表示	第17-22页
·布尔逻辑模型（Boolean Logical Model，BLM）	第18-19页
·概率模型（Probabilitic Model，PM）	第19页
·潜在语义索引模型（Latent Semantic Index，LSI）	第19页
·神经网络算法（Neural Network，NN）	第19-20页
·向量空间模型（Vector space model，VSM）	第20-22页
·文本预处理	第22-27页
·中文分词	第22-26页
·去停用词	第26-27页
·特征选择算法	第27-31页
·特征频率（Term Frequency，TF）	第28-29页
·文档频率(Document Frequency，DF)	第29页
·信息增益（Information Gain，IG）	第29-30页
·互信息（Mutual Information，MI）	第30页
·CHI 统计	第30-31页
·分类算法	第31-32页
·分类性能评价	第32-34页
·查准率和查全率	第33页
·F－测量	第33-34页
·宏平均和微平均	第34页
·本章小结	第34-35页
3 多元权重特征加权算法的研究	第35-43页
·特征加权算法的分析	第35-38页
·布尔函数	第35-36页
·TF 函数	第36页
·IDF 权重	第36页
·ITC 函数	第36-37页
·tf*idf 函数	第37-38页
·多元权重特征加权算法	第38-42页
·传统算法的不足及改进思路	第38-39页
·位置权重系数	第39页
·词长权重系数	第39-40页
·类别权重系数	第40-41页
·多元权重特征词加权算法描述	第41-42页
·本章小结	第42-43页
4 基于改进 KNN 的分类算法	第43-51页
·现有分类算法的分析	第43-48页
·朴素贝叶斯算法	第43-44页
·支持向量机法	第44-45页
·神经网络算法	第45页
·最小距离算法	第45-46页
·决策树算法	第46页
·潜在语义索引算法	第46-47页
·传统的KNN 分类算法	第47页
·几种分类算法的比较	第47-48页
·改进的KNN 算法	第48-50页
·传统KNN 分类算法的不足	第48页
·改进后的算法描述	第48-50页
·本章小结	第50-51页
5 实验及结果分析	第51-62页
·实验数据集	第51-53页
·开发工具和平台	第51页
·数据集	第51页
·分词系统	第51-53页
·实验结果及评价	第53-61页
·分类算法	第53-54页
·具体步骤	第54-56页
·实验结果及分析	第56-61页
·本章小结	第61-62页
6 总结与展望	第62-63页
·本文所做的工作	第62页
·展望	第62-63页
参考文献	第63-67页
攻读硕士期间发表的论文及所取得的研究成果	第67-68页
致谢	第68页