基于特征提取和主题模型的文本分类研究

摘要	第1-4页
Abstract	第4-6页
目录	第6-8页
第一章绪论	第8-14页
·课题研究背景及意义	第8-10页
·文本分类研究现状	第10-12页
·国外研究现状	第10-11页
·国内研究现状	第11-12页
·论文的主要研究内容	第12页
·论文的组织	第12-14页
第二章文本分类相关技术概述	第14-28页
·文本预处理	第15-16页
·文本表示	第16-17页
·特征提取	第17-20页
·文档频率(DF)	第17-18页
·互信息(MI)	第18页
·CHI统计量	第18-19页
·信息增益(IG)	第19页
·期望交叉熵(ECE)	第19-20页
·常见文本分类算法	第20-27页
·Rocchio分类	第20页
·贝叶斯分类	第20-21页
·决策树归纳分类	第21-23页
·k最近邻分类	第23-24页
·支持向量机	第24-27页
·本章小结	第27-28页
第三章融合CHI和MI的特征提取方法	第28-32页
·引言	第28页
·CHI和MI特征提取方法的不足	第28页
·融合CHI和MI改进的特征提取方法	第28-30页
·实验结果和分析	第30-31页
·本章小结	第31-32页
第四章融合特征提取和LDA模型文本分类	第32-42页
·传统方法的问题	第32页
·主题模型	第32-36页
·pLSI模型	第32-35页
·LDA模型	第35-36页
·融合CHI特征提取和LDA模型的文本分类方法	第36-41页
·基本流程	第36-37页
·文本预处理	第37页
·LDA模型的训练和推断	第37-40页
·CHI特征提取和文本特征表示	第40页
·特征的融合和分类过程实现	第40-41页
·本章小结	第41-42页
第五章实验和结果分析	第42-54页
·实验的软硬件环境	第42页
·实验语料库和结果评估指标	第42-44页
·实验语料库	第42-43页
·实验的结果评估指标	第43-44页
·文本预处理	第44-45页
·LDA模型训练和推断	第45-48页
·LDA模型的训练	第46-47页
·LDA模型的推断	第47-48页
·文本的数理统计信息表示	第48-49页
·LDA和CHI组合参数确定	第49页
·文本分类实验和结果分析	第49-53页
·SVM实验结果及分析	第49-51页
·朴素贝叶斯实验结果及分析	第51-53页
·本章小结	第53-54页
第六章总结与展望	第54-56页
·工作总结	第54-55页
·研究展望	第55-56页
参考文献	第56-60页
致谢	第60-61页
攻读硕士期间发表的论文	第61页