基于PCA和LDA的文本分类系统设计与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章引言	第9-14页
·研究背景和意义	第9-11页
·研究背景	第9-10页
·研究意义	第10-11页
·国内外现状	第11-12页
·国外研究现状	第11页
·国内研究现状	第11-12页
·本文的研究工作	第12-14页
第二章文本分类的主要方法和技术	第14-25页
·文本分类过程	第14-15页
·文本预处理	第15-17页
·中文分词	第15-17页
·去除停用词	第17页
·特征抽取	第17-18页
·文本表示模型	第18-19页
·布尔模型	第18-19页
·向量空间模型	第19页
·统计主题模型	第19页
·常用文本分类算法	第19-23页
·贝叶斯方法	第20页
·简单向量距离算法	第20-21页
·KNN算法	第21-22页
·SVM分类算法	第22-23页
·分类性能评估	第23-25页
第三章系统详细设计	第25-49页
·文本预处理	第26-32页
·分词实现	第26-28页
·词袋模型	第28-30页
·频率统计	第30页
·CRF模型	第30-32页
·特征提取	第32-40页
·TF-IDF模型	第32页
·LDA模型	第32-35页
·主成分分析原理	第35-37页
·LDA模块实现	第37-39页
·PCA模块实现	第39-40页
·文本分类训练和测试	第40-49页
·SVM二分类原理	第40-42页
·多分类原理	第42-43页
·分类工具	第43-44页
·模块设计	第44-49页
第四章文本分类实验评估	第49-54页
·系统环境和数据	第49页
·分词性能	第49页
·特征提取结果比较	第49-51页
·LDA特征提取	第50页
·文本向量化	第50-51页
·PCA特征降维	第51页
·分类结果比较	第51-54页
第五章总结和展望	第54-55页
·总结	第54页
·展望	第54-55页
参考文献	第55-58页
作者攻读学位期间发表的学术论文目录	第58-59页
致谢	第59页