首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于PCA和LDA的文本分类系统设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-14页
   ·研究背景和意义第9-11页
     ·研究背景第9-10页
     ·研究意义第10-11页
   ·国内外现状第11-12页
     ·国外研究现状第11页
     ·国内研究现状第11-12页
   ·本文的研究工作第12-14页
第二章 文本分类的主要方法和技术第14-25页
   ·文本分类过程第14-15页
   ·文本预处理第15-17页
     ·中文分词第15-17页
     ·去除停用词第17页
   ·特征抽取第17-18页
   ·文本表示模型第18-19页
     ·布尔模型第18-19页
     ·向量空间模型第19页
     ·统计主题模型第19页
   ·常用文本分类算法第19-23页
     ·贝叶斯方法第20页
     ·简单向量距离算法第20-21页
     ·KNN算法第21-22页
     ·SVM分类算法第22-23页
   ·分类性能评估第23-25页
第三章 系统详细设计第25-49页
   ·文本预处理第26-32页
     ·分词实现第26-28页
     ·词袋模型第28-30页
     ·频率统计第30页
     ·CRF模型第30-32页
   ·特征提取第32-40页
     ·TF-IDF模型第32页
     ·LDA模型第32-35页
     ·主成分分析原理第35-37页
     ·LDA模块实现第37-39页
     ·PCA模块实现第39-40页
   ·文本分类训练和测试第40-49页
     ·SVM二分类原理第40-42页
     ·多分类原理第42-43页
     ·分类工具第43-44页
     ·模块设计第44-49页
第四章 文本分类实验评估第49-54页
   ·系统环境和数据第49页
   ·分词性能第49页
   ·特征提取结果比较第49-51页
     ·LDA特征提取第50页
     ·文本向量化第50-51页
     ·PCA特征降维第51页
   ·分类结果比较第51-54页
第五章 总结和展望第54-55页
   ·总结第54页
   ·展望第54-55页
参考文献第55-58页
作者攻读学位期间发表的学术论文目录第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:快速WEB开发的整合框架的设计与实现
下一篇:分布式知识搜索系统的研究与实现