基于概率主题模型的文档自动分类

摘要	第1-5页
Abstract	第5-10页
1 绪论	第10-13页
·研究背景及意义	第10-11页
·研究背景	第10页
·研究意义	第10-11页
·研究内容和创新	第11-12页
·研究内容	第11页
·使用平台	第11-12页
·软件开发基于理论	第12页
·研究创新	第12页
·论文结构	第12-13页
2 相关研究进展	第13-19页
·中文分词研究进展	第13页
·中文分词概念	第13页
·中文分词发展状况	第13页
·文档分类相关研究进展	第13-18页
·文档分类的概念	第13-14页
·文档分类的现状	第14-16页
·简化的基于概率主题模型分类方法	第16-17页
·模糊K-Means结合概率主题分类	第17-18页
·本章总结	第18-19页
3 实现中文分词	第19-29页
·分词相关概述	第19页
·常见中文分词实现方法	第19-20页
·基于字符串匹配的分词法	第19-20页
·基于统计的分词方法	第20页
·基于知识理解的分词方法	第20页
·本文采用的分类方法	第20页
·具体分词步骤	第20-24页
·词库的选择和处理	第21-23页
·文档初分	第23页
·正向匹配词库的逻辑方法	第23-24页
·程序实现	第24-25页
·分词界面	第24-25页
·主要功能及实现方法	第25页
·分词的简单改进	第25-28页
·本章总结	第28-29页
4 主题抽取	第29-36页
·概述	第29页
·概率主题模型	第29页
·主题的概念	第29页
·使用训练文档库	第29页
·主题抽取	第29-35页
·软件实现	第30页
·以各类别的最大词频作为主题	第30-32页
·以各类别的最大词频剔除常出现词作为主题	第32-35页
·本章总结	第35-36页
5 概率分布	第36-41页
·概述	第36页
·界面	第36页
·功能实现	第36-37页
·导入导出分词结果	第36-37页
·产生概率分布	第37页
·计算结果	第37-40页
·第一种主题分布产生的概率分布	第37-38页
·第二种主题分布产生的概率分布	第38-39页
·两种不同概率分布的区别	第39-40页
·本章总结	第40-41页
6 有监督的自动分类	第41-51页
·概述	第41页
·概率分布比较	第41-46页
·相减法	第42-43页
·相除法	第43-44页
·相除平方法	第44-45页
·结果分析	第45-46页
·实现方法	第46-49页
·界面	第46页
·文件结构	第46-47页
·程序实现	第47-49页
·算法优化	第49-50页
·编码	第50页
·本章总结	第50-51页
7 无监督的自动分类	第51-53页
·概述	第51页
·设计思路	第51-52页
·实现方法	第52-53页
·混合文档并分词	第52页
·统计关键词	第52-53页
·随机挑选文章，并计算概率分布	第53页
·重新计算主题，并计算概率分布	第53页
·结果	第53页
·本章总结	第53页
8 总结和工作展望	第53-54页
·论文总结	第53-54页
·下一步研究	第54页
·自动化	第54页
·主题抽取	第54页
·多类别	第54页
参考文献	第54-58页
致谢	第58页