首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于概率主题模型的文档自动分类

摘要第1-5页
Abstract第5-10页
1 绪论第10-13页
   ·研究背景及意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·研究内容和创新第11-12页
     ·研究内容第11页
     ·使用平台第11-12页
     ·软件开发基于理论第12页
     ·研究创新第12页
   ·论文结构第12-13页
2 相关研究进展第13-19页
   ·中文分词研究进展第13页
     ·中文分词概念第13页
     ·中文分词发展状况第13页
   ·文档分类相关研究进展第13-18页
     ·文档分类的概念第13-14页
     ·文档分类的现状第14-16页
     ·简化的基于概率主题模型分类方法第16-17页
     ·模糊K-Means结合概率主题分类第17-18页
   ·本章总结第18-19页
3 实现中文分词第19-29页
   ·分词相关概述第19页
   ·常见中文分词实现方法第19-20页
     ·基于字符串匹配的分词法第19-20页
     ·基于统计的分词方法第20页
     ·基于知识理解的分词方法第20页
   ·本文采用的分类方法第20页
   ·具体分词步骤第20-24页
     ·词库的选择和处理第21-23页
     ·文档初分第23页
     ·正向匹配词库的逻辑方法第23-24页
   ·程序实现第24-25页
     ·分词界面第24-25页
     ·主要功能及实现方法第25页
   ·分词的简单改进第25-28页
   ·本章总结第28-29页
4 主题抽取第29-36页
   ·概述第29页
     ·概率主题模型第29页
     ·主题的概念第29页
   ·使用训练文档库第29页
   ·主题抽取第29-35页
     ·软件实现第30页
     ·以各类别的最大词频作为主题第30-32页
     ·以各类别的最大词频剔除常出现词作为主题第32-35页
   ·本章总结第35-36页
5 概率分布第36-41页
   ·概述第36页
   ·界面第36页
   ·功能实现第36-37页
     ·导入导出分词结果第36-37页
     ·产生概率分布第37页
   ·计算结果第37-40页
     ·第一种主题分布产生的概率分布第37-38页
     ·第二种主题分布产生的概率分布第38-39页
     ·两种不同概率分布的区别第39-40页
   ·本章总结第40-41页
6 有监督的自动分类第41-51页
   ·概述第41页
   ·概率分布比较第41-46页
     ·相减法第42-43页
     ·相除法第43-44页
     ·相除平方法第44-45页
     ·结果分析第45-46页
   ·实现方法第46-49页
     ·界面第46页
     ·文件结构第46-47页
     ·程序实现第47-49页
   ·算法优化第49-50页
   ·编码第50页
   ·本章总结第50-51页
7 无监督的自动分类第51-53页
   ·概述第51页
   ·设计思路第51-52页
   ·实现方法第52-53页
     ·混合文档并分词第52页
     ·统计关键词第52-53页
     ·随机挑选文章,并计算概率分布第53页
     ·重新计算主题,并计算概率分布第53页
     ·结果第53页
   ·本章总结第53页
8 总结和工作展望第53-54页
   ·论文总结第53-54页
   ·下一步研究第54页
     ·自动化第54页
     ·主题抽取第54页
     ·多类别第54页
参考文献第54-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于感知的立体视频质量评价模型研究
下一篇:基于几何图像的碰撞检测