首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题模型的科技文献主题探测研究

摘要第1-4页
Abstract第4-7页
第1章 引言第7-11页
   ·研究背景与意义第7页
   ·国内外研究现状及相关技术发展第7-9页
   ·本文的研究内容第9-10页
   ·本文的组织结构第10-11页
第2章 科技文献主题探测简介第11-19页
   ·常用的文本分类方法第11-15页
     ·基于简单向量距离的分类法第11-12页
     ·K近邻法(K-Nearest Neighbor)第12-13页
     ·贝叶斯分类法第13-14页
     ·支持向量机(SVM)第14-15页
   ·常用的文本聚类方法第15-18页
     ·基于划分的方法第16页
     ·基于层次的方法第16-17页
     ·基于模型的方法第17页
     ·基于网格的方法第17页
     ·基于密度的方法第17-18页
   ·基于主题模型的科技文献主题探测研究方法第18-19页
第3章 科技文献主题探测系统使用的技术第19-27页
   ·k-means聚类算法第19-23页
     ·向量空间模型第19页
     ·预处理第19-20页
     ·TF-IDF权重第20-22页
     ·文本相似度第22页
     ·K-means算法第22-23页
   ·LDA主题模型第23-27页
     ·Beta/Dirichlet分布第23-24页
     ·图形模型第24-25页
     ·LDA模型第25-26页
     ·LDA主题探测过程第26-27页
第4章 基于K-means算法的科技文献主题探测方法第27-35页
   ·文本聚类第27-28页
   ·基于K-means算法的科技文献主题探测方法的实现第28-30页
     ·基本思路第28页
     ·算法设计第28-30页
   ·测试及结果分析第30-35页
     ·测试数据第30-32页
     ·系统测试及分析第32-35页
第5章 基于LDA模型的科技文献主题探测方法第35-50页
   ·文本挖掘中的模型发展第35-40页
     ·隐含语义分析(LSA)第35-37页
     ·概率隐含语义分析(PLSA)第37-39页
     ·隐含狄利克雷分布(LDA)第39-40页
   ·基于LDA模型的科技文献主题探测方法的实现第40-46页
     ·狄利克雷分布第40页
     ·MCMC方法第40-41页
     ·基本思路第41-44页
     ·算法设计第44-46页
   ·测试及结果分析第46-50页
     ·系统测试及分析第46-47页
     ·热点分析第47-50页
第6章 总结和展望第50-52页
致谢第52-53页
参考文献第53-56页

论文共56页,点击 下载论文
上一篇:半枝莲黄酮对Aβ25-35损伤大鼠星形胶质细胞的干预作用
下一篇:基于工作流的监狱固定资产管理系统的研究和开发