首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于BTM主题模型特征扩展的短文本相似度计算

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 绪论第9-15页
   ·课题背景及其意义第9-10页
   ·短文本相似度计算第10-12页
   ·短文本建模以及相似度计算现状第12-13页
   ·本文主要内容第13-14页
   ·本文的组织结构第14-15页
第二章 向量空间模型和相似度计算公式第15-20页
   ·向量空间模型第15页
   ·TFIDF 原理第15-16页
   ·余弦相似性第16-17页
   ·KL距离第17页
   ·JS(Jensen—Shannon)距离第17-18页
   ·实验第18-20页
     ·实验数据及相关标准第18页
     ·实验结果第18-20页
第三章 主题模型第20-42页
   ·相关工作第20-21页
   ·主题模型第21-23页
   ·隐性语义索引LSI第23-25页
   ·pLSI概率隐性语义索引主题模型第25-28页
   ·LDA主题模型第28-32页
     ·LDA主题模型简介第28-30页
     ·LDA主题模型参数估计第30-32页
   ·BTM主题模型第32-35页
     ·BTM主题模型中特定语料的生成过程第34页
     ·BTM主题模型参数估计第34-35页
   ·实验第35-42页
     ·LDA主题模型输入以及预处理第35-38页
     ·BTM主题模型输入以及预处理第38-39页
     ·实验结果及分析第39-42页
第四章 基于BTM模型的相似度计算第42-50页
   ·引言第42页
   ·相关工作第42-50页
     ·预处理第43-44页
     ·特征选择、高频词表第44页
     ·基于BTM模型的短文本特征值扩展第44-46页
     ·相似度计算第46-47页
     ·实验第47-50页
第五章 总结和展望第50-52页
   ·主要工作和创新点第50-51页
   ·改进和展望第51-52页
参考文献第52-55页
附录第55-63页
 附录1 BTM模型输入预处理程序代码(C#)第55-60页
 附录2 Weka输入预处理程序代码(C#)第60-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:基于特征选择及LDA模型的中文文本分类研究与实现
下一篇:不确定性数据流频繁项集挖掘算法研究