首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于马尔科夫模型的文本相似度研究

摘要第1-5页
Abstract第5-8页
1 绪论第8-15页
   ·研究的目的和意义第8-9页
     ·本课题研究的目的第8页
     ·本课题研究的意义第8-9页
   ·国内外研究的现状第9-13页
     ·文本相似度研究现状第9-11页
     ·马尔科夫模型简介及研究现状第11-12页
     ·文本相似度研究存在的问题第12-13页
     ·文本相似度与马尔科夫模型的结合第13页
   ·本文创新及内容安排第13-15页
     ·本文的创新第13页
     ·本文的内容安排第13-15页
2 词频第15-24页
   ·VSM和TF-IDF方法简介第15-17页
     ·计算TF项和IDF项的方法第15-17页
     ·算法的复杂度分析第17页
   ·数据预处理第17-24页
     ·数据预处理和降维的必要性第17页
     ·数据降维第17-18页
     ·数据预处理/降维方法第18-22页
     ·关于中文分词第22-24页
3 词序第24-35页
   ·马尔科夫模型状态转移矩阵第24-25页
     ·选择马尔科夫模型状态转移矩阵的必要性第24页
     ·马尔科夫模型状态转移矩阵的生成第24-25页
   ·公共子串第25-33页
     ·关于公共子串第25页
     ·公共子串求取原理第25-27页
     ·公共子串求取算法及复杂度分析第27-33页
   ·最长公共子序列第33-35页
     ·关于最长公共子序列第33-34页
     ·最长公共子序列的求取第34-35页
4 文本相似度计算第35-44页
   ·文本相似度计算模型第35-37页
     ·基于马尔科夫模型的文本相似度计算公式的设计原则第35页
     ·基于马尔科夫模型的文本相似度计算公式的建立第35-37页
   ·连接因子μ第37-42页
     ·连接因子μ的定义第37-38页
     ·连接因子μ的计算实例第38-41页
     ·计算μ的详细流程图第41-42页
   ·文本相似度计算模型的特点第42页
   ·文本相似度计算模型的计算流程第42-44页
5 实验及结果分析第44-51页
   ·关于数据集第44-48页
     ·Ohsu-trec数据集第44-46页
     ·本文数据集的生成第46-48页
   ·实验结果第48-49页
     ·实验评估算法第48页
     ·对比实验结果第48-49页
   ·实验结果分析第49-50页
   ·系统应用及未来展望第50-51页
结论第51-52页
参考文献第52-54页
附录A 边建树边检索树程序第54-58页
攻读硕士学位期间发表学术论文情况第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:利用数字成像曲面断层技术对18岁-28岁成人下颌孔位置的研究
下一篇:以目标为导向的老年人IT产品用户研究与设计