首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于分段融合的藏文文本相似度计算方法研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-15页
   ·国外研究状况第9页
   ·国内研究状况第9-11页
   ·藏文信息处理状况第11-12页
   ·选题目的和意义第12-13页
     ·研究背景第12页
     ·选题目的第12页
     ·选题意义第12-13页
   ·本文主要内容第13-15页
第2章 藏文文本预处理第15-22页
   ·相似度计算方法介绍第15-16页
     ·余弦定理相似度计算方法第15页
     ·Jaccard相似性系数计算方法第15-16页
     ·欧几里得距离相似度计算方法第16页
     ·分段融合的中文文本相似度计算方法第16页
   ·语料选取第16-17页
   ·藏文分词方法简介第17-20页
     ·中英文词语和藏文词语比较第19页
     ·本文藏文分词软件第19-20页
   ·停用词处理第20页
   ·特征降维第20-21页
   ·藏文停用词表第21-22页
第3章 特征词提取及权值计算第22-32页
   ·藏文文本特征词提取第22-25页
     ·特征词个数选取依据第22页
     ·藏文文本特征词提取过程第22-24页
     ·筛选段落第24页
     ·确定特征词个数第24-25页
   ·特征权重计算方法第25-27页
     ·TF算法第25页
     ·TF-IDF算法第25页
     ·TF~*IDF算法第25-26页
     ·语义加强的TF~*IDF算法第26-27页
   ·权值计算第27-32页
     ·TF值及DF值计算第27-28页
     ·权值归一化操作第28-29页
     ·计算权值第29-32页
第4章 藏文文本相似度计算第32-50页
   ·分段融合的藏文文本相似度简介第32-33页
   ·段落相似度计算第33-35页
     ·相似度矩阵第33-34页
     ·对应段落相似度计算第34-35页
   ·分段融合的藏文文本相似度计算第35-37页
     ·相似度值精确化第35-36页
     ·分段融合第36-37页
   ·相似度计算关键步骤第37-43页
     ·藏文停用词筛选第37-40页
     ·各变量表示方法第40-41页
     ·程序中用到的几个关键类第41-43页
   ·相似度系统模型生成第43-46页
     ·程序运行环境第43页
     ·TibetText-SegmentSimilarity图形化界面第43-45页
     ·软件使用说明第45-46页
   ·实验测试与评估第46-50页
     ·实验方法第46页
     ·实验测试第46-47页
     ·实验结果分析第47-50页
第5章 总结与展望第50-52页
   ·本文主要工作总结第50页
   ·不足之处第50-51页
   ·进一步工作第51-52页
参考文献第52-55页
附录第55-60页
致谢第60页
攻读硕士学位期间发表的论文第60页

论文共60页,点击 下载论文
上一篇:藏语话题刻面情感识别研究及实现
下一篇:藏文web网络社区划分研究与实现