基于分段融合的藏文文本相似度计算方法研究

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-15页
·国外研究状况	第9页
·国内研究状况	第9-11页
·藏文信息处理状况	第11-12页
·选题目的和意义	第12-13页
·研究背景	第12页
·选题目的	第12页
·选题意义	第12-13页
·本文主要内容	第13-15页
第2章藏文文本预处理	第15-22页
·相似度计算方法介绍	第15-16页
·余弦定理相似度计算方法	第15页
·Jaccard相似性系数计算方法	第15-16页
·欧几里得距离相似度计算方法	第16页
·分段融合的中文文本相似度计算方法	第16页
·语料选取	第16-17页
·藏文分词方法简介	第17-20页
·中英文词语和藏文词语比较	第19页
·本文藏文分词软件	第19-20页
·停用词处理	第20页
·特征降维	第20-21页
·藏文停用词表	第21-22页
第3章特征词提取及权值计算	第22-32页
·藏文文本特征词提取	第22-25页
·特征词个数选取依据	第22页
·藏文文本特征词提取过程	第22-24页
·筛选段落	第24页
·确定特征词个数	第24-25页
·特征权重计算方法	第25-27页
·TF算法	第25页
·TF-IDF算法	第25页
·TF~*IDF算法	第25-26页
·语义加强的TF~*IDF算法	第26-27页
·权值计算	第27-32页
·TF值及DF值计算	第27-28页
·权值归一化操作	第28-29页
·计算权值	第29-32页
第4章藏文文本相似度计算	第32-50页
·分段融合的藏文文本相似度简介	第32-33页
·段落相似度计算	第33-35页
·相似度矩阵	第33-34页
·对应段落相似度计算	第34-35页
·分段融合的藏文文本相似度计算	第35-37页
·相似度值精确化	第35-36页
·分段融合	第36-37页
·相似度计算关键步骤	第37-43页
·藏文停用词筛选	第37-40页
·各变量表示方法	第40-41页
·程序中用到的几个关键类	第41-43页
·相似度系统模型生成	第43-46页
·程序运行环境	第43页
·TibetText-SegmentSimilarity图形化界面	第43-45页
·软件使用说明	第45-46页
·实验测试与评估	第46-50页
·实验方法	第46页
·实验测试	第46-47页
·实验结果分析	第47-50页
第5章总结与展望	第50-52页
·本文主要工作总结	第50页
·不足之处	第50-51页
·进一步工作	第51-52页
参考文献	第52-55页
附录	第55-60页
致谢	第60页
攻读硕士学位期间发表的论文	第60页