新词分析与语义分析相结合的文本相似度量方法研究

摘要	第4-5页
abstract	第5页
1 绪论	第7-12页
1.1 研究背景及意义	第7-8页
1.2 本文工作	第8-10页
1.2.1 研究内容	第8页
1.2.2 研究目标	第8-9页
1.2.3 研究方法	第9页
1.2.4 研究思路	第9-10页
1.3 主要创新之处	第10页
1.4 论文的组织结构	第10-12页
2 相关概念与文献综述	第12-17页
2.1 向量空间模型	第12-13页
2.2 《知网》(HowNet)简介	第13-14页
2.3 国内外研究现状	第14-17页
3 新词语义相似度计算	第17-39页
3.1 新词的识别与提取	第17-23页
3.1.1 文本分词原理简介	第17-20页
3.1.2 新词识别提取方法	第20-23页
3.2 《知网》结构分析	第23-26页
3.3 义原相似度改进算法	第26-28页
3.4 新词的概念确定	第28-29页
3.5 词语语义相似度计算方法	第29-32页
3.5.1 算法基础	第29-30页
3.5.2 算法改进与优化	第30-32页
3.6 实验评估分析	第32-38页
3.6.1 义原相似度算法验证分析	第32-36页
3.6.2 词语相似度算法验证分析	第36-38页
3.7 本章小结	第38-39页
4 文本相似度计算	第39-49页
4.1 提取特征词向量	第39页
4.2 文本相似度计算方法	第39-41页
4.3 文本相似度计算实验	第41-48页
4.3.1 实验数据准备	第41页
4.3.2 特征词向量提取	第41-43页
4.3.3 相似度计算	第43-48页
4.3.4 实验评估分析	第48页
4.4 本章小结	第48-49页
总结与展望	第49-51页
研究总结	第49页
研究展望	第49-51页
致谢	第51-52页
参考文献	第52-56页
攻读学位期间的研究成果	第56页