基于语义的网页相似性研究

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-13页
·选题背景及意义	第9-10页
·选题背景	第9页
·选题研究的意义	第9-10页
·网页相似性算法的起源和研究现状	第10-11页
·本文的贡献	第11页
·本文的组织	第11-13页
·本文的内容安排	第12页
·存在的问题及解决方法	第12-13页
第二章网页相似性算法介绍	第13-19页
·网页相似性特点	第13页
·经典的网页相似性算法介绍	第13-17页
·向量空间模型和 SCAM	第13-14页
·基于数字的相似性算法	第14-15页
·北大天网网页相似性算法	第15页
·基于汉明距离的相似性算法	第15-17页
·汉明码的定义	第15-16页
·相似性的计算	第16-17页
·各种算法的优缺点	第17-18页
·网页相似性研究存在的问题	第18页
·本章小结	第18-19页
第三章基于语义的网页相似性算法的研究现状	第19-28页
·国外的语义相似性算法的研究	第19-21页
·隐性语义索引模型	第19页
·基于 WORDNET 的语义相似度的计算	第19-21页
·国内的语义相似性算法的研究	第21-27页
·基于改进编辑距离的句子相似度的算法	第22-23页
·基于语义理解的文本相似度算法	第23-25页
·基于知网的语义相似度算法	第25-26页
·基于语义树的中文词语相似度计算	第26-27页
·本章小结	第27-28页
第四章基于语义的网页相似性计算	第28-37页
·对网页进行净化	第28-31页
·网页净化方法	第28-31页
·基于 DOM 树的划分算法	第28-30页
·基于位置的划分方法	第30-31页
·基于可视化的去噪方法	第31页
·中文分词	第31-32页
·去除停用词	第32页
·同义词词林	第32-33页
·基于语义的网页相似性计算	第33-36页
·相似性	第33-34页
·基于语料库和词语特征的文本相似性算法	第34-36页
·本章小结	第36-37页
第五章实验设计与试验结果	第37-42页
·实验设计	第37-38页
·实验语料	第38-39页
·实验的衡量方法	第39-40页
·综合衡量值	第39-40页
·实验结果对比及数据分析	第40-41页
·本章小结	第41-42页
第六章总结与展望	第42-44页
·论文的工作总结	第42页
·展望	第42-44页
参考文献	第44-48页
致谢	第48-49页
个人简历	第49页