首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的网页相似性研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-13页
   ·选题背景及意义第9-10页
     ·选题背景第9页
     ·选题研究的意义第9-10页
   ·网页相似性算法的起源和研究现状第10-11页
   ·本文的贡献第11页
   ·本文的组织第11-13页
     ·本文的内容安排第12页
     ·存在的问题及解决方法第12-13页
第二章 网页相似性算法介绍第13-19页
   ·网页相似性特点第13页
   ·经典的网页相似性算法介绍第13-17页
     ·向量空间模型和 SCAM第13-14页
     ·基于数字的相似性算法第14-15页
     ·北大天网网页相似性算法第15页
     ·基于汉明距离的相似性算法第15-17页
       ·汉明码的定义第15-16页
       ·相似性的计算第16-17页
   ·各种算法的优缺点第17-18页
   ·网页相似性研究存在的问题第18页
   ·本章小结第18-19页
第三章 基于语义的网页相似性算法的研究现状第19-28页
   ·国外的语义相似性算法的研究第19-21页
     ·隐性语义索引模型第19页
     ·基于 WORDNET 的语义相似度的计算第19-21页
   ·国内的语义相似性算法的研究第21-27页
     ·基于改进编辑距离的句子相似度的算法第22-23页
     ·基于语义理解的文本相似度算法第23-25页
     ·基于知网的语义相似度算法第25-26页
     ·基于语义树的中文词语相似度计算第26-27页
   ·本章小结第27-28页
第四章 基于语义的网页相似性计算第28-37页
   ·对网页进行净化第28-31页
     ·网页净化方法第28-31页
       ·基于 DOM 树的划分算法第28-30页
       ·基于位置的划分方法第30-31页
       ·基于可视化的去噪方法第31页
   ·中文分词第31-32页
   ·去除停用词第32页
   ·同义词词林第32-33页
   ·基于语义的网页相似性计算第33-36页
     ·相似性第33-34页
     ·基于语料库和词语特征的文本相似性算法第34-36页
   ·本章小结第36-37页
第五章 实验设计与试验结果第37-42页
   ·实验设计第37-38页
   ·实验语料第38-39页
   ·实验的衡量方法第39-40页
     ·综合衡量值第39-40页
   ·实验结果对比及数据分析第40-41页
   ·本章小结第41-42页
第六章 总结与展望第42-44页
   ·论文的工作总结第42页
   ·展望第42-44页
参考文献第44-48页
致谢第48-49页
个人简历第49页

论文共49页,点击 下载论文
上一篇:基于ARM的压力浸入式小麦硬度仪测控系统研究
下一篇:基于土地资产化的农村社会保障机制构建研究