首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于维基百科的汉语词语及短文本相关度计算方法研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-13页
   ·课题研究背景与意义第9页
   ·课题研究现状及发展趋势第9-11页
   ·本文的研究内容第11-12页
   ·本文的组织第12-13页
第二章 相关工作及研究进展第13-25页
   ·维基百科简介第13-15页
   ·维基百科在自然语言处理中的应用第15-17页
   ·词语及文本相关度计算研究现状第17-24页
     ·词语相关度计算方法第17-20页
     ·文本相关度计算方法第20-21页
     ·基于维基百科的相关度计算方法第21-23页
     ·相关度评测标准第23-24页
   ·本章小结第24-25页
第三章 基于中文维基百科分类体系和文档链接的词语相关度计算第25-35页
   ·基于分类体系的相关度计算第25-26页
     ·最短路径法第25-26页
     ·深度加权路径法第26页
   ·基于文档链接的相关度计算第26-29页
     ·链接向量法第28页
     ·Google 距离法第28-29页
   ·分类图与文档链接相结合的相关度计算第29-31页
     ·链接分类向量第29-30页
     ·语义向量的构建第30-31页
   ·测试实例及其分析第31-34页
   ·本章小结第34-35页
第四章 基于维基百科的短文本相关度计算第35-45页
   ·传统相似度计算方法第35-36页
   ·最大序列算法第36-40页
     ·相关度特征矩阵第38-39页
     ·最大匹配组合选择第39-40页
   ·动态权值算法第40-43页
     ·动态组块概念第40-42页
     ·权重动态分配第42-43页
   ·测试实例及其分析第43-44页
   ·本章小结第44-45页
第五章 实验及性能评价第45-59页
   ·实验环境第45页
   ·中文维基百科语义资源整理第45-51页
     ·中文维基百科的内容结构第45-46页
     ·语料下载与结构化整理第46-50页
     ·维基百科分类和链接结构的抽取第50-51页
   ·词语相关度计算实验第51-54页
     ·WordSimilarity-353 测试集第52页
     ·Spearman 等级相关系数第52页
     ·词语相关度结果第52-54页
     ·实验分析第54页
   ·短文本相关度计算实验第54-58页
     ·短文本测试集第54-55页
     ·最大序列方法计算第55-56页
     ·动态权值方法计算第56页
     ·实验分析第56-58页
   ·本章小结第58-59页
第六章 总结与工作展望第59-61页
   ·本文的主要研究工作及成果第59-60页
   ·存在的问题及对将来工作的展望第60-61页
致谢第61-62页
参考文献第62-65页
附录第65页

论文共65页,点击 下载论文
上一篇:基于Hadoop的Web评论自动抽取方法研究
下一篇:基于中文维基百科的命名实体消歧方法研究