首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于维基百科的短文本相关度计算

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第10-18页
    1.1 课题研究背景与意义第10-11页
    1.2 课题研究现状第11-15页
        1.2.1 词语相关度计算研究现状第12-14页
        1.2.2 句子相关度计算研究现状第14页
        1.2.3 基于维基百科的研究现状第14-15页
    1.3 本文研究内容第15-17页
    1.4 本文组织结构第17-18页
第二章 相关技术第18-30页
    2.1 维基百科简介第18-21页
    2.2 文本预处理第21-23页
        2.2.1 中文分词及常用工具介绍第21-23页
        2.2.2 噪音过滤第23页
    2.3 数据挖掘中关联规则的简介第23-27页
    2.4 语义相关度评价体系第27-29页
    2.5 本章小结第29-30页
第三章 词语相关度的计算方法第30-42页
    3.1 基于类别体系的词语相关度计算第30-32页
        3.1.1 词语间距离第30-31页
        3.1.2 基于维基百科类别结构的相关度计算方法第31-32页
    3.2 链接相关度第32-37页
        3.2.1 条目的重定向和消歧义第33-34页
        3.2.2 链接的向量构建第34-36页
        3.2.3 链接的相关度计算第36-37页
    3.3 类别相关度与链接相关度相结合的相关度计算第37页
    3.4 利用关联规则计算词语相关度第37-40页
        3.4.1 关联规则词语相关度计算第37-38页
        3.4.2 词汇社区结构的构建第38-40页
    3.5 本章小结第40-42页
第四章 句子相关度的计算方法第42-54页
    4.1 句子结构相关度计算第42-43页
        4.1.1 词形相关度第42页
        4.1.2 词序相关度第42-43页
    4.2 基于词对的语义相关度第43-45页
    4.3 基于聚类的主题词加权相关度计算方法第45-51页
        4.3.1 文本聚类的相关概念第45-47页
        4.3.2 聚类算法第47-50页
        4.3.3 基于聚类的相关度计算方法第50-51页
    4.4 短文本相关度计算第51-52页
    4.5 本章小结第52-54页
第五章 实验设计及结果分析第54-64页
    5.1 维基百科数据预处理第54-57页
    5.2 算法设计第57-59页
        5.2.1 测试集第57-58页
        5.2.2 实验环境第58-59页
    5.3 实验结果及分析第59-63页
        5.3.1 词语相关度第59-62页
        5.3.2 句子相关度第62-63页
    5.4 本章小结第63-64页
第六章 总结与展望第64-66页
    6.1 本文的主要研究工作第64-65页
    6.2 下一步工作第65-66页
参考文献第66-70页
致谢第70-72页
攻读学位期间发表的学术论文目录第72页

论文共72页,点击 下载论文
上一篇:2.5MW风电齿轮箱可靠性分析
下一篇:低幼儿童绘本的图像叙事方式研究--以“松鼠收藏家”为例