首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于大规模语料库的中文同义词抽取方法研究

西北师范大学研究生学位论文作者信息第5-8页
摘要第8-9页
Abstract第9-10页
1 绪论第11-26页
    1.1 课题背景及意义第11-13页
        1.1.1 课题背景第11-12页
        1.1.2 研究意义第12-13页
    1.2 同义词及同义词抽取第13页
        1.2.1 同义词的定义第13页
        1.2.2 同义词抽取的意义第13页
    1.3 同义词抽取技术研究现状第13-18页
        1.3.1 国外相关研究及现状第13-15页
            1.3.1.1 从互联网中抽取同义词第13-14页
            1.3.1.2 从单一词典中抽取同义词第14-15页
            1.3.1.3 从大规模语料库中抽取同义词第15页
        1.3.2 国内相关研究及现状第15-18页
    1.4 常用同义词抽取方法第18-19页
        1.4.1 模板匹配方法第18页
        1.4.2 分布相似方法第18-19页
    1.5 同义词抽取方法的评价标准及评价指标第19-22页
        1.5.1 同义词抽取方法的评价标准第19-21页
        1.5.2 同义词抽取方法的评价指标第21-22页
            1.5.2.1 微平均指标第21-22页
            1.5.2.2 宏平均指标第22页
    1.6 语料库语言学第22-23页
    1.7 研究内容及论文结构第23-26页
        1.7.1 研究内容第23-24页
        1.7.2 算法效率第24页
        1.7.3 论文结构第24-26页
2 字面相似与 PageRank 融合计算词汇相似度第26-35页
    2.1 字面相似度第26-28页
        2.1.1 字面相似度原理第26-27页
        2.1.2 改进的字面相似度计算第27页
        2.1.3 实验结果与分析第27-28页
    2.2 PageRank 链接方法第28-32页
        2.2.1 PageRank 理论简介第29页
        2.2.2 PageRank 链接方法第29-31页
        2.2.3 实验结果与分析第31-32页
    2.3 融合方法计算词汇相似度第32-35页
        2.3.1 融合方法的思想第32-33页
        2.3.2 实验结果与分析第33-35页
3 PMI 与 LSA 结合方法计算词汇相似度第35-44页
    3.1 点互信息第35-39页
        3.1.1 互信息基本理论第35-37页
        3.1.2 点互信息原理第37页
        3.1.3 点互信息 PMI 的计算第37-38页
        3.1.4 基于词汇点互信息向量的相似度计算第38页
        3.1.5 实验结果与分析第38-39页
    3.2 潜在语义分析第39-41页
        3.2.1 潜在语义分析理论第39-40页
        3.2.2 词-文档矩阵构建第40页
        3.2.3 基于潜在语义分析的词汇相似度计算第40-41页
        3.2.4 实验结果与分析第41页
    3.3 PMI 与 LSA 结合的词汇相似度计算的基本思想第41-42页
    3.4 PMI 与 LSA 结合的词汇相似度计算算法描述第42页
    3.5 实验结果与分析第42-44页
4 总结与展望第44-45页
    本文总结第44页
    下一步工作的展望第44-45页
参考文献第45-49页
攻读学位期间发表的论文第49-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:基于视听通道融合的多媒体暴力片段检测方法研究
下一篇:基于粗糙集和关联规则的医学图像分类方法研究