首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域特殊性和统计语言知识的新词抽取方法

摘要第5-6页
Abstract第6页
第1章 绪论第10-18页
    1.1 研究背景第10-11页
    1.2 研究意义第11-12页
    1.3 研究现状第12-15页
        1.3.1 基于规则的方法第12-13页
        1.3.2 基于统计的方法第13-14页
        1.3.3 规则和统计相结合的方法第14-15页
    1.4 新词抽取的难点第15-16页
    1.5 本文的主要工作和创新点第16-17页
        1.5.1 本文的主要工作第16页
        1.5.2 创新点第16-17页
    1.6 本文的结构安排第17-18页
第2章 相关技术第18-28页
    2.1 基于普通统计特征的新词抽取方法第18-21页
        2.1.1 多种统计特征第18-20页
        2.1.2 统计特征的应用第20-21页
    2.2 基于SVM的新词发现模型第21-22页
        2.2.1 SVM的原理第21页
        2.2.2 SVM的常用核函数第21-22页
    2.3 基于HMM的新词发现模型第22-23页
        2.3.1 HMM在新词发现上的应用第22页
        2.3.2 HMM原理第22-23页
    2.4 基于CRF的新词发现模型第23-24页
    2.5 常用分词算法第24-26页
        2.5.1 基于字符串匹配的分词方法第24-25页
        2.5.2 基于统计的分词方法第25-26页
        2.5.3 基于理解的分词方法第26页
        2.5.4 分词方法的难点第26页
    2.6 本章小结第26-28页
第3章 基于领域特殊性和统计语言知识的新词抽取方法第28-37页
    3.1 新词特性分析第28-29页
    3.2 新词抽取方法概述第29页
    3.3 基于领域特殊性的垃圾串过滤第29-31页
        3.3.1 语料预处理第30-31页
        3.3.2 抽取n-gram第31页
        3.3.3 优化n-gram第31页
        3.3.4 基于领域特殊性的过滤算法第31页
    3.4 基于统计语言知识的新词抽取第31-33页
        3.4.1 词频第32页
        3.4.2 内部结合紧密性第32-33页
        3.4.3 统计特征的结合第33页
    3.5 实验分析第33-35页
        3.5.1 实验环境第33页
        3.5.2 数据集第33-34页
        3.5.3 评价标准第34页
        3.5.4 实验结果和分析第34-35页
        3.5.5 参数调整第35页
    3.6 方法的缺点第35-36页
    3.7 本章小结第36-37页
第4章 新词抽取方法的优化第37-46页
    4.1 统计特征的优化第37-41页
        4.1.1 词频第37页
        4.1.2 内部凝聚度第37-38页
        4.1.3 自由度第38-40页
        4.1.4 统计特征的结合第40-41页
    4.2 实验分析第41-45页
        4.2.1 实验结果和分析第41-43页
        4.2.2 不同统计特征的评估第43-44页
        4.2.3 参数调整第44-45页
    4.3 本章小结第45-46页
第5章 新词抽取方法的应用验证第46-53页
    5.1 新词抽取方法在中文分词系统中的应用第46-48页
        5.1.1 NLPIR分词系统简介第46-47页
        5.1.2 数据集第47页
        5.1.3 评价标准第47页
        5.1.4 实验结果和分析第47-48页
    5.2 英文领域词语的抽取第48-52页
        5.2.1 方法说明第48-49页
        5.2.2 数据集第49页
        5.2.3 评价标准第49页
        5.2.4 参数调整第49-50页
        5.2.5 实验结果和分析第50-52页
    5.3 本章小结第52-53页
结论第53-54页
参考文献第54-58页
附录第58-59页
攻读学位期间发表论文与研究成果清单第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:层级式航空网络结构性能优化研究
下一篇:基于复杂网络的交通流特征分析及组合预测研究