首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于N-gram与混合策略的新词识别研究与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第12-19页
    1.1 研究背景第12-13页
    1.2 研究现状第13-17页
        1.2.1 基于规则的新词识别方法第13-14页
        1.2.2 基于统计的新词识别方法第14-16页
        1.2.3 基于规则与统计结合的新词识别方法第16-17页
    1.3 研究目标与内容第17-18页
    1.4 论文组织结构第18-19页
第二章 相关技术第19-30页
    2.1 自然语言处理第19-21页
        2.1.1 自然语言处理发展阶段第19-20页
        2.1.2 自然语言处理领域研究方向第20-21页
    2.2 新词的定义与分类第21-23页
        2.2.1 新词的定义第21页
        2.2.2 新词的构词模式与类别第21-23页
    2.3 相关统计基础介绍第23-28页
        2.3.1 N-gram统计模型介绍第24-26页
        2.3.2 互信息第26-27页
        2.3.3 信息熵第27-28页
    2.4 网络爬虫第28-29页
    2.5 本章小结第29-30页
第三章 混合策略的新词识别方法设计与实现第30-41页
    3.1 设计理念第30-32页
    3.2 新词识别总体框架第32页
    3.3 语料库的选取与实现第32-35页
        3.3.1 语料库的选取第32-33页
        3.3.2 语料库的实现第33-35页
    3.4 语料预处理第35-38页
    3.5 候选新词获取第38页
    3.6 停止词过滤第38-40页
    3.7 本章小结第40-41页
第四章 实验结果分析第41-51页
    4.1 实验环境说明第41页
    4.2 实验数据说明第41-42页
    4.3 实验评价指标第42页
    4.4 基于互信息方法的实验结果第42-43页
    4.5 基于信息熵方法的实验结果第43-44页
    4.6 互信息与信息熵方法结合的实验结果第44-46页
    4.7 引入停止词过滤后的实验结果第46-47页
    4.8 部分分词结果展示第47-48页
    4.9 方法总结第48-49页
    4.10 本章小结第49-51页
第五章 总结与展望第51-53页
参考文献第53-57页
作者在攻读硕士学位期间相关研究工作第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于AES算法硬件木马的检测系统设计与验证
下一篇:无标识增强现实电子书—“汉字启蒙”的设计与实现