首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向中文维基百科模糊限制信息检测的语料库建设与研究

摘要第4-5页
Abstract第5-6页
1 绪论第9-15页
    1.1 研究的背景和意义第9-10页
    1.2 语料库发展现状第10-12页
        1.2.1 语料库发展状况第10-11页
        1.2.2 模糊限制信息语料库第11-12页
    1.3 本文语料库建设的主要难点第12-13页
    1.4 本文研究概述及组织第13-15页
2 相关研究介绍第15-21页
    2.1 语料库相关研究第15-17页
        2.1.1 语料库的分类第15页
        2.1.2 语料库建设中涉及的主要问题第15-16页
        2.1.3 自然语言处理与语料库的关系第16-17页
    2.2 模糊限制语第17-19页
        2.2.1 模糊限制语的分类第17-18页
        2.2.2 模糊限制语的自动识别第18-19页
    2.3 中文维基百科第19-20页
    2.4 本章小结第20-21页
3 语料库设计第21-28页
    3.1 本文对模糊限制语的界定第21页
    3.2 语料库规划第21-22页
    3.3 语料库设计第22-27页
        3.3.1 语料库的平衡结构和采样原则第22-25页
        3.3.2 语料库结构第25-27页
        3.3.3 模糊限制信息的标注格式第27页
    3.4 本章小结第27-28页
4 语料库构建第28-39页
    4.1 语料采集第29-31页
    4.2 模糊限制语词典的构建第31-32页
    4.3 基于最大匹配算法的模糊限制语初始标注第32-35页
        4.3.1 逆向最大匹配法第33页
        4.3.2 基于分词的逆向最大匹配法第33-35页
    4.4 模糊限制信息手工标注第35-38页
        4.4.1 模糊限制语的标注第35-36页
        4.4.2 模糊限制信息范围的标注第36-38页
    4.5 本章小结第38-39页
5 语料库统计分析第39-44页
    5.1 自动标注语料库统计分析第39-40页
        5.1.1 基于逆向最大匹配法的结果统计第39-40页
        5.1.2 基于分词的逆向最大匹配法的结果统计第40页
    5.2 手工校正语料库统计分析第40-43页
        5.2.1 模糊限制语的统计分析第40-41页
        5.2.2 模糊限制信息范围的统计分析第41-43页
    5.3 本章小结第43-44页
结论第44-46页
参考文献第46-48页
致谢第48-49页

论文共49页,点击 下载论文
上一篇:人事考试试题库管理系统设计与实现
下一篇:江门市交通控制信息管理子系统的设计与实现