首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

利用部分标注数据提高中文分词准确率的研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-13页
    1.1 课题来源及研究目的和意义第8页
    1.2 中文分词技术及其相关理论的发展概况第8-12页
        1.2.1 中文分词研究现状第9-11页
        1.2.2 利用自然标注提高中文分词性能的研究第11页
        1.2.3 中文分词的领域适应问题第11-12页
    1.3 本文研究内容第12-13页
第2章 融合部分标注的统计中文分词模型第13-34页
    2.1 中文分词任务的建模第13-15页
        2.1.1 基于字的中文分词第13-14页
        2.1.2 基于词的中文分词第14-15页
    2.2 基于字的感知器中文分词模型第15-19页
        2.2.1 感知器与结构化感知器第15-17页
        2.2.2 部分标注数据与结构化感知机融合第17-19页
    2.3 基于词的感知器中文分词模型第19-24页
        2.3.1 基于词的结构化感知器第19-22页
        2.3.2 可以利用部分标注数据的非精确解码第22-23页
        2.3.3 非精确解码面临的问题第23-24页
    2.4 基于字的条件随机场的中文分词模型第24-28页
        2.4.1 条件随机场模型第24-26页
        2.4.2 利用部分标注的条件随机场第26-28页
    2.5 利用部分标注数据的三种模型的比较实验第28-33页
        2.5.1 实验设置第28-31页
        2.5.2 实验结果及分析第31-33页
        2.5.3 实验结论第33页
    2.6 本章小结第33-34页
第3章 使用词典与未标注语料构造部分标注数据第34-41页
    3.1 使用词典与未标注数据构造部分标注数据第34-35页
    3.2 词典实验第35-40页
        3.2.1 实验设置第36-38页
        3.2.2 未标注数据规模实验第38页
        3.2.3 词典匹配性能实验第38-39页
        3.2.4 实验结果与分析第39-40页
        3.2.5 实验结论第40页
    3.3 本章小结第40-41页
第4章 使用自然标注构造部分标注数据第41-47页
    4.1 使用自然标注构造部分标注数据第41-43页
        4.1.1 利用自然标注的潜在问题第41-42页
        4.1.2 使用选择领域选择获得更优的数据第42-43页
    4.2 自然标注数据实验第43-46页
        4.2.1 实验设置第43-44页
        4.2.2 数据选择的作用第44页
        4.2.3 实验结果第44-45页
        4.2.4 分析第45-46页
        4.2.5 数据混合第46页
    4.3 本章小结第46-47页
结论第47-48页
参考文献第48-55页
攻读学位期间发表的学术论文第55-57页
致谢第57-58页

论文共58页,点击 下载论文
上一篇:基于重要度与紧密度的搜索串核心词提取系统
下一篇:多视图实体聚类及标签抽取技术研究