首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计学习的中文分词改进及其在面向应用分词中的应用

摘要第3-4页
Abstract第4页
目录第5-8页
图目录第8-9页
表目录第9-10页
第1章 绪论第10-16页
    1.1 自然语言理解概述第10-11页
    1.2 研究的背景和意义第11-14页
    1.3 本文研究工作概述第14-15页
    1.4 本文组织结构第15页
    1.5 本章小结第15-16页
第2章 中文分词技术概述第16-27页
    2.1 中文分词中的问题第16-18页
        2.1.1 分词规范第16-17页
        2.1.2 歧义消解第17-18页
        2.1.3 未登录词识别第18页
    2.2 现有的中文分词技术第18-26页
        2.2.1 基于字符串匹配的分词技术第18-20页
        2.2.2 基于理解的分词技术第20-21页
        2.2.3 基于统计的分词技术第21-24页
        2.2.4 基于字标注的分词技术第24-26页
    2.3 本章小结第26-27页
第3章 基于统计的中文分词算法设计与实现第27-46页
    3.1 关联度描述第27-35页
        3.1.1 逐点互信息第28-30页
        3.1.2 信息熵第30-31页
        3.1.3 对数似然比第31-34页
        3.1.4 统一的关联度量第34-35页
    3.2 t-测试第35页
    3.3 三元语言模型第35-38页
        3.3.1 三元语法信息的挖掘第36-37页
        3.3.2 基于三元语法的分词第37-38页
        3.3.3 歧义消解第38页
    3.4 系统实现第38-42页
        3.4.1 预处理第38页
        3.4.2 基本统计量的提取第38页
        3.4.3 计算统计特征值第38-42页
        3.4.4 参数训练第42页
        3.4.5 分词第42页
    3.5 实验及结果分析第42-44页
        3.5.1 实验数据说明第42页
        3.5.2 分词结果的评测标准第42页
        3.5.3 分词结果分析第42-44页
    3.6 本章小结第44-46页
第4章 基于统计学习的面向应用分词器第46-60页
    4.1 术语定义第46-47页
    4.2 基于统计学习的未登录词识别第47-50页
        4.2.1 未登录词的内容与特征第47-48页
        4.2.2 统计量的选择第48-49页
        4.2.3 系统架构第49-50页
    4.3 基于统计学习的分词标准适配第50-55页
        4.3.1 面向应用的分词第50-51页
        4.3.2 已有的研究第51-53页
        4.3.3 统计量的选取第53-54页
        4.3.4 系统架构第54-55页
    4.4 系统实现第55页
    4.5 实验及结果分析第55-59页
        4.5.1 实验数据说明第55页
        4.5.2 分词结果的评测标准第55-57页
        4.5.3 分词结果分析第57-59页
    4.6 本章小结第59-60页
第5章 总结与展望第60-62页
    5.1 总结第60页
    5.2 未来工作展望第60-62页
参考文献第62-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:嗜冷微生物对Cu2+胁迫的应答及其代谢组学研究
下一篇:植物生长调节剂在欧美杂交种葡萄无核大粒化栽培中的应用