首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉语逗号与冒号的自动分类识别研究

中文摘要第4-5页
Abstract第5-6页
第1章 绪论第10-17页
    1.1 研究背景和意义第10-12页
    1.2 研究现状第12-15页
        1.2.1 篇章分析发展第12-13页
        1.2.2 标点符号研究第13-15页
    1.3 研究内容第15-16页
    1.4 本文的组织结构第16-17页
第2章 相关知识介绍第17-23页
    2.1 文本表示模型第17-18页
    2.2 相关分类模型工具第18-21页
        2.2.1 最大熵分类器第18-20页
        2.2.2 条件随机场模型第20-21页
    2.3 常用性能评价标准第21-23页
第3章 基于分词与词性标注的汉语逗号分类第23-38页
    3.1 问题描述第23-24页
    3.2 逗号分类标准第24-28页
    3.3 逗号自动分类方法第28-32页
        3.3.1 分类工具及流程图第28页
        3.3.2 特征提取第28-32页
    3.4 实验结果与分析第32-37页
        3.4.1 实验数据第32页
        3.4.2 实验结果第32-35页
        3.4.3 错误分析第35-37页
    3.5 本章小结第37-38页
第4章 汉语冒号标注与自动识别方法研究第38-49页
    4.1 问题描述第38-39页
    4.2 语料标注与分析第39-43页
        4.2.1 语料介绍第39-40页
        4.2.2 标注体系第40-41页
        4.2.3 标注方法第41-42页
        4.2.4 语料统计第42页
        4.2.5 预处理第42-43页
    4.3 冒号自动识别方法第43-45页
        4.3.1 基于规则的冒号识别方法第44-45页
        4.3.2 基于上下文特征的最大熵分类方法第45页
    4.4 实验结果及分析第45-48页
        4.4.1 实验数据第45-46页
        4.4.2 实验结果第46-47页
        4.4.3 语料分析第47-48页
        4.4.4 错误分析第48页
    4.5 本章小结第48-49页
第5章 添加其他标点分类标签为特征的逗号分类第49-62页
    5.1 问题描述第49-52页
    5.2 冒号语料实验数据第52-53页
    5.3 添加冒号分类标签特征的实验结果及分析第53-56页
        5.3.1 冒号语料的实验结果第53-54页
        5.3.2 全体语料的实验结果第54-56页
        5.3.3 边界识别第56页
    5.4 分号语料的实验数据第56-57页
    5.5 添加分号分类标签特征的实验及分析第57-60页
        5.5.1 分号语料的实验结果第57-58页
        5.5.2 全体语料的实验结果第58-60页
    5.6 同时添加冒号与分号分类标签特征的实验第60-61页
    5.7 本章小结第61-62页
第6章 总结与展望第62-65页
    6.1 研究工作总结第62-63页
    6.2 下一步工作展望第63-65页
参考文献第65-70页
攻读学位期间公开发表的论文第70页
攻读学位期间参与的科研项目第70-71页
致谢第71-72页

论文共72页,点击 下载论文
上一篇:基于B/S架构的科技信息管理网络系统的实现
下一篇:基于多尺度变换的多聚焦图像融合算法研究