首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--文献标引与编目论文

基于多层语料库的短语结构标注及计算研究

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第14-21页
    1.1 研究背景第14-15页
    1.2 研究意义第15-18页
    1.3 研究内容第18-19页
    1.4 创新之处第19-20页
    1.5 章节安排第20-21页
第2章 文献综述第21-31页
    2.1 组块研究与短语树库第21-25页
        2.1.1 转换生成语法及组块研究的出现第21-23页
        2.1.2 短语树库研究第23-25页
    2.2 现代句法理论及短语识别第25-29页
        2.2.1 现代句法理论第25-27页
        2.2.2 短语识别综述第27-29页
    2.3 术语短语研究综述第29-30页
    2.4 本章小结第30-31页
第3章 基于多层语料短语知识获取第31-49页
    3.1 语料基本情况第31-38页
        3.1.1 清华树库第31-33页
        3.1.2 宾州中文树库第33-35页
        3.1.3 清华树库与宾州中文树库异同第35-38页
    3.2 树库解析与存储第38-39页
        3.2.1 预处理第38-39页
        3.2.2 基本数据结构第39页
    3.3 汉语短语基本分布获取第39-42页
    3.4 汉语短语结构获取样例第42-46页
    3.5 小规模CSSCI语料辅助标注及解析第46-47页
    3.6 本章小结第47-49页
第4章 基于树库的汉语短语分布研究第49-77页
    4.1 树库内汉语短语分布第49-56页
        4.1.1 树库内汉语短语分布第49-52页
        4.1.2 树库内汉语基本短语分布第52-56页
    4.2 清华树库短语成分分析第56-66页
        4.2.1 清华树库基本短语成分统计第56-59页
        4.2.2 清华树库复杂短语成分统计第59-63页
        4.2.3 清华树库述宾结构统计分析第63-66页
    4.3 宾州树库短语成分分析第66-70页
    4.4 CSSCI标注语料分析第70-76页
        4.4.1 标注关键词短语分析第71-74页
        4.4.2 标注标题短语分析第74-76页
    4.5 本章小结第76-77页
第5章 基于机器学习的汉语短语识别第77-97页
    5.1 短语识别机器学习算法模型及模板第77-80页
        5.1.1 最大熵模型第77-78页
        5.1.2 条件随机场模型第78-79页
        5.1.3 自动识别流程第79-80页
    5.2 清华树库中汉语短语识别第80-92页
        5.2.1 训练样本选择及语言学特征统计第80-83页
        5.2.2 基于最大熵的汉语短语识别第83-87页
        5.2.3 基于条件随机场的汉语短语识别第87-92页
    5.3 宾州中文树库中汉语短语识别第92-95页
        5.3.1 训练样本选择及语言学特征统计第92-95页
        5.3.2 训练结果第95页
    5.4 本章小结第95-97页
第6章 面向CSSCI的汉语短语标注模型构建第97-119页
    6.1 模型理论基础第97-104页
        6.1.1 模型的语法理论基础第97-98页
        6.1.2 模型的算法理论基础第98-102页
        6.1.3 语料库基础第102-104页
    6.2 CSSCI语料预处理与基本统计第104-106页
    6.3 基于CSSCI短语词汇、词性统计及短语语法功能分析第106-113页
    6.4 基于CSSCI短语自动识别第113-118页
    6.5 本章小结第118-119页
第7章 结语第119-120页
    7.1 结语第119页
    7.2 未来工作第119-120页
参考文献第120-123页
附录第123-140页
致谢第140-141页

论文共141页,点击 下载论文
上一篇:漢語“其”研究
下一篇:秦職官考