首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文词性标注的研究与实现

目录第1-5页
摘要第5-6页
Abstract第6-7页
第1章 前言第7-13页
   ·研究背景第7-8页
   ·研究动态第8-9页
   ·主要研究内容第9-11页
     ·制定适合基础教育搜索引擎的词性标注集第9-10页
     ·兼类词的词性歧义排除第10页
     ·数据稀疏问题解决第10页
     ·未登录词的词性处理方法第10-11页
   ·本文的主要研究成果第11页
   ·本文的组织结构第11-13页
第2章 中文分词技术第13-21页
   ·基本分词方法第13-14页
   ·分词歧义处理第14-17页
     ·分词歧义的类型第14-15页
     ·基于统计的分词歧义解决方法第15-17页
     ·交集型歧义排除测试结果第17页
   ·未登录词的识别第17-19页
     ·中文姓名识别策略第18页
     ·高频未登录词识别策略第18-19页
   ·中文分词系统总体性能测试第19-21页
     ·测试指标第19页
     ·测试数据第19-21页
第3章 基于统计的词性标注技术研究第21-37页
   ·词的分类与词的兼类问题第21-24页
     ·词的分类第21页
     ·词性标注集第21-23页
     ·汉语词的兼类问题第23-24页
   ·统计语言模型第24-28页
     ·N元语法模型第24-26页
     ·马尔可夫模型第26页
     ·隐马尔可夫模型概述第26-27页
     ·隐马尔可夫模型在词性标注中的应用第27-28页
   ·语料库数据统计第28-30页
   ·基于HMM的词性标注基本算法第30-31页
     ·Viterbi算法原理第30页
     ·Viterbi算法实现细节第30-31页
   ·数据稀疏问题的解决第31-34页
     ·数据稀疏问题第31-32页
     ·参数平滑算法第32-34页
     ·数据平滑算法在词性标注中的应用第34页
   ·未登录词的词性标注第34-37页
     ·未登录词的词性标注策略第35-36页
     ·实验结果及分析第36-37页
第4章 词性标注系统的设计与实现第37-46页
   ·系统功能与整体架构第37-38页
     ·系统功能描述第37页
     ·系统整体架构与处理流程第37-38页
   ·系统逻辑单元设计第38-42页
     ·系统各模块及其功能第38-39页
     ·系统逻辑单元设计第39-42页
   ·词典、统计数据和词性标注集第42-43页
     ·兼类词典和非兼类词典第42页
     ·所需统计数据第42页
     ·词性标注集第42-43页
   ·系统实现第43-44页
     ·系统的开发实现第43页
     ·软件设计第43-44页
   ·总体性能测试结果及分析第44-46页
     ·词性标注性能影响因素第44页
     ·测试结果第44-45页
     ·测试数据分析第45-46页
第5章 结语第46-48页
   ·本文总结第46页
   ·下一步工作第46-48页
参考文献第48-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:阿魏酸单甘油酯的合成及功能性研究
下一篇:《啊,拓荒者!》的生态女性主义研究