中文词性标注的研究与实现

目录	第1-5页
摘要	第5-6页
Abstract	第6-7页
第1章前言	第7-13页
·研究背景	第7-8页
·研究动态	第8-9页
·主要研究内容	第9-11页
·制定适合基础教育搜索引擎的词性标注集	第9-10页
·兼类词的词性歧义排除	第10页
·数据稀疏问题解决	第10页
·未登录词的词性处理方法	第10-11页
·本文的主要研究成果	第11页
·本文的组织结构	第11-13页
第2章中文分词技术	第13-21页
·基本分词方法	第13-14页
·分词歧义处理	第14-17页
·分词歧义的类型	第14-15页
·基于统计的分词歧义解决方法	第15-17页
·交集型歧义排除测试结果	第17页
·未登录词的识别	第17-19页
·中文姓名识别策略	第18页
·高频未登录词识别策略	第18-19页
·中文分词系统总体性能测试	第19-21页
·测试指标	第19页
·测试数据	第19-21页
第3章基于统计的词性标注技术研究	第21-37页
·词的分类与词的兼类问题	第21-24页
·词的分类	第21页
·词性标注集	第21-23页
·汉语词的兼类问题	第23-24页
·统计语言模型	第24-28页
·N元语法模型	第24-26页
·马尔可夫模型	第26页
·隐马尔可夫模型概述	第26-27页
·隐马尔可夫模型在词性标注中的应用	第27-28页
·语料库数据统计	第28-30页
·基于HMM的词性标注基本算法	第30-31页
·Viterbi算法原理	第30页
·Viterbi算法实现细节	第30-31页
·数据稀疏问题的解决	第31-34页
·数据稀疏问题	第31-32页
·参数平滑算法	第32-34页
·数据平滑算法在词性标注中的应用	第34页
·未登录词的词性标注	第34-37页
·未登录词的词性标注策略	第35-36页
·实验结果及分析	第36-37页
第4章词性标注系统的设计与实现	第37-46页
·系统功能与整体架构	第37-38页
·系统功能描述	第37页
·系统整体架构与处理流程	第37-38页
·系统逻辑单元设计	第38-42页
·系统各模块及其功能	第38-39页
·系统逻辑单元设计	第39-42页
·词典、统计数据和词性标注集	第42-43页
·兼类词典和非兼类词典	第42页
·所需统计数据	第42页
·词性标注集	第42-43页
·系统实现	第43-44页
·系统的开发实现	第43页
·软件设计	第43-44页
·总体性能测试结果及分析	第44-46页
·词性标注性能影响因素	第44页
·测试结果	第44-45页
·测试数据分析	第45-46页
第5章结语	第46-48页
·本文总结	第46页
·下一步工作	第46-48页
参考文献	第48-50页
致谢	第50页