首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文自动分词及人名识别技术研究

摘要第1-6页
Abstract第6-7页
致谢第7-10页
插图清单第10-11页
表格清单第11-12页
第一章 绪论第12-15页
   ·自然语言理解的研究意义第12-13页
   ·自然语言处理的研究领域第13页
   ·本文的主要工作及组织结构第13-15页
     ·本文的主要工作第13页
     ·本文的组织结构第13-15页
第二章 中文自动分词的理论基础第15-23页
   ·中文分词的引入第15页
   ·词的概念第15页
   ·切分标准第15-16页
   ·三种主要分词方法第16-19页
     ·基于词典的分词第16页
     ·基于统计的分词第16-17页
     ·基于理解的分词第17-18页
     ·三种分词方法的比较第18-19页
   ·中文分词面临的问题第19-21页
     ·分词的歧义处理第19页
     ·分词的未登录词识别第19-21页
   ·中文分词测评指标第21页
   ·已经实现的几个中文分词系统第21-22页
   ·本章小结第22-23页
第三章 基于动态四字双向词典的中文分词第23-33页
   ·已有的分词词典第23-24页
     ·基于整词二分的分词词典机制第23页
     ·基于 TRIE 索引树的分词词典机制第23页
     ·基于逐字二分的分词词典机制第23页
     ·基于双字哈希机制的词典第23-24页
   ·问题分析第24-25页
     ·查询效率方面第24页
     ·词典结构方面第24页
     ·词典实用性方面第24-25页
   ·Memcached 概述第25页
   ·词典的结构设计第25-27页
     ·原始词典第25页
     ·存储于数据库的四字词典第25-27页
     ·Memcached 四字词典第27页
   ·临时词的动态载入第27-29页
   ·依据四字词典设计的最大匹配算法第29-30页
   ·实验分析第30-31页
     ·词汇平均查询次数第30页
     ·理论分析第30-31页
     ·实验结果第31页
   ·本章小结第31-33页
第四章 基于知网的贝叶斯中文人名识别第33-42页
   ·朴素贝叶斯分类器(Naive Bayesian Classifier)第33-34页
   ·标注语料库第34页
   ·知网(HowNet)第34-35页
   ·基于知网的贝叶斯中文人名识别模型第35-39页
     ·假设条件第35页
     ·贝叶斯人名识别模型第35-36页
     ·知网语义修正模型第36-39页
   ·基于知网的贝叶斯中文人名识别算法第39-40页
   ·实验结果分析第40-41页
     ·参数设置第40页
     ·理论分析第40页
     ·实验评价指标第40-41页
     ·实验结果第41页
   ·本章小结第41-42页
第五章 结束语第42-44页
   ·总结第42页
   ·展望第42-44页
     ·动态四字双向词典方面第42页
     ·中文人名识别方面第42-44页
参考文献第44-48页
附录 1 中文自动分词系统第48-55页
附录 2 攻读硕士学位期间参加研究的课题和发表的论文第55-56页

论文共56页,点击 下载论文
上一篇:视频水印技术在移动警务系统中的应用研究
下一篇:基于特征强化的中文产品评价挖掘研究