首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

词典与统计相结合的中文分词的研究

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 绪论第9-12页
     ·中文分词的必要性第9-10页
     ·几个已经实现的分词系统第10-11页
     ·本文的组织结构第11-12页
第二章 中文分词技术的理论基础第12-26页
     ·中文分词要解决的主要问题第12-16页
       ·分词规范的问题第12页
       ·分词歧义的处理问题第12-14页
       ·未登录词的识别问题第14-16页
       ·分词和理解的先后问题第16页
     ·目前主要的分词方法第16-24页
       ·基于统计的分词方法第16-18页
       ·基于词典的分词方法第18-20页
       ·机械分词词典的构造第20-23页
       ·基于理解的分词方法第23-24页
       ·几种分词方法的比较第24页
     ·对分词系统性能的评价指标第24-26页
第三章 基于统计和词典的中文分词算法的设计第26-38页
     ·基于统计方法的未登录词识别第26-27页
     ·词典的结构第27-30页
       ·Hash词典第27-29页
       ·其它词典第29-30页
     ·文本中的数量词识别规则第30-33页
       ·数词第30-31页
       ·量词第31页
       ·复合数量词第31-32页
       ·数量词的出现特征第32页
       ·数量词的识别算法第32-33页
     ·改进的正向最大匹配分词方法第33-38页
       ·长词优先的正向最大匹配方法第33-35页
       ·改进的正向最大退一字匹配法第35-38页
第四章 分词后的命名实体识别部分第38-46页
     ·人名识别第38-41页
       ·中文人名识别面临的主要困难第39页
       ·姓氏分析第39页
       ·人名上下文信息第39-40页
       ·潜在姓名的抽取第40-41页
     ·地名识别第41-42页
       ·中文地名识别的特点第41页
       ·利用特征词识别中文地名第41-42页
     ·机构名识别第42-45页
       ·机构名称的语法性质第42-43页
       ·机构名称的语义特性第43-44页
       ·机构名的组织规律第44-45页
     ·命名实体识别的效果第45-46页
第五章 实验分析第46-54页
     ·系统的整体结构第46-47页
     ·实验过程第47-52页
     ·实验结果分析第52-53页
     ·综合实验分析第53-54页
第六章 总结与展望第54-55页
     ·全文总结第54页
     ·未来工作展望第54-55页
参考文献第55-58页
致谢第58-59页
攻读硕士研究生期间所发表的论文第59页

论文共59页,点击 下载论文
上一篇:自装卸式垃圾运输车举升机构的仿真与优化设计
下一篇:基于CORBA的电子银行安全的理论模型及实现