首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

综合字典和统计分析的中文分词系统的研究与实现

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-14页
   ·引言第8页
   ·中文分词发展现状及特点第8-13页
     ·中文分词技术的发展第9-12页
     ·中文分词系统的评价标准第12-13页
   ·论文的结构第13-14页
第2章 中文分词基本算法研究第14-27页
   ·中文分词的基本算法第14-23页
     ·机械分词算法第14-18页
     ·基于统计的分词算法第18-22页
     ·基于理解的分词算法第22页
     ·词性标注与角色标注第22-23页
   ·中文分词技术面临的问题第23-27页
     ·歧义词的处理第24-25页
     ·未登录词的处理第25-27页
第3章 基于字典与统计的分词算法的设计第27-39页
   ·本系统要解决的问题第27页
   ·系统特点概述第27-28页
     ·专用性第28页
     ·精确性第28页
     ·分词效率第28页
   ·分词词典的设计第28-31页
     ·基于哈希的分词词典机制第29-31页
       ·分词词典的整体构造第29页
       ·核心词典的详细设计第29-31页
       ·临时词典的详细设计第31页
   ·统计策略的设计第31-35页
     ·统计原理的选择与实现第32-34页
     ·训练文本的选择第34-35页
   ·机械分词的应用第35-36页
   ·歧义和未登录词问题的解决第36-39页
第4章 基于字典与统计的分词算法流程及系统设计第39-46页
   ·算法流程描述第39-40页
   ·算法具体设计第40-46页
     ·分词词典的加载第40-42页
       ·核心词典的加载第40-41页
       ·临时词典的加载第41-42页
     ·待分字符串的预处理第42-43页
     ·词频信息统计第43-44页
     ·逆向最大匹配第44-46页
第5章 实验结果分析第46-54页
   ·系统评价指标介绍第46页
   ·系统初始化后的性能测试第46-48页
     ·系统综合性能测试一第47页
     ·歧义和未登录词处理能力测试一第47-48页
   ·系统统计学习后的性能测试第48-51页
     ·系统综合性能测试二第49-50页
     ·歧义和未登录词处理能力测试二第50-51页
   ·分词算法的比较第51-52页
     ·机械分词算法的比较第51页
     ·统计策略的比较第51-52页
   ·分词系统测试实例展示第52-54页
第6章 系统的总结与展望第54-55页
   ·论文总结第54页
   ·中文分词系统的展望第54-55页
参考文献第55-57页
致谢第57-58页
攻读硕士学位期间发表的论文第58页

论文共58页,点击 下载论文
上一篇:数据库集成技术在内河航运信息系统中的应用研究
下一篇:土壤与地震对某自升式平台动力响应影响分析