中文分词算法的研究与实现
摘要 | 第1-6页 |
Abstract | 第6-8页 |
缩略语表 | 第8-12页 |
第一章 绪论 | 第12-19页 |
·中文分词产生的背景与研究意义 | 第12页 |
·中文分词发展历史和现状 | 第12-17页 |
·中文分词技术的发展 | 第13-14页 |
·中文分词系统的发展 | 第14-16页 |
·中文分词应用上的发展 | 第16-17页 |
·论文的主要工作与创新点 | 第17页 |
·论文的章节安排 | 第17-19页 |
第二章 理论基础知识介绍 | 第19-25页 |
·中文分词概念 | 第19页 |
·中文分词衡量的指标 | 第19-20页 |
·准确性 | 第19-20页 |
·高效性 | 第20页 |
·通用性 | 第20页 |
·适用性 | 第20页 |
·中文分词难点介绍 | 第20-22页 |
·语言学方面的困难 | 第21页 |
·计算机方面的困难 | 第21-22页 |
·中文分词算法 | 第22-24页 |
·基于字符串的分词法 | 第23页 |
·基于理解的分词法 | 第23-24页 |
·基于统计的分词法 | 第24页 |
·本章小结 | 第24-25页 |
第三章 中文分词技术的核心算法研究与改进 | 第25-42页 |
·现有的歧义识别与消解的方法 | 第25-28页 |
·歧义识别 | 第25-26页 |
·歧义消解 | 第26-28页 |
·歧义识别与消解的改进 | 第28-35页 |
·歧义识别上的改进 | 第29-31页 |
·歧义消解上的改进 | 第31-35页 |
·现有的未登录词识别算法 | 第35-36页 |
·专名未登录词 | 第35-36页 |
·一揽子解决方案 | 第36页 |
·未登录词识别算法的改进 | 第36-40页 |
·基于Bi-gram 和HMM 的算法 | 第37-38页 |
·基于Google 关键字工具的算法 | 第38-40页 |
·本章小结 | 第40-42页 |
第四章 中文分词系统的设计 | 第42-57页 |
·中文分词系统概述 | 第42-43页 |
·分词词典的设计 | 第43-45页 |
·现有词典机制的比较 | 第43-44页 |
·词典机制的改进 | 第44-45页 |
·字符串过滤的设计 | 第45-48页 |
·设计目标 | 第45-46页 |
·标点符号过滤算法流程 | 第46-47页 |
·英文字符过滤算法流程 | 第47-48页 |
·匹配算法的设计 | 第48-56页 |
·正向最大匹配算法 | 第48-52页 |
·反向最大匹配算法 | 第52-56页 |
·本章小结 | 第56-57页 |
第五章 实验结果与分析 | 第57-65页 |
·实验数据与分析 | 第57-62页 |
·总体数据 | 第57-58页 |
·歧义切分 | 第58-61页 |
·未登录词识别 | 第61-62页 |
·分词系统比较 | 第62-63页 |
·本章小结 | 第63-65页 |
第六章 总结与展望 | 第65-67页 |
致谢 | 第67-68页 |
参考文献 | 第68-72页 |
作者攻硕期间取得的成果 | 第72-73页 |