基于统计规则的中文分词研究
| 摘要 | 第1-4页 |
| Abstract | 第4-7页 |
| 第一章 绪论 | 第7-15页 |
| ·中文分词简介 | 第7-8页 |
| ·中文分词的研究现状 | 第8-13页 |
| ·中文分词的发展历史 | 第8-9页 |
| ·中文分词系统的评价指标 | 第9页 |
| ·中文分词的现有水平 | 第9-11页 |
| ·现有分词技术的缺点和不足 | 第11-13页 |
| ·中文分词的难点 | 第13-14页 |
| ·论文的结构 | 第14-15页 |
| 第二章 中文自动分词技术 | 第15-23页 |
| ·基于词典匹配的分词算法 | 第15-18页 |
| ·词典的结构 | 第15页 |
| ·正向最大匹配分词 | 第15-16页 |
| ·反向最大匹配分词 | 第16页 |
| ·全切分算法 | 第16-18页 |
| ·统计语言模型 | 第18-21页 |
| ·最大概率分词算法 | 第19-20页 |
| ·基于隐马尔科夫模型的分词算法 | 第20页 |
| ·其他统计语言模型 | 第20-21页 |
| ·基于规则的分词算法 | 第21-22页 |
| ·本章小结 | 第22-23页 |
| 第三章 基于统计规则的分词算法 | 第23-39页 |
| ·识别词语 | 第23-25页 |
| ·词典的结构 | 第23-25页 |
| ·双向最大匹配 | 第25页 |
| ·歧义处理 | 第25-30页 |
| ·歧义识别 | 第25-27页 |
| ·基于统计语言模型歧义消解 | 第27-30页 |
| ·引入规则 | 第30-32页 |
| ·伪歧义在分词系统的作用 | 第30-31页 |
| ·上下文信息对切词的影响 | 第31页 |
| ·分词反馈 | 第31-32页 |
| ·切分规则 | 第32-34页 |
| ·切分规则的定义 | 第32页 |
| ·切分规则的类型 | 第32-33页 |
| ·切分规则的可行性分析 | 第33-34页 |
| ·基于统计规则的分词算法 | 第34-37页 |
| ·从语料库中获取切分规则 | 第34-35页 |
| ·规则匹配与统计排歧模型结合 | 第35-36页 |
| ·规则冲突解决方法 | 第36-37页 |
| ·本章小结 | 第37-39页 |
| 第四章 中文分词系统的设计与实现 | 第39-53页 |
| ·系统主要模块的设计与实现 | 第39-48页 |
| ·词典的结构 | 第39-42页 |
| ·分词器 | 第42-45页 |
| ·分词评价器 | 第45-47页 |
| ·程序界面 | 第47-48页 |
| ·程序运行与分析 | 第48-52页 |
| ·分词运行实例 | 第48-50页 |
| ·分词评测 | 第50-52页 |
| ·与ICTCLAS对比 | 第52页 |
| ·本章小结 | 第52-53页 |
| 第五章 研究总结与展望 | 第53-55页 |
| ·研究总结 | 第53页 |
| ·研究局限与展望 | 第53-55页 |
| 致谢 | 第55-57页 |
| 参考文献 | 第57-61页 |
| 读研期间研究成果 | 第61-62页 |