中文分词关键技术研究
| 摘要 | 第1-4页 |
| Abstract | 第4-5页 |
| 目录 | 第5-7页 |
| 1 引言 | 第7-13页 |
| ·研究背景 | 第7-8页 |
| ·中文分词的发展概况及现状 | 第8-9页 |
| ·中文分词简介 | 第9-11页 |
| ·分词规范 | 第9-10页 |
| ·中文分词的难点 | 第10-11页 |
| ·本文的研究内容 | 第11-12页 |
| ·本文的结构安排 | 第12-13页 |
| 2 中文分词算法 | 第13-19页 |
| ·中文分词算法介绍 | 第13-16页 |
| ·基于字符串匹配的分词方法 | 第13-15页 |
| ·基于统计的分词方法 | 第15-16页 |
| ·基于知识理解的分词方法 | 第16页 |
| ·根据具体应用使用合适的分词算法 | 第16-18页 |
| ·中文分词的评测标准 | 第18页 |
| 本章小结 | 第18-19页 |
| 3 基于双字Hash索引的分词词典 | 第19-29页 |
| ·常用词典算法介绍 | 第19-23页 |
| ·基本概念 | 第19-20页 |
| ·几种词典结构 | 第20-23页 |
| ·双字Hash索引分词词典 | 第23-28页 |
| ·词典的实现原理 | 第23-26页 |
| ·词典的数据结构 | 第26-28页 |
| ·实验与分析 | 第28页 |
| 本章小结 | 第28-29页 |
| 4 歧义消除 | 第29-40页 |
| ·歧义介绍 | 第29页 |
| ·交叉型歧义的发现 | 第29-31页 |
| ·交叉型歧义消除 | 第31-39页 |
| ·基本概念 | 第31-35页 |
| ·双字耦合度和t-测试差相结合的方法 | 第35-38页 |
| ·实验与分析 | 第38-39页 |
| 本章小结 | 第39-40页 |
| 5 算法的实现与实验 | 第40-55页 |
| ·算法的实现 | 第40-50页 |
| ·原子切分 | 第40-41页 |
| ·候选词条 | 第41-42页 |
| ·最短路径算法 | 第42-50页 |
| ·实验和分析 | 第50-54页 |
| 本章小结 | 第54-55页 |
| 6 总结与展望 | 第55-56页 |
| ·本文总结 | 第55页 |
| ·未来工作 | 第55-56页 |
| 致谢 | 第56-57页 |
| 参考文献 | 第57-58页 |