中文自动分词法在全文检索中的研究及应用
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-11页 |
| 第一章 绪论 | 第11-19页 |
| ·引言 | 第11-12页 |
| ·研究意义 | 第12-13页 |
| ·全文检索概述 | 第13-14页 |
| ·中文自动分词研究背景及研究现状 | 第14-17页 |
| ·研究背景 | 第14-15页 |
| ·研究现状 | 第15-17页 |
| ·论文研究内容及结构安排 | 第17-19页 |
| 第二章 中文自动分词算法研究与改进 | 第19-35页 |
| ·传统的自动分词系统 | 第19-20页 |
| ·自动分词理论模型 | 第19-20页 |
| ·传统的自动分词系统 | 第20页 |
| ·自动分词算法研究 | 第20-24页 |
| ·机械分词法 | 第21-24页 |
| ·非机械分词法 | 第24页 |
| ·传统分词法的局限 | 第24-25页 |
| ·分词词典设计及分词算法改进 | 第25-33页 |
| ·分词词典设计 | 第25-30页 |
| ·分词预处理 | 第30页 |
| ·改进的分词算法 | 第30-33页 |
| ·自动分词系统框架设计 | 第33-35页 |
| 第三章 歧义字段识别 | 第35-46页 |
| ·歧义字段基本概念 | 第35-38页 |
| ·歧义字段产生根源 | 第35-36页 |
| ·歧义字段类型 | 第36-38页 |
| ·交集型歧义字段识别与处理 | 第38-44页 |
| ·交集型歧义字段统计分析 | 第38-39页 |
| ·交集型歧义字段识别方法改进 | 第39-42页 |
| ·传统识别方法 | 第39-41页 |
| ·本文采用的歧义识别算法 | 第41-42页 |
| ·交集型歧义字段处理 | 第42-44页 |
| ·组合型歧义字段识别与处理 | 第44-46页 |
| 第四章 未登录词识别 | 第46-62页 |
| ·未登录词识别意义 | 第46-47页 |
| ·中文人名识别 | 第47-50页 |
| ·中文人名特点 | 第47-48页 |
| ·中文人名识别方法 | 第48-50页 |
| ·中文机构名识别 | 第50-53页 |
| ·中文机构名特点 | 第50-51页 |
| ·中文机构名识别方法 | 第51-53页 |
| ·中文地名识别 | 第53-62页 |
| ·中文地名特点 | 第53-54页 |
| ·中文地名识别方法 | 第54-62页 |
| ·传统地名识别方法 | 第54页 |
| ·互信息概念引入 | 第54-56页 |
| ·一种新的基于互信息的地名识别方法 | 第56-62页 |
| 第五章 中文自动分词系统实现 | 第62-82页 |
| ·系统介绍 | 第62-65页 |
| ·项目背景与需求分析 | 第62-64页 |
| ·系统功能模块设计 | 第64-65页 |
| ·分词系统实现 | 第65-76页 |
| ·分词流程 | 第65-66页 |
| ·分词算法实现 | 第66-76页 |
| ·分词实例 | 第76-79页 |
| ·分词结果分析 | 第79-82页 |
| 第六章 总结与展望 | 第82-84页 |
| ·总结 | 第82-83页 |
| ·展望 | 第83-84页 |
| 参考文献 | 第84-89页 |
| 致谢 | 第89-90页 |
| 攻读硕士学位期间发表的论文 | 第90页 |