中文自动分词法在全文检索中的研究及应用
摘要 | 第1-5页 |
ABSTRACT | 第5-11页 |
第一章 绪论 | 第11-19页 |
·引言 | 第11-12页 |
·研究意义 | 第12-13页 |
·全文检索概述 | 第13-14页 |
·中文自动分词研究背景及研究现状 | 第14-17页 |
·研究背景 | 第14-15页 |
·研究现状 | 第15-17页 |
·论文研究内容及结构安排 | 第17-19页 |
第二章 中文自动分词算法研究与改进 | 第19-35页 |
·传统的自动分词系统 | 第19-20页 |
·自动分词理论模型 | 第19-20页 |
·传统的自动分词系统 | 第20页 |
·自动分词算法研究 | 第20-24页 |
·机械分词法 | 第21-24页 |
·非机械分词法 | 第24页 |
·传统分词法的局限 | 第24-25页 |
·分词词典设计及分词算法改进 | 第25-33页 |
·分词词典设计 | 第25-30页 |
·分词预处理 | 第30页 |
·改进的分词算法 | 第30-33页 |
·自动分词系统框架设计 | 第33-35页 |
第三章 歧义字段识别 | 第35-46页 |
·歧义字段基本概念 | 第35-38页 |
·歧义字段产生根源 | 第35-36页 |
·歧义字段类型 | 第36-38页 |
·交集型歧义字段识别与处理 | 第38-44页 |
·交集型歧义字段统计分析 | 第38-39页 |
·交集型歧义字段识别方法改进 | 第39-42页 |
·传统识别方法 | 第39-41页 |
·本文采用的歧义识别算法 | 第41-42页 |
·交集型歧义字段处理 | 第42-44页 |
·组合型歧义字段识别与处理 | 第44-46页 |
第四章 未登录词识别 | 第46-62页 |
·未登录词识别意义 | 第46-47页 |
·中文人名识别 | 第47-50页 |
·中文人名特点 | 第47-48页 |
·中文人名识别方法 | 第48-50页 |
·中文机构名识别 | 第50-53页 |
·中文机构名特点 | 第50-51页 |
·中文机构名识别方法 | 第51-53页 |
·中文地名识别 | 第53-62页 |
·中文地名特点 | 第53-54页 |
·中文地名识别方法 | 第54-62页 |
·传统地名识别方法 | 第54页 |
·互信息概念引入 | 第54-56页 |
·一种新的基于互信息的地名识别方法 | 第56-62页 |
第五章 中文自动分词系统实现 | 第62-82页 |
·系统介绍 | 第62-65页 |
·项目背景与需求分析 | 第62-64页 |
·系统功能模块设计 | 第64-65页 |
·分词系统实现 | 第65-76页 |
·分词流程 | 第65-66页 |
·分词算法实现 | 第66-76页 |
·分词实例 | 第76-79页 |
·分词结果分析 | 第79-82页 |
第六章 总结与展望 | 第82-84页 |
·总结 | 第82-83页 |
·展望 | 第83-84页 |
参考文献 | 第84-89页 |
致谢 | 第89-90页 |
攻读硕士学位期间发表的论文 | 第90页 |