组合型中文分词方法的研究
摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
目录 | 第9-12页 |
CONTENTS | 第12-15页 |
第一章 绪论 | 第15-21页 |
·课题研究背景 | 第15-16页 |
·课题研究意义 | 第16-17页 |
·中文分词系统研究现状 | 第17-19页 |
·本文所做的工作 | 第19-20页 |
·本文组织结构 | 第20-21页 |
第二章 中文分词技术基础知识 | 第21-32页 |
·中文分词算法概述 | 第21-24页 |
·基于字符串匹配的分词算法 | 第21-23页 |
·基于理解的分词算法 | 第23-24页 |
·基于统计的分词算法 | 第24页 |
·典型的中文分词词典机制 | 第24-27页 |
·整词二分词典机制 | 第25页 |
·TRIE索引树词典机制 | 第25-26页 |
·逐字二分词典机制 | 第26-27页 |
·中文分词两大难点 | 第27-31页 |
·歧义的识别与消除 | 第27-30页 |
·未登录词的识别 | 第30-31页 |
·本章小结 | 第31-32页 |
第三章 组合型中文分词算法的改进 | 第32-46页 |
·本文需解决的问题 | 第32页 |
·本文采用的分词算法 | 第32-42页 |
·待切分文本的预处理 | 第33-34页 |
·分词词典的设计 | 第34-37页 |
·回溯正向最大匹配算法的改进 | 第37-42页 |
·歧义检测与处理策略 | 第42-44页 |
·交集型歧义的检测方法 | 第42-43页 |
·交集型歧义的消除策略 | 第43-44页 |
·未登录词识别策略 | 第44-45页 |
·未登录词识别的概率模型 | 第44页 |
·未登录词识别机制 | 第44-45页 |
·本章小结 | 第45-46页 |
第四章 组合型中文分词方法总体框架与详细设计流程 | 第46-54页 |
·组合型中文分词方法的总体框架 | 第46-47页 |
·组合型中文分词算法的详细设计流程 | 第47-53页 |
·词典的加载 | 第47-48页 |
·分词前的预处理 | 第48页 |
·改进的回溯正向最大匹配算法的详细设计流程 | 第48-50页 |
·交集型歧义检测与处理详细流程 | 第50-51页 |
·未登陆词的识别流程 | 第51-53页 |
·本章小结 | 第53-54页 |
第五章 实验结果 | 第54-63页 |
·系统评测标准 | 第54页 |
·实验数据 | 第54-60页 |
·系统整体数据 | 第55-57页 |
·交集型歧义消除数据 | 第57-59页 |
·未登录词识别数据 | 第59-60页 |
·改进算法与回溯正向最大匹配算法的比较 | 第60-61页 |
·本章小结 | 第61-63页 |
总结与展望 | 第63-65页 |
参考文献 | 第65-68页 |
攻读硕士学位期间发表的论文 | 第68-70页 |
致谢 | 第70页 |