摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
1 引言 | 第8-12页 |
·分词简介 | 第8-9页 |
·中英文混合分词 | 第9页 |
·分词的研究现状 | 第9-11页 |
·本文主要的工作及安排 | 第11-12页 |
2 分词相关理论和技术 | 第12-25页 |
·分词的基本流程 | 第12页 |
·分词的算法 | 第12-15页 |
·基于字符串匹配的分词算法 | 第12-13页 |
·基于统计的分词算法 | 第13-14页 |
·基于规则的分词算法 | 第14-15页 |
·基于理解的分词算法 | 第15页 |
·分词的关键问题及解决方法 | 第15-22页 |
·歧义处理 | 第15-19页 |
·未登录词识别 | 第19-21页 |
·分词词典 | 第21-22页 |
·分词系统的评价 | 第22-24页 |
·中文分词系统的评价指标 | 第22-23页 |
·中英文混合分词系统的评价指标 | 第23-24页 |
·本章小结 | 第24-25页 |
3 词典机制及分词算法的实现及选择 | 第25-48页 |
·词典机制的实现及选择 | 第25-36页 |
·基于整词二分的词典机制 | 第26-28页 |
·基于TRIE 索引树的词典机制 | 第28-30页 |
·基于逐字二分的词典机制 | 第30-31页 |
·双字哈希索引词典机制 | 第31-34页 |
·词典机制的实验与分析 | 第34-36页 |
·词典机制的选择 | 第36页 |
·分词算法的实现 | 第36-39页 |
·单字切分算法 | 第36-37页 |
·双字切分算法 | 第37-38页 |
·正向最大匹配算法 | 第38-39页 |
·逆向最大匹配算法 | 第39页 |
·算法测试、评价及分析 | 第39-47页 |
·测试样例1 | 第39-43页 |
·测试样例2 | 第43-45页 |
·测试样例3 | 第45-47页 |
·中英文混合分词模型设计方案的选择 | 第47页 |
·本章小结 | 第47-48页 |
4 基于字符串匹配的中英文混合分词模型CE_MixSeg | 第48-80页 |
·模型基本结构 | 第48-49页 |
·文件处理模块 | 第49-51页 |
·词典模块 | 第51-55页 |
·索引数据库模块 | 第55-56页 |
·分词模块 | 第56-78页 |
·中英文混合分词策略 | 第57-58页 |
·改进的逆向最大匹配算法 | 第58-61页 |
·歧义处理及实验 | 第61-68页 |
·中文姓名的识别及实验 | 第68-78页 |
·综合实验及模型评价 | 第78-79页 |
·本章小结 | 第79-80页 |
5 总结 | 第80-82页 |
·全文总结 | 第80页 |
·后续研究工作 | 第80-82页 |
致谢 | 第82-83页 |
参考文献 | 第83-85页 |