基于双数组的分词词典研究与实现
摘要 | 第1-4页 |
Abstract | 第4-7页 |
1 绪论 | 第7-10页 |
1.1 分词词典构造的研究意义 | 第7-8页 |
1.2 分词词典的常用构造方法 | 第8-9页 |
1.3 本文的主要工作 | 第9-10页 |
2 常用分词词典机制 | 第10-31页 |
2.1 常用的三种分词词典机制 | 第10-15页 |
2.2 三种分词词典机制的实验结果 | 第15-16页 |
2.3 基于TRIE结构的PAT树 | 第16-27页 |
2.3.1 TRIE的概念及结构 | 第16-19页 |
2.3.2 PAT树的数据结构 | 第19-20页 |
2.3.3 PAT树的查询及性能分析 | 第20-24页 |
2.3.4 PAT树的改进方案 | 第24-27页 |
2.4 双字哈希的词典机制 | 第27-31页 |
3 双数组(Double-Array)词典的实现 | 第31-42页 |
3.1 双数组的性能特点 | 第31页 |
3.2 双数组的基本思想 | 第31-32页 |
3.3 双数组词典的数据结构 | 第32-36页 |
3.3.1 实现方法步骤 | 第33-36页 |
3.3.2 生成过程中冲突的解决方法 | 第36页 |
3.4 双数组的性能分析 | 第36-38页 |
3.4.1 双数组查询性能分析 | 第36-37页 |
3.4.2 双数组删除性能分析 | 第37页 |
3.4.3 双数组更新性能分析 | 第37-38页 |
3.5 双数组的性能比较实验 | 第38-40页 |
3.5.1 空间效率 | 第38-39页 |
3.5.2 时间效率 | 第39-40页 |
3.6 存在问题及讨论 | 第40-42页 |
4 基于双数组结构的词典实现 | 第42-53页 |
4.1 词典词条的一般组织结构 | 第42-43页 |
4.2 双数组词典的内部文件构成 | 第43-46页 |
4.3 词典的讨论 | 第46-47页 |
4.4 词典算法的应用 | 第47-53页 |
结论 | 第53-54页 |
参考文献 | 第54-56页 |
附录A 双数组代码 | 第56-59页 |
攻读硕士学位期间发表学术论文情况 | 第59-60页 |
致谢 | 第60-61页 |
大连理工大学学位论文版权使用授权书 | 第61页 |