一个改进的中文分词算法及其在Lucene中的应用
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1 绪论 | 第9-15页 |
| ·课题背景 | 第9页 |
| ·课题的研究目的及意义 | 第9-11页 |
| ·国内外发展状况分析 | 第11-14页 |
| ·本文的主要研究内容 | 第14-15页 |
| 2 中文分词算法的理论基础 | 第15-22页 |
| ·中文分词的主要算法 | 第15-18页 |
| ·中文分词的主要困难 | 第18-21页 |
| ·本章小结 | 第21-22页 |
| 3 改进的基于字符串的分词算法 | 第22-44页 |
| ·问题的提出 | 第22页 |
| ·分词算法设计 | 第22-43页 |
| ·算法分析 | 第43页 |
| ·本章小结 | 第43-44页 |
| 4 改进的分词算法在Lucene 中的应用 | 第44-56页 |
| ·Lucene 简介 | 第44页 |
| ·Lucene 的应用 | 第44页 |
| ·Lucene 的工作机制 | 第44-46页 |
| ·Lucene 的分析器及实现 | 第46-48页 |
| ·改进的分词算法在Lucene 中的应用 | 第48-50页 |
| ·使用Lucene 建立索引 | 第50-51页 |
| ·应用于Lucene 的改进分词算法实验及分析 | 第51-53页 |
| ·改进的分词算法与Lucene 自带分词算法比较 | 第53-54页 |
| ·本章小结 | 第54-56页 |
| 5 总结和展望 | 第56-58页 |
| ·全文总结 | 第56页 |
| ·研究展望 | 第56-58页 |
| 致谢 | 第58-59页 |
| 参考文献 | 第59-62页 |