大型企业非结构化数据检索系统设计与实现
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-13页 |
| ·论文研究背景与意义 | 第8-9页 |
| ·研究现状与发展趋势 | 第9-11页 |
| ·本文的主要工作 | 第11页 |
| ·论文结构 | 第11-13页 |
| 2 相关技术研究 | 第13-18页 |
| ·全文检索基本原理 | 第13-14页 |
| ·全文检索架构Lucene | 第14-15页 |
| ·中文分词 | 第15-18页 |
| ·中文分词原理 | 第15-16页 |
| ·中文分词常用算法 | 第16-18页 |
| 3 主题词的提取 | 第18-26页 |
| ·分词处理 | 第18-22页 |
| ·分词结果过滤 | 第22-23页 |
| ·结果优化处理 | 第23-26页 |
| ·自动优化 | 第23页 |
| ·手动优化 | 第23-26页 |
| 4 全文检索系统的设计与实现 | 第26-46页 |
| ·系统实现目标 | 第26页 |
| ·非功能性需求 | 第26-27页 |
| ·系统概要设计 | 第27-30页 |
| ·系统详细设计 | 第30-37页 |
| ·创建索引 | 第31-35页 |
| ·查询索引 | 第35-37页 |
| ·全文检索流程 | 第37-43页 |
| ·非结构化数据处理 | 第37-39页 |
| ·输入预处理 | 第39-40页 |
| ·主题词提取 | 第40-41页 |
| ·结合Lucene进行检索 | 第41-43页 |
| ·系统实现 | 第43-46页 |
| ·分词算法的实现 | 第43-45页 |
| ·系统界面的实现 | 第45-46页 |
| 5 系统测试 | 第46-51页 |
| ·分词器的测试 | 第46-48页 |
| ·系统的测试及性能分析 | 第48-51页 |
| 结论 | 第51-54页 |
| 附录A 创建索引的核心代码 | 第54-58页 |
| 参考文献 | 第58-60页 |
| 攻读硕士学位期间发表学术论文情况 | 第60-61页 |
| 致谢 | 第61-62页 |