中文聚类搜索引擎中主要技术的研究
| 提要 | 第1-5页 |
| 目录 | 第5-7页 |
| 第1章 绪论 | 第7-12页 |
| ·本文研究意义 | 第7页 |
| ·搜索引擎的基本介绍 | 第7-10页 |
| ·搜索引擎发展简要历程 | 第8-9页 |
| ·搜索引擎发展重要意义 | 第9-10页 |
| ·聚类搜索引擎的基本介绍 | 第10-11页 |
| ·聚类搜索引擎发展现状 | 第10-11页 |
| ·聚类搜索引擎功能介绍 | 第11页 |
| ·本文主要工作 | 第11-12页 |
| 第2章 聚类搜索引擎结构模式分析 | 第12-20页 |
| ·传统搜索引擎的结构模式 | 第12-17页 |
| ·基本概述 | 第12-13页 |
| ·工作流程 | 第13-14页 |
| ·关键技术 | 第14-17页 |
| ·技术指标 | 第17页 |
| ·聚类搜索引擎的结构模式 | 第17-20页 |
| ·基本概述 | 第17页 |
| ·主要应用 | 第17-18页 |
| ·基本流程 | 第18-19页 |
| ·存在局限 | 第19-20页 |
| 第3章 网页文本预处理——中文分词 | 第20-32页 |
| ·中文分词研究 | 第20-21页 |
| ·中文分词分类 | 第20-21页 |
| ·中文分词困难 | 第21页 |
| ·中文分词算法改进 | 第21-32页 |
| ·利用后缀数组提取重复短语 | 第22-27页 |
| ·结合后缀数组提取关键短语的中文分词 | 第27-32页 |
| 第4章 对搜索结果聚类——web文档聚类 | 第32-40页 |
| ·文本聚类研究 | 第32-34页 |
| ·文本聚类流程 | 第32-34页 |
| ·文本聚类方法 | 第34页 |
| ·应用文档聚类处理搜索结果 | 第34-40页 |
| ·对搜索结果聚类的特点和要求 | 第34-35页 |
| ·使用改进k-means算法对搜索结果进行聚类 | 第35-40页 |
| 第5章 系统算法的实现及实验结果 | 第40-45页 |
| ·中文分词模块的实验结果及分析 | 第40-42页 |
| ·聚类模块的实验结果及分析 | 第42-44页 |
| ·聚类搜索引擎的搜索结果 | 第44-45页 |
| 第6章 总结与展望 | 第45-47页 |
| ·全文总结 | 第45页 |
| ·未来的工作 | 第45-47页 |
| 参考文献 | 第47-49页 |
| 致谢 | 第49-50页 |
| 摘要 | 第50-53页 |
| Abstract | 第53-55页 |