应用Web数据挖掘的主题元搜索引擎设计与实现
摘要 | 第1-4页 |
Abstract | 第4-12页 |
第1章 概述 | 第12-22页 |
·搜索引擎日益重要 | 第12-14页 |
·搜索引擎面临挑战 | 第14-17页 |
·元搜索引擎提高查全率 | 第17-19页 |
·主题搜索引擎提高查准率 | 第19-21页 |
·论文组织 | 第21-22页 |
第2章 相关技术综述 | 第22-33页 |
·搜索引擎发展历史 | 第22-23页 |
·搜索引擎相关技术 | 第23-26页 |
·从数据挖掘到Web挖掘 | 第26-28页 |
·主题搜索引擎与元搜索引擎 | 第28-30页 |
·开源搜索引擎及相关软件包 | 第30-32页 |
·本章小结 | 第32-33页 |
第3章 主题元搜索引擎设计 | 第33-47页 |
·Nutch 开源搜索引擎简介 | 第33-35页 |
·Nutch 搜索引擎的架构和扩展方法 | 第35-38页 |
·结合主题搜索引擎与元搜索引擎 | 第38-40页 |
·基于Nutch0.9 设计主题元搜索引擎 | 第40-43页 |
·主题元搜索引擎架构和工作流程 | 第43-46页 |
·本章小结 | 第46-47页 |
第4章 主题元搜索引擎的实现 | 第47-79页 |
·主题词和种子站点提取 | 第47-51页 |
·页面主题度计算 | 第51-63页 |
·主题元搜索引擎页面爬行及索引策略 | 第63-73页 |
·主题元搜索引擎搜索及排序优化 | 第73-74页 |
·主题元搜索引擎的界面设计 | 第74-78页 |
·本章小结 | 第78-79页 |
第5章 主题元搜索引擎测试 | 第79-102页 |
·开发及测试软硬件环境 | 第79-80页 |
·中文分词与Web 页面解析测试 | 第80-86页 |
·主题元搜索引擎查全率测试 | 第86-93页 |
·主题元搜索引擎查准率测试 | 第93-101页 |
·本章小结 | 第101-102页 |
第6章 结论和展望 | 第102-105页 |
·主题元搜索引擎工作总结 | 第102-103页 |
·论文工作中的不足和教训 | 第103-104页 |
·未来展望和下一步工作努力的方向 | 第104-105页 |
参考文献 | 第105-115页 |
致谢 | 第115-116页 |
个人简历 | 第116页 |