基于事件驱动模型的搜索引擎的研究及原型系统设计
摘要 | 第1-6页 |
Abstract | 第6-11页 |
插图索引 | 第11-12页 |
附表索引 | 第12-13页 |
第1章 绪论 | 第13-29页 |
·引言 | 第13页 |
·选题背景和研究意义 | 第13-14页 |
·国内外研究现状 | 第14-19页 |
·传统搜索引擎技术 | 第14-16页 |
·搜索引擎评价体系 | 第16-17页 |
·个性化搜索引擎主要技术 | 第17-19页 |
·搜索引擎其他相关理论及技术 | 第19-27页 |
·网络爬虫及其原理 | 第19-20页 |
·中文分词技术 | 第20-22页 |
·索引数据库的建立 | 第22-24页 |
·检索技术 | 第24-25页 |
·页面排序技术 | 第25-27页 |
·论文研究的主要内容 | 第27-28页 |
·小结 | 第28-29页 |
第2章 基于事件驱动模型的搜索引擎算法研究 | 第29-36页 |
·用户的随机性关注主题的表示和获取算法 | 第29-31页 |
·用户的随机性关注主题的表示 | 第29页 |
·用户的随机性关注主题的获取算法 | 第29-30页 |
·词汇权重计算公式的改进和查准率的提高 | 第30-31页 |
·用户随机关注主题算法性能分析 | 第31页 |
·用户对文档主题关注度的算法设计 | 第31-33页 |
·关注程度算法描述 | 第32页 |
·用户在页面实际停留时间计算算法 | 第32页 |
·用户在页面理论停留时间计算算法 | 第32-33页 |
·关注程度算法性能分析 | 第33页 |
·基于事件驱动模型的搜索引擎算法描述 | 第33-35页 |
·事件驱动模型概述 | 第33页 |
·搜索引擎算法描述 | 第33-34页 |
·搜索引擎算法性能分析 | 第34-35页 |
·小结 | 第35-36页 |
第3章 搜索引擎原型系统的设计 | 第36-43页 |
·搜索引擎原型系统结构设计 | 第36-37页 |
·索引器的设计 | 第37-38页 |
·过滤器的设计 | 第38-39页 |
·主题分析器的设计 | 第39-40页 |
·检索器的设计 | 第40-41页 |
·用户对文档主题关注度分析器的设计 | 第41-42页 |
·小结 | 第42-43页 |
第4章 搜索引擎原型系统的实现 | 第43-62页 |
·系统功能和目标 | 第43页 |
·DWR 框架技术实现 | 第43-46页 |
·DWR 框架组成 | 第43页 |
·DWR 框架工作原理 | 第43-44页 |
·web.xml 配置文件 | 第44-45页 |
·dwr.xml 配置文件 | 第45-46页 |
·HTML 或JSP 页面配置方法 | 第46页 |
·信息采集模块 | 第46-48页 |
·Heritrix1.4 网络爬虫概述 | 第46页 |
·抓取任务CrawlOrder | 第46-47页 |
·抓取任务控制器CrawlController | 第47页 |
·链接制造工厂Frontier | 第47-48页 |
·索引器的实现 | 第48-52页 |
·Lucene 建立索引的机制 | 第48-49页 |
·索引器的实现 | 第49-52页 |
·过滤器的实现 | 第52-55页 |
·Lucene 的文档评分机制 | 第52-53页 |
·Lucene 计算文档得分方法 | 第53页 |
·过滤器的实现 | 第53-55页 |
·主题分析器的实现 | 第55-58页 |
·检索器的实现 | 第58-60页 |
·Lucene 检索技术 | 第58-59页 |
·查询关键词高亮显示 | 第59页 |
·检索器实现 | 第59-60页 |
·用户对文档主题关注度分析器的实现 | 第60-61页 |
·用户在页面实际停留时间计算的实现 | 第60-61页 |
·用户在页面理论停留时间计算的实现 | 第61页 |
·用户对页面主题的关注程度的实现 | 第61页 |
·小结 | 第61-62页 |
第5章 搜索引擎原型系统的测试与性能分析 | 第62-68页 |
·实验环境及背景 | 第62页 |
·测试数据采集 | 第62-63页 |
·搜索引擎原型系统的测试 | 第63-64页 |
·搜索引擎原型系统性能分析 | 第64-67页 |
·系统收录信息的完备性 | 第64-65页 |
·系统响应时间 | 第65-66页 |
·用户对检索结果的满意度 | 第66-67页 |
·系统测试结论与小结 | 第67-68页 |
结论与展望 | 第68-70页 |
参考文献 | 第70-73页 |
致谢 | 第73-74页 |
附录 A 攻读硕士学位期间参与的科研活动 | 第74页 |