首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究与设计

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-11页
   ·研究的背景与意义第9页
   ·课题来源及设计目标第9-10页
   ·本文的主要工作及组织结构第10-11页
第二章 垂直搜索引擎及关键技术第11-30页
   ·搜索引擎概述第11-16页
     ·搜索引擎发展历史第11页
     ·搜索引擎的分类第11-13页
     ·搜索引擎的工作原理和体系结构第13-15页
     ·搜索引擎面临的挑战及发展趋势第15页
     ·评价搜索引擎性能的指标第15-16页
   ·垂直搜索引擎简介第16-17页
   ·垂直搜索引擎与通用搜索引擎的比较第17-18页
   ·垂直搜索引擎的关键技术研究第18-30页
     ·主题页面在Web 上的分布特征第18-19页
     ·主题搜索策略第19-25页
     ·页面与主题相关度的判定第25-27页
     ·网页信息的结构化抽取方式第27-30页
第三章 垂直搜索引擎体系结构设计及功能分析第30-35页
   ·垂直搜索引擎体系结构第30-31页
   ·系统主要功能模块第31-32页
     ·主题初始化模块第31页
     ·网络机器人模块第31页
     ·信息过滤模块第31-32页
     ·中文分词与索引模块第32页
     ·用户接口模块第32页
   ·系统开发环境第32-34页
   ·本章小结第34-35页
第四章 主题初始化模块的设计与实现第35-40页
   ·主题 URL 种子库的设计第35页
   ·主题词库的设计第35-36页
   ·主题初始化模块的实现第36-39页
     ·主题URL 种子库的实现第36-37页
     ·主题词库的实现第37-39页
   ·小结第39-40页
第五章 网络机器人的设计及实现第40-58页
   ·网络机器人的爬行流程第40-42页
   ·网络机器人内的协作关系第42页
   ·多线程下载模块的设计与实现第42-44页
   ·URL 队列管理第44页
   ·网络机器人主要类图设计第44-51页
     ·ParseUrl 类第44-46页
     ·ProcessUrl 类第46-47页
     ·Spider 类第47-48页
     ·SpiderController 类第48页
     ·HashQueue 类第48-49页
     ·HTMLDocument 类第49-50页
     ·各个类之间的关系第50-51页
   ·网络机器人搜索策略设计第51-54页
   ·主题相关度判定算法设计第54-57页
     ·页面主题相关性判断算法第54-55页
     ·URL 与主题的相关性判断算法第55-57页
   ·本章小结第57-58页
第六章 页面解析与中文分词第58-67页
   ·页面解析第58页
   ·中文分词第58-62页
     ·中文分词介绍第58-59页
     ·基于Lucene 的中文分词的实现第59页
     ·正向最大匹配分词算法描述与示例第59-60页
     ·主题词库描述第60页
     ·分词模块的设计第60-62页
   ·基于Lucene 的索引模块的设计与实现第62-66页
     ·设计索引结构第62-63页
     ·建立并优化索引第63-66页
   ·本章小结第66-67页
第七章 实验验证与性能分析第67-70页
   ·实验环境第67页
   ·垂直搜索引擎的性能测试第67-69页
     ·多线程爬行性能测试第67-68页
     ·主题网页采集准确率测试第68-69页
   ·搜索算法性能对比第69页
   ·本章小结第69-70页
总结与展望第70-71页
参考文献第71-73页
致谢第73-74页
个人简历 在读期间发表的学术论文第74页

论文共74页,点击 下载论文
上一篇:线性规划的灵敏度分析&运输问题的灵敏度分析与参数线性规划
下一篇:BICT工艺处理城市污水的特性及运行控制研究