首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于网页分块的主题搜索引擎的研究与实现

摘要第1-6页
ABSTRACT第6-9页
第1章 绪论第9-16页
   ·研究背景第9-13页
     ·主题搜索引擎第9-11页
     ·网页分块的提出第11-12页
     ·网页分块研究现状第12-13页
   ·研究意义第13页
   ·本文主要工作第13-14页
   ·论文组织结构第14-16页
第2章 主题搜索引擎与网页分块技术第16-31页
   ·主题搜索引擎第16-20页
     ·搜索引擎基本工作原理第16-17页
     ·主题搜索引擎与通用搜索引擎的区别第17-19页
     ·主题搜索引擎的关键技术第19-20页
   ·网页分块第20-25页
     ·网页的结构特征第20-21页
     ·网页分块基本技术手段第21-24页
     ·网页分块的应用第24-25页
   ·网页分块应用在主题搜索中的主要作用第25-30页
     ·链接预测第26页
     ·隧道穿越第26-28页
     ·网页消重第28页
     ·索引容量第28-29页
     ·检索质量第29-30页
   ·本章小结第30-31页
第3章 CTVPS网页分块算法及主题相关块提取第31-44页
   ·网页预处理第31-34页
     ·网页标准化第31-32页
     ·构建Dom树第32-34页
   ·网页分块第34-38页
     ·标签信息第34-35页
     ·视觉信息第35页
     ·链接信息第35-36页
     ·分块算法描述第36-38页
   ·主题相关内容块提取第38-43页
     ·主题描述第39页
     ·向量空间模型第39-41页
     ·主题相关块提取描述第41-43页
   ·本章小结第43-44页
第4章 Search Smart系统的设计实现第44-57页
   ·系统设计第44-45页
     ·系统的设计思想第44页
     ·系统的架构第44-45页
   ·系统实现准备工作第45-53页
     ·开源项目选择第46-47页
     ·开源搜索引擎Nutch第47-53页
   ·Search Smart的实现第53-56页
     ·网页抓取模块第54页
     ·网页解析及网页分块模块第54页
     ·主题相关块提取模块第54-55页
     ·索引模块第55页
     ·检索模块第55-56页
   ·本章小结第56-57页
第5章 Search Smart系统测试和结果分析第57-65页
   ·系统测试第57-61页
     ·测试环境第57页
     ·测试的准备工作第57-58页
     ·主题网站索引库内容的建立第58-59页
     ·使用Tomcat进行搜索测试第59-61页
   ·结果分析第61-64页
   ·Search Smart的可能改进第64页
   ·本章小结第64-65页
第6章 总结与展望第65-67页
   ·本文总结第65-66页
   ·工作展望第66-67页
参考文献第67-71页
致谢第71-72页
攻读学位期间参加的科研项目和成果第72页

论文共72页,点击 下载论文
上一篇:基于特征点变形的颅面复原算法研究
下一篇:计算机视觉中的光照协调技术