首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向博客领域的垂直搜索引擎的研究与实现

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-16页
   ·项目背景第10-11页
   ·垂直搜索引擎第11-13页
     ·垂直搜索引擎的定义第11-12页
     ·垂直搜索引擎的优势第12页
     ·垂直搜索引擎的国内外现状第12-13页
   ·课题任务第13-14页
   ·论文结构第14-16页
第二章 搜索引擎原理分析第16-22页
   ·通用搜索引擎第16-21页
     ·搜索引擎组成及工作原理第16-17页
     ·搜索引擎的分类第17-18页
     ·搜索引擎的发展历史第18-19页
     ·搜索引擎的发展趋势第19-21页
   ·本章小结第21-22页
第三章 博客垂直搜索引擎关键技术研究第22-37页
   ·垂直网络蜘蛛技术第22-27页
     ·垂直网络蜘蛛的工作原理第22-24页
     ·ROBOTS协议第24页
     ·主题目标描述第24-26页
     ·网页搜索策略第26-27页
   ·主题相关度判定第27-29页
     ·布尔模型第28页
     ·向量空间模型第28-29页
   ·基于链接的分析技术第29-36页
     ·PAGERANK算法第29-32页
     ·HITS算法第32-33页
     ·PAGERANK和HITS算法比较第33-34页
     ·TPR主题相关度预测算法第34-35页
     ·TPR算法分析第35-36页
   ·本章小结第36-37页
第四章 索引和检索模块的设计第37-57页
   ·博客垂直搜索引擎系统总体框架设计第37-38页
   ·网页结构化信息抽取技术的设计第38-41页
     ·WEB信息抽取概述第39页
     ·WEB信息抽取关键技术第39-40页
     ·基于正则表达式的网页信息抽取方法第40-41页
   ·网页消重的设计第41-43页
   ·中文分词技术的选取第43-48页
     ·基于字符串匹配的分词方法第43-46页
     ·基于统计的分词方法第46-48页
     ·基于主题判别的机械分词方法第48页
   ·词典更新策略第48-51页
   ·建立索引第51-53页
   ·用户检索定义与过程第53-55页
     ·EHCACHE索引文件缓存策略第54页
     ·索引文件存储策略第54-55页
   ·网页摘要缓存策略第55-56页
   ·本章小结第56-57页
第五章 博客垂直搜索引擎系统的实现与性能测试第57-65页
   ·开发环境介绍第57-58页
   ·网络蜘蛛开发第58-60页
   ·分词字典第60页
   ·创建索引文件第60-61页
   ·检索接口第61-62页
   ·系统部署第62-63页
   ·性能测试第63-64页
     ·MYSPIDER网络蜘蛛性能测试第63页
     ·检索接口性能测试第63-64页
   ·本章小结第64-65页
第六章 总结与展望第65-67页
   ·全文总结第65-66页
   ·问题与展望第66-67页
参考文献第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:自动故障受理软件的设计与实现
下一篇:SCRUM敏捷方法实践及优势分析