首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

可定制的垂直搜索引擎研究与实现

致谢第1-6页
摘要第6-7页
ABSTRACT第7-8页
第8-12页
1 引言第12-16页
   ·搜索引擎及其发展现状及未来方向第12-14页
   ·可定制的垂直搜索引擎简介第14-15页
   ·本论文的主要工作第15页
   ·本论文的内容组织结构第15-16页
2 可定制的垂直搜索引擎相关工作综述第16-25页
   ·通用搜索引擎架构介绍第16-17页
   ·通用搜索引擎架构局限性第17-19页
   ·可定制的垂直搜索引擎架构设计第19-20页
   ·核心模块介绍第20-24页
     ·网页抓取模块第20-22页
     ·分词储存索引模块第22-23页
     ·网页检索模块第23页
     ·可定制模块第23-24页
   ·本章小结第24-25页
3 网页抓取模块的实现第25-47页
   ·传统的网页抓取策略第26-28页
   ·垂直搜索引擎网页抓取技术的研究意义第28-29页
   ·垂直搜索的领域主题的描述第29-30页
   ·网页抓取的设计与实现第30-33页
   ·网页内容转换的设计与实现第33-35页
   ·数据库的设计第35-41页
     ·Link表结构设计第35-36页
     ·主题关键词表结构设计第36-37页
     ·任务信息表结构设计第37-39页
     ·进程列表结构设计第39页
     ·网络蜘蛛配置表结构设计第39页
     ·黑名单表结构设计第39-40页
     ·关于字符集第40-41页
   ·实验与分析第41-45页
   ·本章小结第45-47页
4 分词储存索引模块的实现第47-61页
   ·分词的实现第47-51页
     ·中文分词技术第47-48页
     ·海量智能分词技术应用第48-49页
     ·海量智能分词表结构第49-50页
     ·海量智能分词接口第50-51页
   ·存储索引的实现第51-60页
     ·基于B+树的文档索引结构图设计第52-53页
     ·B+树中文档的加入与查询过程第53-55页
     ·倒排索引第55-56页
     ·与Lucene结合实现存储与索引第56-60页
   ·本章小结第60-61页
5 网页检索模块的实现第61-71页
   ·对检索内容处理第61页
   ·BFU排序算法对网页排序第61-70页
     ·BFU排序中相关概念定义第61-62页
     ·BFU排序研究背景第62-63页
     ·领域排序的问题定义及函数形式第63-65页
     ·领域排序收敛性证明第65-66页
     ·领域内排序的问题定义及函数形式第66-68页
     ·领域内排序收敛性证明第68页
     ·BFU排序算法第68-69页
     ·实验与分析第69-70页
   ·本章小结第70-71页
6 可定制模块的实现第71-75页
   ·可定制功能研究进展第71页
   ·可定制功能基本流程图第71-73页
   ·实验与分析第73-74页
   ·本章小结第74-75页
7 总结和展望第75-77页
   ·工作总结第75-76页
   ·未来工作展望第76-77页
参考文献第77-79页
作者简历第79-81页
学位论文数据集第81页

论文共81页,点击 下载论文
上一篇:分布式系统中数据库服务虚拟化研究与实现
下一篇:莱阳日升皮草有限公司的品牌发展战略