首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于聚焦相关度排序的搜索引擎研究与应用

摘要第1-7页
Abstract第7-11页
第一章 绪论第11-15页
   ·研究背景与目的第11页
   ·研究现状概述第11-12页
   ·课题研究内容第12-13页
   ·本文的组织结构第13-15页
第二章 相关技术研究第15-30页
   ·主题爬虫基本原理第15-17页
     ·主题爬虫工作流程第15-16页
     ·主题爬虫架构第16-17页
     ·主题爬行技术第17页
   ·信息索引技术第17-19页
     ·倒排索引第17-18页
     ·后缀树与后缀数组第18-19页
   ·页面信息提取第19-21页
     ·中文分词第19页
     ·聚类分析第19-21页
   ·相关度排序技术第21-27页
     ·基于网页链接结构的相关度排序第21-24页
     ·页面权重的评价方式第24-27页
   ·Lucene开源框架第27-29页
     ·Lucene简述第27页
     ·Lucene的体系结构第27-29页
     ·Lucene程序的运行机制第29页
   ·本章小结第29-30页
第三章 改进的聚焦相关度排序第30-47页
   ·主题爬行技术的研究与改进第31-36页
     ·超链接相关度鉴别问题第31-33页
     ·主题爬行算法第33-34页
     ·穿越黑暗tunnel问题第34-35页
     ·加入在线学习和辅助函数的主题爬行改进方法第35-36页
   ·PageRank算法的改进第36-43页
     ·主题敏感的改进算法第36-37页
     ·MP-PageRank算法第37-38页
     ·分析用户兴趣点的改进算法第38-40页
     ·基于用户行为模型的PageRank改进算法第40-43页
   ·页面权重的自定义方法第43-46页
     ·提取页面特征第43-45页
     ·页面权重评估第45-46页
   ·本章小结第46-47页
第四章 搜索引擎架构设计及实现第47-58页
   ·系统架构第47-48页
     ·系统开发环境第47页
     ·系统整体架构第47-48页
   ·爬虫模块第48-50页
     ·爬虫子系统架构第48-49页
     ·爬虫访问规范第49页
     ·改进后的主题爬行方法的实现第49-50页
   ·索引库第50-52页
     ·Lucene索引结构第50-51页
     ·索引的建立第51-52页
   ·查询模块第52-57页
     ·排序流程第53-54页
     ·相关度评分方法的改进第54-55页
     ·网页摘要生成第55页
     ·根据文档得分进行排序的改进第55-57页
   ·本章小结第57-58页
第五章 实验与评价第58-66页
   ·搜索引擎评价指标第58-59页
   ·系统相关性评测第59-63页
     ·主题爬虫实验第59-60页
     ·文本的预处理第60-61页
     ·系统相关性评测第61-63页
   ·系统查全率与查准率评测第63-65页
     ·系统查全率评测第63-64页
     ·系统查准率评测第64-65页
   ·搜索引擎界面实验第65页
   ·本章小结第65-66页
第六章 总结与展望第66-69页
   ·总结第66-67页
   ·展望第67-69页
参考文献第69-73页
攻读学位期间的研究成果目录第73页

论文共73页,点击 下载论文
上一篇:基于本体的程序设计题目语义表达研究
下一篇:分布式索引在东华搜索引擎中的研究和应用