首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究

摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-11页
   ·研究的背景和意义第9页
   ·国内外的发展情况第9-10页
   ·本文的主要工作和组织结构第10-11页
第2章 垂直搜索引擎基本知识介绍第11-20页
   ·通用搜索引擎分类第11页
   ·通用搜索引擎的不足第11页
   ·垂直搜索引擎的优势第11-12页
   ·垂直引擎与通用搜索引擎的差别第12页
   ·垂直搜索整体框架第12-14页
   ·主题页面分布特征第14页
   ·中文分词技术第14-17页
   ·倒排索引的建立第17-19页
   ·主题预测算法的介绍第19-20页
第3章 Lucene的工作原理第20-31页
   ·Lucene的特征与优点第20页
   ·Lucene的结构第20-26页
   ·基于Lucene的索引第26-31页
     ·Lucene索引文件结构第26-28页
     ·Lucene索引机制第28-29页
     ·Lucene数据流解析第29-31页
第4章 网络蜘蛛第31-42页
   ·客户端与服务器建立连接第31-32页
   ·网页搜集与网页净化第32-36页
   ·文档视图模型和提取方法第36-40页
   ·与主题相关度的判定第40-41页
   ·内容重复网页的消除算法介绍和改进第41-42页
第5章 系统设计与实现第42-54页
   ·爬抓器蜘蛛的实现第42-47页
   ·中文分词的实现第47-48页
   ·索引器和检索器的实现第48-49页
   ·改进的基于内容的网页消重算法的实现第49-54页
第6章 总结与展望第54-56页
参考文献第56-59页
致谢第59-60页
研究生期间发表论文第60页

论文共60页,点击 下载论文
上一篇:基于Eclipse平台的实时软件研究与设计
下一篇:基于小波变换的医学图像压缩研究