首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中网络爬虫及结果聚类的研究与实现

摘要第1-6页
ABSTRACT第6-11页
第1章 绪论第11-16页
   ·研究背景与意义第11-13页
   ·主要的研究内容及贡献第13-15页
   ·本文组织与结构第15-16页
第2章 搜索引擎概述第16-24页
   ·搜索引擎系统架构及工作原理第16-17页
   ·网络爬虫的相关研究第17-21页
     ·爬虫选择原则第18-20页
     ·礼貌爬行策略第20-21页
   ·索引器相关研究第21-22页
     ·索引数据库第21-22页
     ·倒排索引第22页
   ·检索器第22-23页
   ·本章小结第23-24页
第3章 基于分段哈希的网络爬虫实现第24-34页
   ·相关研究第24-25页
   ·Weblech系统第25-28页
     ·Weblech的特点第25-26页
     ·Weblech处理流程分析第26-28页
   ·改进的页面解析方法第28-29页
   ·基于分段哈希的爬虫URLs去重方法第29-31页
   ·实验过程及分析第31-33页
   ·本章小结第33-34页
第4章 中文搜索结果的短文本在线聚类算法第34-53页
   ·聚类分析概述及评价指标第34-36页
   ·搜索结果的聚类分析第36-37页
   ·Lingo聚类算法的理论背景及实现步骤第37-40页
     ·潜在语义分析及奇异值分解(SVD)第37-38页
     ·Lingo算法的实现步骤第38-40页
   ·中文搜索结果的短文本在线聚类算法第40-42页
   ·中文短文本相似性度量第42-46页
     ·改进的编辑距离第42-45页
     ·利用搜索引擎结果的中文语义相似性度量第45-46页
   ·实验及结果分析第46-52页
   ·本章小结第52-53页
第5章 总结与展望第53-55页
   ·工作总结第53页
   ·展望第53-55页
参考文献第55-58页
致谢第58-59页
在读期间发表的学术论文与取得的研究成果第59页

论文共59页,点击 下载论文
上一篇:结合用户标注信息的图像分类研究
下一篇:数字化X线摄影图像去噪方法研究