首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向校园的垂直搜索引擎的设计与实现

摘要第1-5页
ABSTRACT第5-6页
第一章 绪论第6-10页
   ·论文选题背景第6页
   ·搜索引擎的发展历史第6-7页
   ·垂直搜索引擎简介第7-8页
   ·论文的内容与意义第8-9页
   ·文章的章节安排第9-10页
第二章 关键技术的研究第10-23页
   ·搜索引擎的原理第10-12页
     ·搜索引擎的分类第10-11页
     ·目前的搜索引擎的工作原理第11-12页
   ·中文分词技术第12-14页
     ·技术简介第12-13页
     ·分词系统模型第13-14页
   ·主题判别的研究现状第14-15页
     ·布尔模型第14页
     ·向量空间模型第14-15页
   ·网页结构化第15-17页
     ·分装器技术第15-16页
     ·基于包装器的信息抽取第16页
     ·基于隐马尔可夫模型第16-17页
     ·基于视觉的网页信息抽取技术第17页
     ·优缺点比较第17页
   ·基于链接的分析技术第17-22页
     ·PageRank算法第17-20页
     ·HIPS算法第20-21页
     ·PageRank和HITS算法比较第21-22页
   ·本章小结第22-23页
第三章 面向校园的垂直搜索引擎的设计与实现第23-36页
   ·总体框架设计第23-24页
   ·主题爬虫的设计第24-31页
     ·主题爬虫的系统组成第24-25页
     ·主题确立模块第25-26页
     ·优化初始种子模块第26页
     ·主题相关度模块第26-27页
     ·抓取器的实现第27-29页
     ·链接分析第29-31页
   ·信息分析模块第31-34页
     ·网页的分类第31-33页
     ·网页结构化信息抽取算法第33页
     ·信息存储第33-34页
   ·信息索引和查询模块第34-35页
     ·Lucene数据索引第34-35页
     ·信息的检索与查询第35页
   ·本章小结第35-36页
第四章 系统的优化第36-43页
   ·用多线程抓取网页第36-39页
   ·链接分析法第39-42页
     ·用链接分析Web站点结构第39-40页
     ·用链接分析对主题爬虫进行改进第40-42页
     ·改进效果分析第42页
   ·本章小结第42-43页
第五章 总结与展望第43-44页
   ·总结第43页
   ·展望第43-44页
参考文献第44-46页
致谢第46-47页

论文共47页,点击 下载论文
上一篇:基于SSH框架的教学测评系统设计与实现
下一篇:面向图形应用的远程设备交互技术