首页--文化、科学、教育、体育论文--教育论文--教育学论文--教育与其他科学的关系、教育学分支论文--教育技术学论文

面向远程教育主题搜索引擎的研究与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-15页
   ·引言第7页
   ·选题背景及意义第7-11页
     ·远程教育的发展第7-9页
     ·搜索引擎和主题搜索引擎第9-10页
     ·远程教育主题搜索引擎研究现状第10-11页
   ·论文的主要工作第11-12页
   ·论文的结构第12-15页
第二章 搜索引擎相关原理及技术第15-29页
   ·搜索引擎第15-21页
     ·搜索引擎的发展史第15-18页
     ·搜索引擎的分类第18-19页
     ·搜索引擎的工作原理第19页
     ·搜索引擎的体系结构第19-21页
   ·主题搜索引擎第21-22页
     ·主题搜索引擎的定义第21-22页
     ·主题搜索引擎的优势第22页
   ·国内外现有优秀的主题搜索引擎第22-24页
     ·国外优秀的主题搜索引擎第22-24页
     ·国内优秀的主题搜索引擎第24页
   ·Lucene 软件包介绍第24-25页
     ·什么是 Lucene第24-25页
     ·Lucene 的特点和优势第25页
   ·Heritrix 简介第25-26页
   ·HTMLParser 简介第26-29页
     ·HTMLParser 介绍第26页
     ·HTMLParser 功能和特性第26-29页
第三章 基于 Lucene/Heritrix 搜索引擎系统设计第29-41页
   ·基于 Lucene 的索引与搜索系统第29-34页
     ·Lucene 系统结构第29-31页
     ·Lucene 索引核心类第31-33页
     ·Lucene 搜索核心类第33-34页
     ·小结第34页
   ·基于 Heritrix 的下载系统第34-38页
     ·Heritrix 的系统结构第34-35页
     ·Heritrix 核心组件第35-36页
     ·Heritrix 的扩展与定制方法第36-38页
     ·小结第38页
   ·基于 HTMLParser 网页信息提取第38-40页
     ·HTMLParser 词法分析的工作原理第38-39页
     ·三种解析方法的比较第39页
     ·小结第39-40页
   ·基于 Lucene/Heritrix 搜索引擎系统设计第40-41页
第四章 基于 Heritrix 主题爬虫算法设计与分析第41-51页
   ·主题选择第41页
   ·主题词库的建立第41-42页
   ·远程教育领域主题爬虫算法第42-48页
     ·自定义 Extractor 的解决方案及实现第43-46页
     ·自定义 FrontierScheduler 的方案及实现第46-47页
     ·多线程抓取第47页
     ·去除 robots.txt 限制第47-48页
   ·实验结果分析第48-51页
第五章 远程教育主题搜索引擎设计与实现第51-67页
   ·系统设计目标第51-52页
   ·系统总体结构第52-53页
   ·系统各模块具体实现第53-64页
     ·网页抓取子系统的设计与实现第53-57页
     ·信息抽取子系统的设计与实现第57-59页
     ·信息索引子系统的设计与实现第59-60页
     ·信息检索子系统的设计与实现第60-64页
   ·系统实现效果第64-65页
   ·系统性能评估第65-67页
第六章 总结与展望第67-69页
   ·论文总结第67页
   ·展望第67-69页
致谢第69-71页
参考文献第71-74页

论文共74页,点击 下载论文
上一篇:适用于3G智能手机的Flash课件点播系统的设计与实现
下一篇:多校区条件下大学生思想政治教育体系的构建