首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的面向主题信息搜索系统的关键技术分析及应用

摘要第1-6页
Abstract第6-11页
第1章 引言第11-19页
   ·课题研究背景及现状第11页
   ·搜索引擎技术的研究背景与发展趋势第11-14页
     ·搜索引擎的发展历史第11-12页
     ·搜索引擎的现状与发展趋势第12-14页
   ·面向主题的搜索引擎系统第14-17页
     ·面向主题搜索引擎的优势第15-16页
     ·面向主题搜索系统的研究现状第16-17页
   ·本文研究内容第17-18页
   ·本文组织结构第18-19页
第2章 面向主题搜索系统的关键技术分析第19-40页
   ·数据搜集器第19-26页
     ·Heritrix简介第21-22页
     ·Heritrix与Nutch的比较第22-23页
     ·Heritrix的配置使用第23-26页
   ·网页解析技术HTMLPARSER第26-31页
     ·HtmlParser概述第26页
     ·HtmlParser中主要类的介绍第26-29页
     ·HtmlParser中遍历方式第29-31页
   ·中文分词技术第31-34页
     ·中文分词的研究现状第31-33页
     ·常见分词系统第33-34页
   ·全文搜索框架LUCENE第34-38页
     ·Lucene概述第34页
     ·Lucene索引结构第34-35页
     ·Lucene工作原理第35-38页
   ·向量空间模型在面向主题搜索系统中的应用第38-40页
第3章 面向主题搜索系统的设计第40-45页
   ·系统提出背景第40页
   ·系统框架设计第40-42页
   ·词典库设计第42-43页
     ·气象专业词库第42页
     ·动态词库第42-43页
   ·开发环境与系统编程框架第43-45页
     ·系统的开发环境第43页
     ·系统编程框架与技术介绍第43-45页
第4章 数据搜集与网页预处理模块第45-71页
   ·数据搜集模块详细设计第45-51页
     ·数据搜集模块的基本配置第45-47页
     ·面向主题的搜集第47-50页
     ·实验结果分析第50-51页
   ·网页预处理模块详细设计第51-71页
     ·网页净化模块第51-62页
     ·网页消重模块第62-71页
第5章 LUCENE索引与搜索模块第71-88页
   ·LUCENE建立索引的过程第71-83页
     ·提取文本内容第71-77页
     ·多线程建立索引第77-83页
   ·LUCENE查询模块第83-88页
     ·lucene搜索过程第83-84页
     ·lucene中自带排序算法研究第84-85页
     ·改进后的网页排序算法第85-87页
     ·实验结果分析第87-88页
第6章 个性化设置与系统应用界面第88-93页
   ·热点词推荐第88-89页
   ·网页预览功能第89-91页
   ·系统应用界面第91-93页
第7章 结论与展望第93-95页
致谢第95-96页
参考文献第96-98页
攻读硕士研究生期间主要成果第98页

论文共98页,点击 下载论文
上一篇:基于现场总线的光缆护套生产线控制系统设计
下一篇:大型悬挑钢结构施工关键技术研究