首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch技术的主题搜索引擎实现

提要第1-7页
第一章 绪论第7-11页
   ·通用搜索引擎和主题搜索引擎的比较第7-8页
   ·主题搜索引擎的产生和发展前景第8-9页
   ·选题的意义第9页
   ·本文的主要研究内容和结构安排第9-11页
第二章 搜索引擎相关技术第11-23页
   ·搜索引擎的工作原理第11-18页
     ·页面采集模块的工作原理第12-14页
     ·页面分析和建立索引第14-16页
     ·数据检索模块的工作原理第16-18页
   ·主题搜索引擎工作原理第18-19页
     ·主题搜索引擎的特点第18-19页
     ·主题搜索引擎的信息采集技术第19页
   ·开源搜索引擎—Nutch第19-22页
     ·Nutch 的特点第21-22页
   ·小结第22-23页
第三章 基于Nutch 主题搜索引擎设计第23-35页
   ·系统体系结构第23-26页
     ·信息抓取部分第24页
     ·信息预处理部分第24-26页
     ·查询服务部分第26页
   ·系统用例模型第26-28页
     ·角色的确定第26-27页
     ·创建用例第27-28页
   ·系统动态模型第28-30页
   ·系统整体工作说明第30-31页
     ·系统整体工作图解第30-31页
     ·系统总体工作流程描述第31页
   ·系统数据说明第31-32页
   ·主题过滤说明第32-35页
第四章 系统实现技术难题和比较实验第35-61页
   ·系统实现问题第35-36页
   ·中文问题第36-37页
     ·segmentCN 模块解决中文问题第36-37页
   ·主题相关性判别问题第37-54页
     ·根据元数据的判定(元数据演算)第37-41页
     ·根据扩展元数据的判定第41-45页
     ·根据页面间链接分析的判断第45-51页
     ·根据页面语义信息的判定第51-54页
   ·本系统主题表示问题的解决办法第54-55页
   ·出错处理和遗留问题第55-56页
     ·出错处理第55页
     ·遗留问题第55-56页
   ·单机实验测试与并行测试资源消耗对照与结论第56-60页
   ·分析摘要第60页
   ·附录第60-61页
第五章 结论和工作展望第61-62页
参考文献第62-64页
摘要第64-67页
Abstract第67-70页
致谢第70-71页
导师和作者简介第71页

论文共71页,点击 下载论文
上一篇:IMAX电影图像的小波去噪增强方法与实现
下一篇:基于粒子系统的喷泉动画模拟