首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--图书馆学论文--图书馆自动化、网络化论文--网络资源开发与利用论文

基于Nutch的图情博客搜索引擎的设计与实现

摘要第1-6页
Abstract第6-12页
1 绪论第12-17页
   ·选题背景及意义第12页
   ·国内外研究综述第12-16页
     ·国内研究综述第12-15页
     ·国外研究综述第15-16页
   ·研究方法与创新第16-17页
     ·研究方法第16页
     ·创新之处第16-17页
2 搜索引擎相关技术及图情博客分析第17-23页
   ·搜索引擎运行原理第17-18页
     ·网页信息采集模块运行原理第18页
     ·网页内容解析模块运行原理第18页
     ·网页索引模块运行原理第18页
     ·网页信息查询处理模块运行原理第18页
   ·主题搜索引擎运行原理第18-20页
   ·图情博客分析第20-23页
     ·博客站点结构第20-21页
     ·博客页面内容第21-22页
     ·博客之间链接结构第22-23页
3 Nutch简介及Nutch系统的运行环境配置与运行第23-31页
   ·Nutch简介第23-24页
   ·Nutch系统的运行环境配置与运行第24-31页
     ·Nutch系统的运行环境配置第24-25页
     ·Nutch系统的运行第25-31页
4 基于Nutch的图情博客搜索引擎的设计第31-39页
   ·系统的问题定义和可行性研究第31-32页
   ·系统的需求分析第32-36页
     ·系统的用户需求内容第32-33页
     ·系统的用例分析图第33页
     ·系统的序列分析图第33-36页
   ·系统的设计第36-39页
     ·系统的总体设计第36-37页
     ·系统的核心模块设计第37-39页
5 基于Nutch的图情博客搜索引擎的核心模块实现第39-44页
   ·主题资源发现模块的实现第39-40页
     ·学术文献检索发现目标站点第39-40页
     ·网络信息检索发现目标站点第40页
   ·爬虫模块的采集策略的实现第40-42页
     ·网络爬虫经典采集策略第40-41页
     ·Nutch爬虫访问策略的制定第41-42页
   ·检索模块改进方案的实现第42-44页
     ·Web用户界面的个性化改进第42-43页
     ·检索词的高亮显示第43页
     ·检索结果翻页机制改进第43-44页
6 实验测试分析与结论第44-47页
   ·图情博客搜索引擎实验测试及分析第44-45页
   ·结论第45-47页
参考文献第47-50页
致谢第50-52页
附录第52-68页
个人简历、在校期间发表的学术论文及研究成果第68页

论文共68页,点击 下载论文
上一篇:基于本体的语义检索在数字图书馆中的应用研究
下一篇:用影像诉说历史--《良友》画报的传播学研究