首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索引擎的研究与实现

摘要第1-5页
Abstract第5-6页
目录第6-8页
第1章 引言第8-13页
   ·研究的背景第8页
   ·国内外研究现状第8-10页
   ·课题研究的目的与意义第10-11页
   ·论文研究的主要内容与贡献第11页
   ·论文组织结构第11-12页
   ·本章小结第12-13页
第2章 主题搜索引擎的相关知识第13-22页
   ·主题搜索引擎与全文搜索引擎的异同点第13-14页
   ·主题搜索引擎的结构第14-15页
   ·倒排索引第15-17页
   ·抓取策略第17-18页
   ·搜索引擎的排序算法第18-21页
   ·本章小结第21-22页
第3章 基于朴素贝叶斯算法的主题爬虫的研究与实现第22-36页
   ·主题爬虫的工作原理第22-23页
   ·信息抽取技术第23-32页
     ·页面采集第23-24页
     ·网页去噪第24-27页
     ·信息指纹进行网页排重第27-29页
     ·改进的机械最大正向分词算法进行分词第29-32页
   ·利用朴素贝叶斯算法进行主题识别第32-35页
   ·本章小结第35-36页
第4章 基于 Lucene 的索引与检索的研究与实现第36-50页
   ·全文检索索引包 LUCENE第36-38页
   ·索引子系统第38-43页
     ·扩展 Lucene 分词模块第38-41页
     ·建立信息索引第41-43页
   ·检索子系统第43-49页
     ·框架 DWR 与 Spring 开发检索子系统第43-45页
     ·改进的结果排序第45-48页
     ·利用 Highlighter 实现关键字高亮第48-49页
   ·本章小结第49-50页
第5章 实验结果与分析第50-60页
   ·基于朴素贝叶斯算法的主题爬虫实验第50-52页
   ·主题搜索引擎性能实验第52-59页
   ·本章小结第59-60页
第6章 总结与展望第60-62页
   ·本文总结第60-61页
   ·本文展望第61-62页
参考文献第62-65页
致谢第65-66页
附录第66-79页
 1. 作者在攻读学位期间发表的学术论文第66页
 2. 作者在攻读学位期间参加的主要项目第66页
 3. 网页去噪核心代码第66-74页
 4. 改进的机械最大分词算法核心代码第74-77页
 5. 基于朴素贝叶斯算法的主题识别核心代码第77-79页

论文共79页,点击 下载论文
上一篇:基于网络的高校体育信息系统分析与设计研究
下一篇:三角测量法及其在锡膏测厚中的应用