首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

公众论坛信息实时检索的研究与实现

摘要第1-4页
Abstract第4-8页
1 绪论第8-11页
   ·研究背景第8-9页
   ·研究现状第9页
   ·本文主要工作第9-10页
   ·本文结构第10-11页
2 系统设计第11-14页
   ·垂直搜索引擎第11-12页
   ·系统结构第12页
   ·系统开发环境第12-13页
   ·本章小结第13-14页
3 元搜索引擎第14-22页
   ·元搜索引擎的定义第14-15页
   ·高级搜索功能分析第15-16页
   ·用户界面的实现第16-17页
   ·提交查询请求第17-18页
   ·搜索结果重新排序第18-21页
   ·本章小结第21-22页
4 网络爬虫的开发第22-40页
   ·网络爬虫第22-24页
   ·链接选取策略第24页
   ·爬虫爬行策略第24-27页
     ·深度优先策略第25页
     ·广度优先策略第25-26页
     ·反向链接数策略第26页
     ·本文的策略第26-27页
   ·网页去重第27-30页
     ·布隆过滤器第27-28页
     ·本文的布隆过滤器第28-30页
   ·礼貌爬行第30-33页
     ·robots协议第31-32页
     ·控制爬行压力第32-33页
   ·多线程技术第33-36页
     ·线程池技术简介第33-35页
     ·改进的线程池第35-36页
   ·抓取效果第36-38页
   ·本章小节第38-40页
5 提取结构化的文本信息第40-53页
   ·从HTML文件中提取结构化文本信息第40-47页
     ·开源工具HTMLParser第40-42页
     ·标题及时间的提取第42-44页
     ·帖子正文信息的提取第44-47页
   ·常见格式文件的文本信息提取第47-52页
   ·本章小结第52-53页
6 基于Lucene索引及检索第53-70页
   ·全文检索第53-56页
     ·倒排索引第53-54页
     ·PAT数组模型第54-55页
     ·基于邻接矩阵的全文检索模型第55-56页
   ·开源工具Lucene第56-57页
   ·Lucene分析器第57-59页
     ·Lucene的标准分析器第57-58页
     ·中文分词第58-59页
     ·IKAnalyzer分析器第59页
   ·Lucene的索引模块第59-61页
   ·Lucene的检索模块第61-63页
   ·索引及检索模块的实现第63-67页
     ·建立索引第63-65页
     ·建立查询接口第65-67页
   ·搜索结果第67-69页
   ·本章小结第69-70页
7 总结与展望第70-72页
致谢第72-73页
参考文献第73-76页
附录第76页

论文共76页,点击 下载论文
上一篇:基于SOA的财务管理系统架构研究--西门子财务管理系统的设计与实现
下一篇:基于局部二元模式和韦伯局部描述符的人脸识别