首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

新闻垂直搜索引擎的设计

摘要第1-5页
Abstract第5-9页
1 绪论第9-13页
   ·概述第9页
   ·国内外的概况第9-11页
   ·搜索引擎的分类第11-12页
   ·本文主要的研究工作第12-13页
2 垂直搜索引擎总体结构第13-22页
   ·搜索引擎的工作过程第13-15页
   ·搜索引擎的基本结构第15-19页
     ·搜集器第15-17页
     ·分析器第17页
     ·索引器第17-18页
     ·检索器第18页
     ·用户接口第18-19页
   ·垂直搜索引擎的相关概念第19-21页
     ·什么是垂直搜索引擎第19页
     ·垂直搜索的内容来源第19-20页
     ·垂直搜索引擎的三个特点第20页
     ·设计垂直搜索引擎的基本方法第20-21页
   ·小结第21-22页
3 蜘蛛模块的设计第22-32页
   ·网页抓取方法第22-23页
   ·网络蜘蛛第23-25页
   ·内容的提取第25-26页
   ·网络抓取模块的设计第26-30页
     ·从网页中提取需要的新闻链接第26-28页
     ·用队列存储URL第28-29页
     ·下载网页的格式要求第29-30页
     ·抓取周期的分析第30页
   ·小结第30-32页
4 中文分词模块的设计第32-41页
   ·中文分词技术简介第32-33页
     ·基于字符串匹配的分词方法第32页
     ·基于理解分词方法第32-33页
     ·基于统计的分词法第33页
   ·全文检索引擎 Lucene第33-35页
     ·Lucene 简介第33页
     ·Lucene 系统功能介绍第33-35页
   ·中文分词模块的设计与实现第35-40页
     ·算法描述与示例第35页
     ·词表描述与实现第35-37页
     ·Lucene 中文字典分词模块的实现第37-40页
   ·总结第40-41页
5 索引模块设计第41-48页
   ·索引第41-44页
   ·搜索第44-47页
     ·搜索算法第45页
     ·排序第45-47页
   ·小结第47-48页
6 实验第48-58页
   ·选择网站第48页
   ·Java 与 Internet 的连接技术第48-49页
     ·使用套接字第48-49页
     ·使用URL 类第49页
   ·Java 中的中文处理第49-50页
   ·Java 多线程机制第50页
   ·JDBC 应用第50-51页
   ·网络蜘蛛的实现第51-52页
   ·利用 Lucene 实现索引和搜索第52-54页
   ·相关的模块处理后结果第54-57页
     ·相关词库的建立第54-55页
     ·图像文件的存储和编码图第55页
     ·核心信息文件的下载存储结构第55-57页
   ·小结第57-58页
7 结论第58-60页
   ·总结第58-59页
   ·展望第59-60页
致谢第60-61页
参考文献第61-63页

论文共63页,点击 下载论文
上一篇:聚合物驱抽油机井参数优化设计研究
下一篇:细晶铝锭熔铸的3003及3004铝合金组织及力学性能研究