首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎框架的设计与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·课题的背景第7页
   ·搜索引擎的发展历史第7-8页
   ·垂直搜索引擎的特点第8-9页
   ·本文的研究工作和组织第9-11页
第二章 垂直搜索引擎的基本原理和相关技术的研究现状第11-27页
   ·网络资源的获取技术第11-14页
     ·网络爬虫的基本原理第11页
     ·垂直搜索引擎中的网络爬虫第11-12页
     ·主题判别技术第12-14页
   ·网页分析算法第14-16页
     ·基于网络拓扑的分析算法第14-16页
     ·基于网页内容的网页分析算法第16页
     ·基于用户访问行为的网页分析算法第16页
   ·全文索引的基本原理第16-18页
     ·索引中的内容第17-18页
     ·如何创建索引第18页
     ·如何对索引进行搜索第18页
   ·中文分词技术第18-25页
     ·基于字符串匹配的分词方法第19-20页
     ·基于理解的分词方法第20页
     ·基于统计的分词方法第20-23页
     ·基于既定词表的自适应分词方法第23-24页
     ·分词中的难题第24-25页
   ·本章小节第25-27页
第三章 框架的总体设计第27-37页
   ·设计思想第27-28页
   ·框架的体系结构第28-29页
   ·网络爬虫的设计第29-33页
     ·相关概念的定义第29-31页
     ·URL 提取器第31页
     ·更新去重策略第31-32页
     ·多线程抓取第32-33页
   ·数据处理器第33页
   ·框架的包结构设计第33-35页
   ·框架的容错能力第35页
   ·框架的资源扩展能力第35页
   ·本章小节第35-37页
第四章 框架的实现实例第37-51页
   ·系统主题的选择第37页
   ·主题 URL 数据库第37-38页
   ·URL 提取器第38页
   ·数据处理器第38-40页
     ·HTML 网页内容的处理第38-39页
     ·其他格式文件的处理第39-40页
   ·XML 与 properties 属性文件的设置第40-41页
   ·索引器第41-45页
     ·Lucene 的全文索引的基本原理第41-42页
     ·Lucene 的索引创建过程第42-43页
     ·Lucene 的索引搜索过程第43-44页
     ·Lucene 的包结构第44页
     ·中文分词工具第44-45页
   ·数据库的选择第45页
   ·用户接口的实现第45-46页
     ·web 应用程序第45-46页
     ·web 应用服务器第46页
   ·系统最后的实现界面第46-49页
   ·本章小结第49-51页
第五章 总结与展望第51-53页
   ·工作总结第51页
   ·展望第51-53页
致谢第53-55页
参考文献第55-57页

论文共57页,点击 下载论文
上一篇:高速公路监控中心软件系统的设计与实现
下一篇:基于同义词替换的隐蔽传输系统的研究与应用