首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

垂直搜索引擎中网络蜘蛛的设计与实现

摘要第1-6页
Abstract第6-10页
1 前言第10-18页
   ·选题的技术背景第10-11页
   ·网络文件搜索引擎的国内外现状第11-13页
     ·国外搜索引擎发展现状第11-12页
     ·国内搜索引擎发展现状第12-13页
   ·搜索引擎的发展历史和分类第13-15页
     ·搜索引擎发展历史第13-14页
     ·搜索引擎的分类第14-15页
   ·搜索引擎的发展趋势第15-16页
   ·课题研究的主要内容第16-18页
2 搜索引擎概述第18-32页
   ·数据挖掘的概念第18页
   ·垂直搜索引擎第18-20页
     ·垂直搜索引擎定义第18-19页
     ·垂直搜索引擎特点第19页
     ·垂直搜索引擎技术第19-20页
   ·搜索引擎的基本组成及其功能第20-21页
   ·网络蜘蛛Spider 工作原理第21-27页
     ·Spider 的概念和技术要点第21-22页
     ·超链接分析第22-24页
     ·Spider 传统搜索策略第24-27页
   ·网络蜘蛛系统模型第27-29页
     ·网络蜘蛛数据采集机制第28-29页
     ·网络蜘蛛对网页的标引处理第29页
   ·搜索引擎的性能评价指标第29-32页
3 页面解析和中文分词第32-38页
   ·Url 和Http第32-33页
     ·统一资源定位符第32页
     ·超文本传输协议第32-33页
   ·解析超文本标记语言第33-35页
     ·HTML 简介第33-34页
     ·HTML 标准化第34-35页
     ·搜索引擎中的页面解析第35页
   ·中文分词简介第35-38页
     ·中文分词的关键问题第35-36页
     ·中文分词算法分类第36-38页
4 图书网络蜘蛛的设计与实现第38-56页
   ·系统运行环境第38-39页
   ·软件开发环境第39页
   ·数据库设计第39页
   ·系统模块设计第39-51页
     ·Spider 系统搜索算法第39-40页
     ·系统总体模块设计第40-43页
     ·从HTML 中提取有用的数据信息第43-44页
     ·初始化模块设计第44-45页
     ·解析HTML第45-47页
     ·Url 队列存储第47-48页
     ·下载模块设计第48-49页
     ·多线程技术在Spider 中的应用第49-51页
   ·下载数据查重模块设计第51-52页
     ·界面设计第51-52页
     ·程序设计第52页
   ·实验结果分析第52-55页
   ·小结第55-56页
5 图书查询结果排序处理方法第56-66页
   ·检索结果排序的必要性第56-57页
   ·相关度影响因子第57页
   ·检索排序方法第57-59页
     ·向量空间模型的定义第57-58页
     ·基于向量空间的排序方法第58-59页
   ·Lucene 倒排文件索引结构第59-65页
     ·索引结构第59-60页
     ·倒排索引文件的设计原理第60-63页
     ·索引文件的实现第63-65页
   ·检索排序的实验结果第65-66页
6 结论与建议第66-67页
   ·主要结论第66页
   ·存在问题和建议第66-67页
致谢第67-68页
参考文献第68-70页
附件 攻读硕士学位期间发表的论文第70页

论文共70页,点击 下载论文
上一篇:论我国保险市场区域均衡发展--保险需求的视角
下一篇:悬臂挂梁式连续梁桥牛腿加固方法的研究