首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于主题的网络蜘蛛的设计与实现

中文摘要第1-6页
ABSTRACT第6-9页
1 引言第9-16页
   ·基于主题的网络蜘蛛第11-13页
   ·主题蜘蛛的研究与发展现况第13-14页
   ·本文的主要工作第14页
   ·本文将内容主要组织为六个部分:第14-16页
2 相关技术第16-30页
   ·主题蜘蛛的搜索策略第16-20页
     ·基于文字内容评价的搜索策略第16-17页
     ·基于链接结构评价的搜索策略第17-19页
     ·基于分类器评价的搜索策略第19页
     ·三种主题搜索策略比较第19-20页
   ·相关度计算第20-22页
     ·向量空间模型第20-21页
     ·基于关键词的相关度计算第21-22页
     ·基于概念的相关度计算第22页
   ·网页信息提取技术第22-27页
     ·HTML语言第23-24页
     ·标签树第24页
     ·HTML内容分块技术第24-26页
     ·正文块提取第26-27页
   ·中文分词第27-29页
     ·基于字典的分词方法第27-28页
     ·基于词频统计的分词方法第28-29页
   ·本章小结第29-30页
3 基于主题的蜘蛛概要设计第30-38页
   ·系统概述第30页
     ·系统目标第30页
     ·需求描述第30页
   ·总体设计第30-34页
     ·基本设计概念第30页
     ·系统流程第30-31页
     ·系统总体结构第31-32页
     ·模块功能分配第32-34页
   ·接口设计第34-35页
     ·外部接口第34页
     ·内部接口第34-35页
   ·数据库设计第35-37页
   ·本章小结第37-38页
4 主题蜘蛛实现细节第38-48页
   ·控制模块第38-40页
   ·爬行模块第40-43页
     ·爬行线程第40-42页
     ·重复检测第42-43页
   ·存储模块第43-44页
   ·过滤模块第44-47页
     ·相关度计算第44-45页
     ·中文分词第45-47页
   ·本章小结第47-48页
5 主题蜘蛛性能分析第48-50页
   ·本章小结第49-50页
6 主题词典第50-52页
   ·主题词典的建立第50-51页
   ·主题词典的维护第51页
   ·本章小结第51-52页
7 结论第52-53页
参考文献第53-54页
索引第54-55页
作者简历第55-57页
学位论文数据集第57页

论文共57页,点击 下载论文
上一篇:有机氯化物滴滴涕降解研究
下一篇:基于SIP的远程视频监控系统的设计与实现