网络信息雷达系统的研究与设计

摘要	第1-8页
ABSTRACT	第8-9页
第一章绪论	第9-15页
·研究背景及课题来源	第9-10页
·研究背景	第9页
·课题来源	第9-10页
·课题研究的相关技术及研究现状	第10-13页
·课题研究的主要内容及成果	第13-14页
·论文的编写及组织	第14-15页
第二章搜索引擎技术概述	第15-21页
·搜索引擎概述	第15-16页
·常见搜索技术及分类	第16-18页
·搜索技术发展方向	第18页
·传统搜索在专业领域面临的问题	第18-20页
·小结	第20-21页
第三章网络信息雷达结构设计	第21-36页
·网络信息雷达	第21-23页
·什么是网络信息雷达	第21页
·网络信息雷达与传统搜索对比	第21-23页
·网络信息雷达的性能指标	第23页
·信息雷达的系统结构	第23-27页
·传统搜索引擎结构	第23-24页
·信息雷达设计目标	第24页
·设计原则	第24-25页
·系统结构	第25-27页
·信息监控与采集	第27-28页
·网站信息内容监控	第27页
·网站信息采集	第27-28页
·信息分析和处理	第28-32页
·信息的分析和标引	第28-30页
·信息的分类	第30-31页
·信息的组织和存储	第31-32页
·信息发布与检索	第32-33页
·用户接口	第32页
·信息检索	第32页
·搜索结果处理	第32-33页
·信息挖掘与服务	第33页
·系统完整设计结构	第33-35页
·小结	第35-36页
第四章网络信息雷达核心算法研究	第36-51页
·网页解析	第36-41页
·HTML 语言结构	第36-37页
·HTML 解析方法	第37-39页
·HTML 内容提取	第39-40页
·XML 内容的提取	第40-41页
·自动分类算法	第41-43页
·简单向量距离分类法	第41-42页
·贝叶斯算法	第42页
·KNN（K 最近邻居）算法	第42-43页
·支撑向量机（SVM）算法	第43页
·网页排序算法	第43-49页
·网页级别	第44页
·PageRank 算法研究	第44-48页
·其他算法	第48-49页
·中文分词算法	第49-50页
·亚洲语言的的切分词问题(Word Segment)	第49-50页
·常见分词算法	第50页
·小结	第50-51页
第五章信息雷达系统的实现	第51-69页
·程序编写环境	第51-52页
·JAVA 语言	第51页
·开发工具——Eclipse	第51-52页
·WEB 服务——TOMCAT	第52页
·网络蜘蛛的实现	第52-58页
·网络蜘蛛程序	第52-55页
·构造Spider 类	第55-56页
·处理和补全URL	第56-57页
·预防循环链路	第57-58页
·深度优先	第58页
·HTML 内容分析和提取	第58-62页
·通过网络获取HTML 内容	第58-60页
·分析和提取HTML 内容	第60-61页
·Java 中使用正则表达式	第61-62页
·基于lucene 创建索引	第62-64页
·什么是lucene	第62页
·lucene 和其他全文检索对比	第62-63页
·用lucene 创建索引	第63-64页
·使用Nutch 检索	第64-67页
·什么是Nutch	第64-65页
·使用Nutch 实现搜索	第65-67页
·项目实现	第67-68页
·小结	第68-69页
结束语	第69-71页
致谢	第71-72页
参考文献表	第72-76页
作者在学期间取得的学术成果	第76页