面向Web的敏感信息的筛查系统研究与实现

摘要	第4-5页
Abstract	第5页
第一章绪论	第8-14页
1.1 研究背景	第8-9页
1.2 国内外研究进展	第9-12页
1.2.1 信息抽取问题	第9-11页
1.2.2 网络爬虫	第11-12页
1.3 本文研究内容	第12-14页
第二章与搜索敏感信息相关的研究工作	第14-22页
2.1 搜索引擎技术概述	第14-16页
2.1.1 发展历程	第14-15页
2.1.2 分类及技术	第15-16页
2.1.3 发展方向	第16页
2.2 Web上信息采集问题的相关理论	第16-21页
2.2.1 Web信息抽取问题模型	第16-19页
2.2.2 Web信息抽取基本模式	第19-20页
2.2.3 Web信息抽取目标获取解决方法	第20-21页
2.3 本章小结	第21-22页
第三章系统设计框架和原理	第22-35页
3.1 基本结构和设计目标	第22-23页
3.2 爬取过程的研究	第23-29页
3.3 爬虫搜索策略选取	第29-32页
3.4 页面相关度	第32-34页
3.5 本章小结	第34-35页
第四章筛查原理与实现	第35-41页
4.1 文本聚类	第35-37页
4.2 分词的原理类型	第37-38页
4.3 语义分析	第38-40页
4.4 本章小结	第40-41页
第五章系统实现及展示	第41-49页
5.1 软件结构	第41-44页
5.2 实现展示	第44-48页
5.3 本章小结	第48-49页
第六章总结与展望	第49-50页
参考文献	第50-53页
作者简介及科研成果	第53-54页
致谢	第54页