网站敏感信息监视系统设计与实现

表目录	第1-8页
图目录	第8-9页
摘要	第9-10页
ABSTRACT	第10-11页
第一章绪论	第11-17页
·课题研究背景及意义	第11-12页
·课题相关技术国内外研究现状	第12-15页
·Web页面采集技术	第12-13页
·Web页面信息提取技术	第13-14页
·敏感信息发现技术	第14-15页
·系统研究目标及内容	第15页
·论文结构安排	第15-16页
·本章小结	第16-17页
第二章课题相关算法介绍	第17-27页
·聚类算法分析	第17-23页
·层次聚类法—AGNES算法	第17-19页
·基于密度的聚类法—DBSCAN算法	第19-20页
·划分聚类法—K均值和K中心点算法	第20-23页
·相异度比较算法分析	第23-24页
·明可夫斯基距离(Minkowski)	第23页
·二次型距离(Quadratic)	第23-24页
·Smith-Waterman距离算法	第24页
·关键词匹配算法分析	第24-25页
·Boyer-Moore算法(BM算法)	第24-25页
·Wu-Manber算法	第25页
·本章小结	第25-27页
第三章网站敏感信息监视系统设计	第27-33页
·系统总体设计思想	第27-28页
·系统体系架构设计	第28-29页
·系统功能模块介绍	第29-30页
·信息采集模块	第29页
·信息抽取模块	第29页
·信息报警模块	第29-30页
·系统运行机制	第30-32页
·信息采集模块运行机制	第30-31页
·信息抽取模块的运行机制	第31-32页
·信息报警模块运行机制	第32页
·本章小结	第32-33页
第四章关键技术分析	第33-43页
·Web链接挖掘	第33-36页
·PageRank算法思想	第33-34页
·算法简单实例	第34-36页
·文本分类技术	第36-40页
·分词技术	第36-37页
·向量空间模型	第37-39页
·确定文档向量相似性	第39页
·系统页面文档分类基本思想	第39页
·利用K中心点聚类算法实现页面分类	第39-40页
·页面数据信息抽取	第40-42页
·HTML页面解析	第40页
·数据区域划分	第40-42页
·敏感信息快速匹配	第42页
·本章小结	第42-43页
第五章网站敏感信息监视系统实现	第43-56页
·系统数据库的设计	第43-45页
·网站信息采集模块实现	第45-47页
·单个网站页面采集	第45-46页
·多线程控制	第46-47页
·计算页面权重	第47页
·文本分类模块实现	第47-55页
·分词处理程序	第47-48页
·K中心点聚类算法的优化	第48-49页
·页面文档分类过程	第49-50页
·向量空间模型和聚类程序实现	第50-51页
·标签结构树的优化	第51-52页
·Smith-Waterman算法优化	第52-53页
·数据区域抽取	第53-55页
·信息报警模块实现	第55页
·重新采集的方案实现	第55页
·本章小结	第55-56页
第六章性能评测	第56-59页
·系统测试环境	第56页
·信息采集查全率测试	第56-57页
·信息抽取准确率测试	第57-58页
·信息报警测试	第58页
·本章总结	第58-59页
结束语	第59-61页
参考文献	第61-64页
作者简历攻读硕士学位期间完成的主要工作	第64页