首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站敏感信息监视系统设计与实现

表目录第1-8页
图目录第8-9页
摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第11-17页
   ·课题研究背景及意义第11-12页
   ·课题相关技术国内外研究现状第12-15页
     ·Web页面采集技术第12-13页
     ·Web页面信息提取技术第13-14页
     ·敏感信息发现技术第14-15页
   ·系统研究目标及内容第15页
   ·论文结构安排第15-16页
   ·本章小结第16-17页
第二章 课题相关算法介绍第17-27页
   ·聚类算法分析第17-23页
     ·层次聚类法—AGNES算法第17-19页
     ·基于密度的聚类法—DBSCAN算法第19-20页
     ·划分聚类法—K均值和K中心点算法第20-23页
   ·相异度比较算法分析第23-24页
     ·明可夫斯基距离(Minkowski)第23页
     ·二次型距离(Quadratic)第23-24页
     ·Smith-Waterman距离算法第24页
   ·关键词匹配算法分析第24-25页
     ·Boyer-Moore算法(BM算法)第24-25页
     ·Wu-Manber算法第25页
   ·本章小结第25-27页
第三章 网站敏感信息监视系统设计第27-33页
   ·系统总体设计思想第27-28页
   ·系统体系架构设计第28-29页
   ·系统功能模块介绍第29-30页
     ·信息采集模块第29页
     ·信息抽取模块第29页
     ·信息报警模块第29-30页
   ·系统运行机制第30-32页
     ·信息采集模块运行机制第30-31页
     ·信息抽取模块的运行机制第31-32页
     ·信息报警模块运行机制第32页
   ·本章小结第32-33页
第四章 关键技术分析第33-43页
   ·Web链接挖掘第33-36页
     ·PageRank算法思想第33-34页
     ·算法简单实例第34-36页
   ·文本分类技术第36-40页
     ·分词技术第36-37页
     ·向量空间模型第37-39页
     ·确定文档向量相似性第39页
     ·系统页面文档分类基本思想第39页
     ·利用K中心点聚类算法实现页面分类第39-40页
   ·页面数据信息抽取第40-42页
     ·HTML页面解析第40页
     ·数据区域划分第40-42页
   ·敏感信息快速匹配第42页
   ·本章小结第42-43页
第五章 网站敏感信息监视系统实现第43-56页
   ·系统数据库的设计第43-45页
   ·网站信息采集模块实现第45-47页
     ·单个网站页面采集第45-46页
     ·多线程控制第46-47页
     ·计算页面权重第47页
   ·文本分类模块实现第47-55页
     ·分词处理程序第47-48页
     ·K中心点聚类算法的优化第48-49页
     ·页面文档分类过程第49-50页
     ·向量空间模型和聚类程序实现第50-51页
     ·标签结构树的优化第51-52页
     ·Smith-Waterman算法优化第52-53页
     ·数据区域抽取第53-55页
   ·信息报警模块实现第55页
   ·重新采集的方案实现第55页
   ·本章小结第55-56页
第六章 性能评测第56-59页
   ·系统测试环境第56页
   ·信息采集查全率测试第56-57页
   ·信息抽取准确率测试第57-58页
   ·信息报警测试第58页
   ·本章总结第58-59页
结束语第59-61页
参考文献第61-64页
作者简历 攻读硕士学位期间完成的主要工作第64页

论文共64页,点击 下载论文
上一篇:基于灰色理论的DCT域信息隐藏技术研究
下一篇:教育信息网中的统一认证授权平台研究与实现