首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息内容变化检测技术研究与实现

摘要第1-7页
Abstract第7-9页
目录第9-11页
第1章 绪论第11-18页
   ·课题研究意义第11-13页
   ·国内外现状分析第13-16页
     ·Web信息提取第13页
     ·变化检测算法第13-14页
     ·网页变化频率的估测第14-15页
     ·增量采集系统与网页检测工具第15-16页
   ·本文研究内容第16页
   ·论文结构安排第16页
   ·本章小结第16-18页
第2章 Web信息内容变化检测技术研究第18-29页
   ·Web信息内容变化检测关键技术第18-23页
     ·网页变化检测策略第18-19页
     ·网页变化频率估测方法第19-21页
     ·网页变化检测技术分类第21-23页
   ·Web信息提取第23-26页
     ·基于数据挖掘的网页正文提取技术第25页
     ·基于包装器的网页正文提取技术第25页
     ·基于统计的网页正文提取技术第25-26页
   ·Web信息内容变化检测相关的支持技术第26-28页
     ·DOM第26页
     ·XPath第26-27页
     ·Eclipse RCP第27页
     ·SWT Designer第27-28页
   ·本章小结第28-29页
第3章 Web信息内容变化检测方案的设计第29-38页
   ·问题的提出第29页
   ·解决方案的总体架构第29-32页
   ·基于统计的网页正文提取方法第32-33页
   ·基于文档树结构的变化检测方法第33-34页
   ·基于网页历史数据窗口的频率估测方法第34页
   ·数据库设计第34-37页
   ·本章小结第37-38页
第4章 Web信息内容变化检测方案的具体实现第38-62页
   ·Web页面的预处理第38-43页
     ·html文档清洗第39-40页
     ·中文字符编码类型获取第40-42页
     ·html文档解析第42-43页
   ·网页正文定位第43-48页
     ·网页页面布局第43-44页
     ·网页类型判断第44页
     ·基于文本密度的正文定位第44-47页
     ·XPath定位节点方法第47-48页
   ·定制检测信息第48-50页
   ·基于网页摘要编码的网页变化检测第50-59页
     ·网页摘要编码第51-56页
     ·基于网页摘要编码的网页结构比较第56-57页
     ·基于网页摘要编码的网页内容比较第57-58页
     ·网页变化频率的估计与网页最新修改时间更新第58-59页
   ·网页信息的读取和存储第59-60页
   ·变化标记和显示第60-62页
第5章 Web信息内容变化检测系统与实验第62-69页
   ·系统界面介绍第62-65页
   ·实验结果及分析第65-69页
     ·正文节点的定位实验及结果分析第65-66页
     ·网页摘要编码实验及结果分析第66-67页
     ·页内容变化检测实验及结果分析第67-69页
第6章 总结和展望第69-71页
   ·总结第69-70页
   ·展望第70-71页
致谢第71-72页
参考文献第72-76页
攻读硕士学位期间发表的论文第76页

论文共76页,点击 下载论文
上一篇:高端路由器POS接口卡与主控卡间通信协议的设计与实现
下一篇:基于网络爬虫的跨站脚本漏洞动态检测技术研究