首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络文本信息采集分析关键技术研究与实现

表目录第1-8页
图目录第8-9页
摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第11-15页
   ·课题的研究背景和意义第11页
   ·研究现状与发展趋势第11-13页
   ·课题主要研究内容和论文框架第13-14页
   ·本章小结第14-15页
第二章 网络文本信息采集分析技术第15-26页
   ·HTTP协议下的网络通信机制第15-19页
     ·HTTP协议的网络通信流程第15-16页
     ·HTTP的报文结构第16-17页
     ·HTTP协议的核心——请求和响应消息第17-19页
   ·Web数据采集技术第19-22页
     ·Web数据采集的基本原理第19-20页
     ·聚焦爬虫技术的工作原理第20-21页
     ·两种Web数据采集策略第21-22页
   ·文本分类技术第22-25页
     ·文本分类技术基本原理第22-24页
     ·KNN分类器第24页
     ·SVM分类器第24-25页
   ·本章小结第25-26页
第三章 Web文本信息抽取技术研究与实现第26-46页
   ·Web页面语法组织形式和分析技术研究第26-32页
     ·HTML语法分析第26-27页
     ·基于HTML的Web文档解析算法第27-32页
   ·Web页面分块技术研究第32-33页
     ·VIPS算法第32页
     ·基于DOM树的方法第32-33页
   ·基于VIPS算法的DOM树算法设计与实现第33-45页
     ·Web文档DOM树结构研究第33-35页
     ·Web页面的基于视觉的内容结构描述第35-37页
     ·基于VIPS算法的DOM树算法描述第37-43页
     ·基于VIPS算法的DOM树的信息块识别和提取的实现流程第43-44页
     ·试验结果与分析第44-45页
   ·本章小结第45-46页
第四章 网页文本信息更新自动检测技术研究与实现第46-56页
   ·网页更新检测算法第46-47页
     ·基于HTML数据流的匹配策略第46页
     ·基于网页对象的匹配策略第46-47页
   ·基于Web页面信息块的更新检测算法设计与实现第47-55页
     ·算法总体设计思想第47页
     ·检测算法的实现流程第47-54页
     ·算法性能分析第54-55页
   ·本章小结第55-56页
第五章 网页排序算法研究与实现第56-65页
   ·网页排序算法分析第56-59页
     ·基于超链接的网页排序算法第56-58页
     ·基于超链接和内容的网页排序算法第58-59页
   ·基于网页分块技术的改进HITS算法第59-64页
     ·BHITS算法设计第60页
     ·BHITS算法流程及实现第60-62页
     ·算法试验结果与分析第62-64页
   ·本章小结第64-65页
第六章 网页文本信息采集分析系统设计与实现第65-69页
   ·系统设计概述第65-66页
     ·总体设计思想第65页
     ·设计原则和主要设计指标第65-66页
   ·系统体系结构第66-67页
   ·本课题涉及的关键技术第67-68页
   ·本章小结第68-69页
结束语第69-71页
参考文献第71-74页
附录A 网络文本信息采集处理系统相关界面第74-76页
作者简历 攻读硕士学位期间完成的主要工作第76-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:基于SDO的数据集成的研究与实现
下一篇:JPEG图像隐写分析技术研究