首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网业务重组与内容提取

摘要第4-5页
ABSTRACT第5页
第一章 绪论第10-14页
    1.1 研究背景第10-11页
    1.2 研究意义第11页
    1.3 研究现状第11-12页
    1.4 论文结构第12-14页
第二章 网络应用理论及技术第14-24页
    2.1 网络应用分类第14-16页
        2.1.1 信息获取类应用第14页
        2.1.2 商务交易类应用第14-15页
        2.1.3 交流沟通类应用第15页
        2.1.4 网络娱乐类应用第15-16页
    2.2 HTML语言第16-19页
        2.2.1 背景概述第16页
        2.2.2 主要功能第16-17页
        2.2.3 基本结构第17-19页
    2.3 文档对象模型第19-20页
    2.4 关键技术简介第20-23页
    2.5 本章小结第23-24页
第三章 网络业务重组设计与实现第24-46页
    3.1 业务数据包重组第24-26页
        3.1.1 数据传输过程第24-25页
        3.1.2 数据包重组过程第25-26页
    3.2 TCP会话重组第26-37页
        3.2.1 TCP报文字段分析第26-28页
        3.2.2 TCP会话分析第28-29页
        3.2.3 TCP重组原理第29-32页
        3.2.4 TCP重组实现第32-37页
    3.3 HTTP数据还原第37-44页
        3.3.1 HTTP协议分析第37-40页
        3.3.2 HTTP数据包处理第40-41页
        3.3.3 HTTP报文解压缩第41-42页
        3.3.4 HTTP chunked解码第42-44页
    3.4 本章小结第44-46页
第四章 基于正则表达式的论坛信息提取第46-58页
    4.1 通用论坛系统第46-49页
        4.1.1 Phpwind第46-47页
        4.1.2 Dvbbs第47页
        4.1.3 Discuz!第47-48页
        4.1.4 Bbsmax第48页
        4.1.5 LeadBBS第48页
        4.1.6 SiteServer BBS第48-49页
    4.2 论坛特征分析第49-51页
        4.2.1 请求行字段第49页
        4.2.2 内容类型描述字段第49-50页
        4.2.3 Cookie字段第50页
        4.2.4 消息实体描述字段第50-51页
    4.3 正则表达式概述第51-54页
        4.3.1 正则表达式匹配第51-52页
        4.3.2 论坛指纹特征第52-54页
    4.4 论坛审计第54-57页
        4.4.1 论坛审计流程第54-55页
        4.4.2 论坛审计展示第55-57页
    4.5 本章小结第57-58页
第五章 基于DOM的网页信息提取第58-76页
    5.1 基于DOM树的信息提取方法分析第58页
    5.2 软件版本跟踪模块概述第58-61页
        5.2.1 需求分析第58-59页
        5.2.2 版本跟踪原理第59-61页
    5.3第61-68页
        5.3.1 网页预处理第61-65页
        5.3.2 创建DOM树第65-67页
        5.3.3 数据存储第67-68页
    5.4 软件版本数据分析第68-69页
    5.5 网页数据分析第69-73页
        5.5.1 网页DOM树第69-71页
        5.5.2 页面分析第71-73页
    5.6 基于DOM树的信息提取分析第73-74页
    5.7 本章小结第74-76页
第六章 总结和展望第76-78页
参考文献第78-80页
致谢第80-82页
攻读学位期间发表的学术论文目录第82页

论文共82页,点击 下载论文
上一篇:基于认知模式的CGA基元拓扑关系建模的模式识别方法研究
下一篇:基于支持向量机的克隆代码有害性评价方法研究