首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Word文档解析及脱敏技术研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第11-17页
    1.1 课题研究背景及意义第11-13页
    1.2 国内外研究现状第13-15页
        1.2.1 Word文本解析技术研究现状第13-14页
        1.2.2 文本内容信息脱敏技术研究现状第14-15页
    1.3 论文主要工作及内容安排第15-17页
第2章 Word文本内容解析技术研究第17-35页
    2.1 引言第17页
    2.2 复合文档格式分析第17-24页
        2.2.1 仓库和流第17-18页
        2.2.2 扇区和扇区链第18-19页
        2.2.3 复合文档头第19-20页
        2.2.4 扇区偏移第20-21页
        2.2.5 扇区分配第21-22页
        2.2.6 短流第22-24页
    2.3 DOC文件二进制结构第24-29页
        2.3.1 FIB结构第24-27页
        2.3.2 Clx结构第27-28页
        2.3.3 Plc及PlcPcd结构第28页
        2.3.4 字符及字符位置第28-29页
        2.3.5 Pcd结构第29页
    2.4 DOC文档解析第29-32页
        2.4.1 读取判别DOC文档流第29页
        2.4.2 DOC对象信息读取第29-30页
        2.4.3 从DOC文档提取文本内容流程第30-32页
        2.4.4 从DOC文档提取摘要信息流程第32页
    2.5 DOCX文档解析第32-34页
        2.5.1 DOCX文档格式第32-33页
        2.5.2 DOCX文档内容解析第33-34页
    2.6 本章小结第34-35页
第3章 关键词匹配算法研究第35-51页
    3.1 引言第35页
    3.2 经典模式匹配算法第35-40页
        3.2.1 BF算法第35-36页
        3.2.2 KMP算法第36-37页
        3.2.3 BM算法第37-39页
        3.2.4 BMH算法第39-40页
    3.3 BMHS匹配算法及其改进算法模型第40-48页
        3.3.1 BMHS匹配算法模型第40-41页
        3.3.2 改进算法模型Ⅰ第41-43页
        3.3.3 改进算法模型Ⅱ第43-45页
        3.3.4 实验结果及分析第45-48页
    3.4 基于Word2vec的文本敏感词相似匹配第48-50页
        3.4.1 词向量第48页
        3.4.2 NNLM第48-49页
        3.4.3 Word2vec训练模型第49-50页
        3.4.4 敏感词相似匹配第50页
    3.5 本章小结第50-51页
第4章 Word文本内容脱敏系统实现第51-68页
    4.1 引言第51页
    4.2 Word脱敏流程及总体架构设计第51-53页
        4.2.1 Word文本内容脱敏网络拓扑图第51-52页
        4.2.2 Word文本内容脱敏流程第52-53页
    4.3 HTTP协议原理第53-55页
        4.3.1 HTTP报文请求头部和请求格式第54-55页
        4.3.2 HTTP报文响应头部和响应格式第55页
    4.4 脱敏系统中HTTP协议具体分析第55-57页
        4.4.1 请求报文中的“Accept-Encoding:gzip\r\n”第55页
        4.4.2 请求报文中的“Range:3546-775684\r\nIf-Range:....\r\n\r\n”第55-56页
        4.4.3 响应报文中的“Content-Type”第56页
        4.4.4 响应报文中的“Content-Length:”第56页
        4.4.5 HTTP协议解析流程第56-57页
    4.5 脱敏系统功能模块分析第57-63页
        4.5.1 TCP反向代理与日志系统模块第58-59页
        4.5.2 HTTP协议解析模块第59页
        4.5.3 Word文本内容解析及脱敏模块第59-62页
        4.5.4 界面系统第62-63页
    4.6 测试分析第63-67页
        4.6.1 Word文档脱敏测试第63-65页
        4.6.2 Word文档脱敏压力测试第65-67页
    4.7 本章小结第67-68页
结论第68-69页
致谢第69-70页
参考文献第70-74页
攻读硕士期间发表的论文及科研成果第74页

论文共74页,点击 下载论文
上一篇:基于Unity3D技术的路标学习游戏软件的设计与开发研究
下一篇:基于深度分割网络的高速公路监控视频雨天检测算法研究