首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向煤矿安全事件的Web信息抽取技术研究与应用

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-15页
    1.1 课题背景与意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 课题主要工作第12-13页
    1.4 论文组织结构第13-15页
第2章 Web信息抽取相关技术概述第15-27页
    2.1 Web相关技术第15-18页
        2.1.1 Web结构第15页
        2.1.2 Web相关技术第15-18页
    2.2 Web信息抽取技术第18-25页
        2.2.1 Web信息抽取概述第18-20页
        2.2.2 Web信息抽取方法分类第20-25页
    2.3 Web信息抽取方法评价指标第25-26页
    2.4 本章小结第26-27页
第3章 Web页面清洗及主题提取研究第27-47页
    3.1 噪音数据分析第27-29页
    3.2 Web网页清洗技术分析第29-30页
    3.3 煤矿安全事件网页清洗第30-36页
        3.3.1 规范化HTML标签第31-34页
        3.3.2 精简XHTML标签第34-35页
        3.3.3 构造HTML结构树第35-36页
    3.4 基于中介真值程度度量的页面主题提取第36-46页
        3.4.1 中介真值程度度量第36-39页
        3.4.2 页面主题特征分析第39-42页
        3.4.3 提取算法第42-45页
        3.4.4 实验第45-46页
    3.5 本章小结第46-47页
第4章 基于页面主题和DOM的Web信息抽取研究第47-61页
    4.1 抽取规则的建立第47-54页
        4.1.1 基于路径建立抽取规则第47-50页
        4.1.2 基于特征比较法建立抽取规则第50-54页
    4.2 基于主题和DOM的信息抽取第54-56页
    4.3 煤矿安全事件正文信息抽取第56-60页
        4.3.1 煤矿安全事件文本的特点分析第57页
        4.3.2 煤矿安全事件的信息抽取第57-60页
    4.4 本章小结第60-61页
第5章 煤矿安全事件信息抽取系统设计与实现第61-73页
    5.1 系统需求分析与系统架构第61-63页
        5.1.1 系统需求分析第61-62页
        5.1.2 系统架构第62-63页
    5.2 系统设计与实现第63-67页
        5.2.1 页面清洗第64页
        5.2.2 页面主题内容提取第64-66页
        5.2.3 记录信息抽取第66页
        5.2.4 正文信息抽取第66-67页
        5.2.5 信息存储第67页
    5.3 系统界面第67-69页
    5.4 实验及结果分析第69-72页
    5.5 本章小结第72-73页
结论第73-75页
参考文献第75-79页
攻读硕士学位期间发表的学术论文第79-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:脂肪酸β-葡聚糖酯的合成与特性研究
下一篇:基于相移自振荡控制的逆变器设计