首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于DOM树节点重要度的WEB主题信息提取研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第8-16页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状第9-13页
        1.2.1 国外研究现状第10页
        1.2.2 国内研究现状第10-13页
    1.3 目前研究成果的不足第13-14页
    1.4 研究主要内容及目标第14页
    1.5 文章的组织结构第14-16页
第2章 WEB信息提取技术综述第16-26页
    2.1 WEB信息提取的发展第16页
    2.2 WEB信息提取的分类第16-19页
        2.2.1 基于自然语言处理的WEB信息抽取第17页
        2.2.2 基于包装器的WEB信息提取第17-18页
        2.2.3 基于ontology的WEB信息提取第18-19页
        2.2.4 基于HTML结构的信息提取第19页
    2.3 HTML概述第19-20页
        2.3.1 HTML编写规范第19-20页
    2.4 XML语言第20-21页
    2.5 DOM概述第21-24页
        2.5.1 DOM节点第22-23页
        2.5.2 DOM接口第23-24页
    2.6 WEB信息提取评价指标第24-25页
    2.7 本章小结第25-26页
第3章 基于DOM树节点重要度的扩展DOM模型第26-34页
    3.1 HTML标签第26-27页
        3.1.1 HTML标签类型第26-27页
        3.1.2 文本信息第27页
    3.2 扩展DOM树模型第27-33页
        3.2.1 DOM树节点重要度的定义第28页
        3.2.2 DOM树节点的扩展第28-29页
        3.2.3 扩展DOM树的构建第29-33页
    3.3 本章小结第33-34页
第4章 基于扩展DOM树的WEB主题信息提取方法第34-47页
    4.1 页面预处理第36-37页
    4.2 生成扩展DOM树第37-40页
    4.3 扩展DOM树模型去噪第40-42页
    4.4 主题信息提取第42-46页
    4.5 本章小结第46-47页
第5章实验分析及系统原型第47-58页
    5.1 实验环境第47页
    5.2 重要度阈值分析第47-50页
    5.3 提取效果评价第50-52页
    5.4 系统原型展示第52-56页
    5.5 本章小结第56-58页
第6章 总结和展望第58-60页
    6.1 工作总结第58-59页
    6.2 未来工作第59-60页
参考文献第60-63页
致谢第63-64页
攻读硕士学位期间公开发表的论文第64页

论文共64页,点击 下载论文
上一篇:碳纤维/有机无机杂化材料的制备与水溶性硫化物的催化氧化
下一篇:基于胍盐和吡唑鎓盐的侧链型阴离子交换膜的合成与性能研究