首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于信息熵的Web信息抽取技术研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第13-18页
    1.1 研究背景第13-14页
    1.2 国内外研究现状第14-16页
    1.3 本文研究内容第16-17页
    1.4 本文组织第17-18页
第二章 Web信息抽取技术概述第18-25页
    2.1 Web信息抽取发展历史第18-19页
    2.2 Web信息抽取评价标准第19-20页
    2.3 Web信息抽取相关工作第20-24页
        2.3.1 根据自动化程度分类第20-22页
        2.3.2 根据技术路线分类第22-24页
    2.4 本章小结第24-25页
第三章 Web文档与信息熵第25-33页
    3.1 Web文档中的噪声信息第25-28页
    3.2 信息熵概述第28-30页
        3.2.1 信息熵第28-29页
        3.2.2 最大熵原理第29-30页
    3.3 Web文档中的信息熵第30-32页
    3.4 本章小结第32-33页
第四章 基于信息熵的Web抽取方法第33-45页
    4.1 Web文档预处理第33-39页
        4.1.1 Web文档表示形式第33-37页
        4.1.2 叶子节点分块聚集第37-39页
    4.2 基于信息熵的抽取方法第39-44页
        4.2.1 关键词熵第39页
        4.2.2 叶子节点熵第39-42页
        4.2.3 ADMJ标准用于噪声消除第42-44页
    4.3 本章小结第44-45页
第五章 实验与结果第45-53页
    5.1 数据集描述第45-47页
        5.1.1 URL及子集划分第45-46页
        5.1.2 数据集第46-47页
    5.2 实验与结果第47-52页
        5.2.1 本文抽取方法实验第47-48页
        5.2.2 与其它标准对比实验第48-49页
        5.2.3 与其它方法对比实验第49-50页
        5.2.4 阈值选择实验第50-52页
    5.3 本章小结第52-53页
结论第53-54页
参考文献第54-58页
攻读学位期间发表的论文第58-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于可拓数据挖掘的客户价值分析软件设计与实现
下一篇:基于数据挖掘技术的旅行社市场营销策略研究