首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于标签路径特征系的Web新闻内容抽取方法研究

致谢第7-8页
摘要第8-9页
ABSTRACT第9-10页
第一章 绪论第15-25页
    1.1 研究背景、目的及意义第15-16页
    1.2 Web新闻内容抽取第16-22页
        1.2.1 Web新闻内容抽取难点第16-17页
        1.2.2 Web信息抽取技术第17-21页
        1.2.3 Web新闻内容抽取的评价体系第21-22页
    1.3 研究内容第22-24页
        1.3.1 课题来源第22页
        1.3.2 本文研究思路和主要研究内容第22-23页
        1.3.3 内容组织第23-24页
    1.4 本章小结第24-25页
第二章 基于文本标签路径比的Web新闻内容抽取方法第25-43页
    2.1 概述第25页
    2.2 文本标签路径比第25-31页
        2.2.1 DOM树及标签路径第26-27页
        2.2.2 文本标签路径比第27-30页
        2.2.3 扩展文本标签路径比第30-31页
    2.3 基于文本标签路径比的Web新闻内容抽取方法第31-35页
        2.3.1 阈值设置第31-32页
        2.3.2 基于标签路径编辑距离的加权高斯平滑第32-34页
        2.3.3 抽取算法CEPR第34-35页
    2.4 实验结果第35-41页
        2.4.1 实验数据集第35-36页
        2.4.2 阈值参数设置第36-37页
        2.4.3 平滑调节参数a设置第37-38页
        2.4.4 CEPR算法抽取性能评估第38-39页
        2.4.5 与CETR方法的对比实验第39-40页
        2.4.6 实验结果分析第40-41页
    2.5 本章小结第41-43页
第三章 基于DS证据理论融合特征的Web新闻内容抽取方法第43-57页
    3.1 概述第43页
    3.2 标签路径特征系及其分析第43-48页
        3.2.1 标签路径特征系第43-46页
        3.2.2 标签路径特征分析第46-48页
    3.3 基于DS证据理论融合特征的Web新闻网页抽取方法第48-51页
        3.3.1 DS证据理论简介第48页
        3.3.2 基于DS证据理论的特征融合第48-50页
        3.3.3 抽取算法CEPC第50-51页
    3.4 实验结果第51-56页
        3.4.0 实验数据集及性能评估指标第51页
        3.4.1 CEPC算法抽取性能评估第51-54页
        3.4.2 与CEPR方法的对比实验第54-55页
        3.4.3 实验结果分析第55-56页
    3.5 本章小结第56-57页
第四章 基于组合特征选择的Web新闻内容抽取方法第57-65页
    4.1 概述第57页
    4.2 组合特征选择第57-59页
        4.2.1 特征间相关性度量第58-59页
        4.2.2 组合特征选择策略第59页
    4.3 基于组合特征选择的Web新闻内容抽取方法第59-62页
        4.3.1 特征融合第59-61页
        4.3.2 抽取算法CEPF第61-62页
    4.4 实验结果第62-64页
        4.4.1 CEPF算法抽取性能评估第62-63页
        4.4.2 实验比较第63页
        4.4.3 阈值对抽取性能的影响第63-64页
    4.5 本章小结第64-65页
第五章 基于标签路径特征系的Web新闻内容抽取原型系统第65-69页
    5.1 概述第65页
    5.2 系统模型第65-66页
    5.3 系统运行效果第66-68页
    5.4 本章小结第68-69页
第六章 总结与展望第69-71页
    6.1 总结第69-70页
    6.2 展望第70-71页
参考文献第71-76页
攻读学位期间的学术活动及成果情况第76-77页

论文共77页,点击 下载论文
上一篇:基于ISO管理体系的设备管理系统设计与实现
下一篇:基于Spring MVC框架和TRBAC访问控制模型的工作流系统的设计