首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于路径摘要的链接信息提取系统的研究与设计

摘要第4-6页
Abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景第10-11页
    1.2 相关工作第11-13页
    1.3 本文主要研究内容第13-14页
    1.4 本文结构第14-16页
第2章 概念与理论第16-24页
    2.1 包装器与Web信息提取第16-17页
    2.2 同质信息结构样式唯一性第17页
    2.3 路径摘要与路径节点名序列第17-19页
    2.4 信息提取问题的转化第19-20页
    2.5 基于路径摘要的信息提取系统第20-22页
        2.5.1 目标路径摘要节点的定位第20-21页
        2.5.2 基于路径摘要的信息提取方法第21-22页
    2.6 适用场景第22页
    2.7 链接信息提取第22-23页
    2.8 本章小结第23-24页
第3章 人工提取方法的设计第24-34页
    3.1 页面呈现与信息标注的设计第24-25页
    3.2 人工提取器的架构设计第25页
    3.3 人工提取器的实现第25-32页
        3.3.1 标注逻辑的实现第26-30页
        3.3.2 原始页面的处理第30-32页
        3.3.3 规则的持久化第32页
    3.4 本章小结第32-34页
第4章 机器提取方法的设计第34-42页
    4.1 处理步骤第34页
    4.2 摘要树节点分类第34-40页
        4.2.1 样本表示第34-35页
        4.2.2 特征设计第35页
        4.2.3 摘要树的构建第35-39页
        4.2.4 数据集生成第39页
        4.2.5 模型选择与分类方法的改进第39-40页
    4.3 本章小结第40-42页
第5章 系统的完善与优化第42-48页
    5.1 结构化数据的提取第42-43页
    5.2 标签a校准优化第43-44页
    5.3 关键字过滤优化第44-45页
    5.4 人工提取与机器提取的整合第45-46页
    5.5 应用程序编程接口的设计第46-47页
    5.6 本章小结第47-48页
第6章 实验与评估第48-54页
    6.1 同质信息结构样式唯一性的验证第48-50页
        6.1.1 实验方法第48-49页
        6.1.2 实验结果与分析第49-50页
    6.2 链接信息提取系统的评估与分析第50-53页
        6.2.1 机器提取方法的评估第50-51页
        6.2.2 人工提取方法的评估第51-53页
    6.3 本章小结第53-54页
结论第54-56页
参考文献第56-60页
攻读硕士学位期间发表的学术论文第60-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:企业合同评审系统的分析与设计
下一篇:云计算环境下可验证矩阵安全外包计算研究