首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向多源数据的信息抽取方法研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-14页
    1.1 研究背景、目的与意义第9-11页
        1.1.1 研究背景第9-10页
        1.1.2 研究目的第10页
        1.1.3 研究意义第10-11页
    1.2 本文工作第11-12页
    1.3 本文结构第12-14页
第2章 相关工作第14-25页
    2.1 竞争对手和竞争挖掘第14-17页
        2.1.1 竞争对手分析第14页
        2.1.2 企业关系分析第14-16页
        2.1.3 企业信息抽取第16-17页
    2.2 信息抽取第17-25页
        2.2.1 历史与发展第17-18页
        2.2.2 文本挖掘第18-20页
        2.2.3 包装器归纳(Wrapper Induction)第20-23页
        2.2.4 Distant Supervision第23-25页
第3章 多源数据的信息抽取方法第25-45页
    3.1 问题描述及方法的提出第25-28页
    3.2 总体过程概要第28-30页
        3.2.1 竞争对手描述章节检测第28-29页
        3.2.2 多策略学习算法第29-30页
    3.3 竞争对手描述章节的检测第30-35页
        3.3.1 招股说明书预处理第30-31页
        3.3.2 竞争对手描述章节的检测方法第31-35页
    3.4 多策略学习算法第35-45页
        3.4.1 列表型语料的公司名抽取第35-37页
        3.4.2 表格型语料的公司名抽取第37-41页
        3.4.3 自由文本型语料的公司名抽取第41-45页
第4章 实验数据及结果评估第45-50页
    4.1 实验数据第45页
    4.2 结果分析与评估第45-50页
        4.2.1 每种类型语料中信息抽取的实验结果第46-47页
        4.2.2 使用多策略学习后的实验结果第47-48页
        4.2.3 与传统方法比较的实验结果第48-50页
第5章 总结及展望第50-52页
    5.1 本文总结第50-51页
    5.2 未来的工作第51-52页
参考文献第52-56页
致谢第56-57页
攻读硕士学位期间发表的论文第57页

论文共57页,点击 下载论文
上一篇:城市社区养老服务的投资模式研究
下一篇:基于本体约束规则与遗传算法的BIM进度计划自动生成研究