首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

作者资讯中的有用文本信息抽取方法研究

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-12页
    1.1 研究背景及意义第8页
        1.1.1 研究背景第8页
        1.1.2 研究意义第8页
    1.2 国内外相关研究现状第8-10页
        1.2.1 文本信息抽取的国外发展现状第8-9页
        1.2.2 文本信息抽取的国内发展现状第9-10页
    1.3 主要研究内容第10页
    1.4 论文组织结构第10-12页
第二章 基础理论与相关技术第12-17页
    2.1 基础理论第12-13页
        2.1.1 网络爬虫概念界定第12页
        2.1.2 数据清洗的概念界定第12页
        2.1.3 脏数据的概念界定第12-13页
        2.1.4 文本信息抽取概念界定第13页
    2.2 相关技术第13-16页
        2.2.1 数据清洗的基本框架第13-15页
        2.2.2 中文分词技术第15页
        2.2.3 隐马尔可夫模型第15-16页
        2.2.4 最大熵原理第16页
        2.2.5 本体的概念第16页
    2.3 本章小结第16-17页
第三章 文本信息抽取信息源的获取第17-23页
    3.1 信息采集数据源的结构分析第17-19页
    3.2 信息采集的方法和策略第19-20页
    3.3 分布式多线程架构的处理流程第20页
    3.4 信息采集规则的处理流程第20-22页
    3.5 信息采集的结果第22页
        3.5.1 数据采集结果的结构分析第22页
        3.5.2 数据采集结果的存储第22页
    3.6 本章小结第22-23页
第四章 文本信息抽取的数据标准化第23-26页
    4.1 无效值的数据标准化第23-24页
    4.2 错误值的数据标准化第24-25页
    4.3 重复值的数据标准化第25页
    4.4 本章小结第25-26页
第五章 文本信息抽取的方法设计第26-35页
    5.1 文本信息抽取的样本分析第26-28页
        5.1.1 样本数据结构分析第26-27页
        5.1.2 信息抽取数据格式的设计第27-28页
    5.2 文本信息抽取策略第28-30页
        5.2.1 基于本体的文本信息抽取方法第28-29页
        5.2.2 基于最大熵的隐马尔可夫模型的文本信息抽取方法第29-30页
        5.2.3 信息抽取模型的选取第30页
    5.3 抽取方法的设计第30-34页
        5.3.1 作者信息的本体设计第30-32页
        5.3.2 文本信息抽取框架第32页
        5.3.3 文本信息预处理第32-33页
        5.3.4 命名实体抽取第33页
        5.3.5 事件信息甄别第33-34页
    5.4 本章小结第34-35页
第六章 作者文本信息抽取系统的设计与实现第35-53页
    6.1 AIES系统整体架构第35-36页
    6.2 调度层设计与实现第36-37页
    6.3 爬取业务层设计与实现第37-41页
    6.4 数据层设计与实现第41-43页
    6.5 信息抽取层设计与实现第43-50页
    6.6 实验验证第50-52页
        6.6.1 实验结果评价指标第50页
        6.6.2 实验结果分析第50-52页
    6.7 本章小结第52-53页
第七章 总结与展望第53-54页
    7.1 结论第53页
    7.2 不足与展望第53-54页
参考文献第54-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:基于标题与正文的文本分类和评价对象抽取方法研究
下一篇:基于SDN的数据中心网络流量调度技术研究