首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向精准问答的数据处理的设计与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-12页
    1.1 研究背景第9-10页
    1.2 论文的主要工作第10-11页
    1.3 论文组织结构第11-12页
第二章 相关技术和原理介绍第12-25页
    2.1 Web信息抽取研究综述第12-19页
        2.1.1 Web信息抽取概念第12-13页
        2.1.2 Web信息抽取模型第13-14页
        2.1.3 Web信息抽取技术第14-17页
        2.1.4 HTML DOM模型第17-19页
    2.2 XML技术第19-21页
    2.3 流式计算平台介绍第21-22页
        2.3.1 国内外研究现状第21页
        2.3.2 sm_stream第21-22页
    2.4 索引建立第22-24页
        2.4.1 搜索引擎中的索引简介第22-23页
        2.4.2 建立索引的意义第23-24页
    2.5 本章小结第24-25页
第三章 数据处理需求分析与总体设计第25-37页
    3.1 需求分析第25-32页
        3.1.1 总体需求分析第25-27页
        3.1.2 功能需求分析第27-32页
    3.2 总体设计第32-36页
        3.2.1 数据处理总体设计第32-33页
        3.2.2 Web信息抽取模块第33-34页
        3.2.3 文档拆分模块第34-35页
        3.2.4 乐队成员生成模块第35-36页
    3.3 本章小结第36-37页
第四章 数据处理详细设计与实现第37-60页
    4.1 Web信息抽取模块第37-48页
        4.1.1 抽取规则加载第37-41页
        4.1.2 数据抽取第41-46页
        4.1.3 文档类型检测第46-48页
    4.2 文档拆分模块第48-53页
        4.2.1 XML文档读取第48-49页
        4.2.2 文档格式转换第49-50页
        4.2.3 设置表名第50页
        4.2.4 写入数据库第50页
        4.2.5 文档拆分第50-53页
    4.3 乐队成员生成模块第53-59页
        4.3.1 百科XML数据获取第53-54页
        4.3.2 成员切分对齐第54-57页
        4.3.3 成员数据生成第57-59页
    4.4 本章小结第59-60页
第五章 系统测试第60-67页
    5.1 测试环境第60-61页
        5.1.1 Web信息抽取模块第60页
        5.1.2 文档拆分模块第60-61页
        5.1.3 乐队成员生成模块第61页
    5.2 功能测试第61-65页
        5.2.1 Web信息抽取模块第61-63页
        5.2.2 文档拆分模块第63-64页
        5.2.3 乐队成员生成模块第64-65页
    5.3 性能测试第65页
    5.4 本章小结第65-67页
第六章 总结与展望第67-69页
参考文献第69-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:分布式RFID系统的数据处理技术研究
下一篇:Linux环境下地址无关技术在编译安全中的研究