首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域知识的Web信息抽取方法研究

摘要第5-7页
ABSTRACT第7-10页
第1章 绪论第13-21页
    1.1 研究背景及意义第13-14页
    1.2 国内外研究现状第14-18页
        1.2.1 Web信息抽取研究现状第14-16页
        1.2.2 基于本体的Web信息抽取研究现状第16-18页
    1.3 论文主要工作第18-19页
    1.4 论文组织结构第19-21页
第2章 相关知识概述第21-33页
    2.1 信息抽取技术概述第21-26页
        2.1.1 信息抽取的现状、对象和任务第21-22页
        2.1.2 Web信息抽取方法的分类第22-24页
        2.1.3 Web信息抽取方法的关键技术第24-25页
        2.1.4 信息抽取系统的评价指标第25-26页
    2.2 语义网概述第26-29页
        2.2.1 语义Web概念和体系结构第26-27页
        2.2.2 语义Web核心技术第27-29页
    2.3 本体概述第29-32页
        2.3.1 本体的定义第29-30页
        2.3.2 本体的组成元素第30页
        2.3.3 本体的分类第30-31页
        2.3.4 本体的作用第31-32页
    2.4 本章小结第32-33页
第3章 构建相关的领域本体第33-49页
    3.1 本体构建相关知识第33-40页
        3.1.1 本体构建规则第33页
        3.1.2 本体构建方法第33-37页
        3.1.3 本体构建工具第37-38页
        3.1.4 本体描述语言第38-40页
    3.2 构建微博领域本体--以新浪徽博为例第40-48页
        3.2.1 微博页面的分析第40-41页
        3.2.2 收集特定领域本体中相关概念、关系和属性第41-44页
        3.2.3 利用Protege5.0构建微博领域本体第44-47页
        3.2.4 本体检测第47-48页
    3.3 本章小结第48-49页
第4章 基于领域本体的微博用户信息抽取方法第49-60页
    4.2 系统抽取框架的设计第49-50页
    4.3 领域本体的构建和概念块的划分第50-51页
        4.3.1 微博用户信息领域本体的构建第50-51页
        4.3.2 概念块的划分第51页
    4.4 本体实例块和“伪”本体第51-54页
        4.4.1 本体实例块第51-52页
        4.4.2 网络爬虫模块第52-53页
        4.4.3 “伪”本体第53-54页
    4.5 构造抽取规则第54-56页
    4.6 实验结果分析第56-58页
        4.6.1 开发工具和平台第56页
        4.6.2 数据来源第56-57页
        4.6.3 结果分析第57-58页
    4.7 本章小结第58-60页
第5章 基于领域本体的Deep Web实体信息抽取方法第60-72页
    5.1 引言第60-61页
    5.2 数据区域的定位第61-63页
        5.2.1 去除噪音节点第61-62页
        5.2.2 定位数据区域第62-63页
    5.3 实体区域的定位第63-65页
    5.4 基于领域本体的实体信息后续处理方法第65-68页
        5.4.1 领域本体构建和实体语义标注第65-66页
        5.4.2 基于领域本体的实体信息抽取算法第66-68页
    5.5 实验结果分析第68-71页
        5.5.1 实验环境及工具第68页
        5.5.2 实验数据来源第68页
        5.5.3 结果分析第68-71页
    5.6 本章小结第71-72页
第6章 总结和展望第72-74页
    6.1 论文总结第72页
    6.2 研究展望第72-74页
参考文献第74-79页
攻读学位期间参与的科研项目第79页
攻读学位期间发表的学术论文目录第79-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:基于GIS的高速公路数据库研究与实现
下一篇:基于主题模型的关键词抽取算法研究