大数据时代面向知识发现的网络信息提取方法研究

摘要	第5-6页
Abstract	第6页
引言	第12-13页
1 绪论	第13-17页
1.1 研究背景与研究意义	第13-14页
1.2 国内外研究现状	第14-16页
1.2.1 研究目标	第14-15页
1.2.2 研究进展	第15页
1.2.3 研究趋势	第15-16页
1.3 研究内容	第16页
1.4 研究方法	第16页
1.5 创新点	第16-17页
2 相关理论与研究方法	第17-28页
2.1 大数据概念界定	第17-19页
2.1.1 大数据的概念和特征	第17-18页
2.1.2 大数据的来源	第18页
2.1.3 大数据信息提取的挑战	第18-19页
2.1.4 大数据的数据异构与不完备性	第19页
2.2 知识发现	第19-24页
2.2.1 知识发现的基本思想	第20-22页
2.2.2 知识发现的基本原理	第22页
2.2.3 知识发现的基本过程	第22-24页
2.3 网络信息提取方法	第24-26页
2.3.1 网络信息提取的研究现状	第24-25页
2.3.2 网络信息提取的相关技术	第25-26页
2.4 本章小结	第26-28页
3 网络信息提取方法相关技术概述	第28-32页
3.1 基于策略的网络信息提取方法	第28页
3.2 网络信息提取相关技术概述	第28-31页
3.2.1 搜索引擎	第28-29页
3.2.2 网页爬虫	第29页
3.2.3 网页页面的表示	第29-30页
3.2.4 超文本标记	第30-31页
3.3 本章小结	第31-32页
4 网络信息提取模型设计	第32-40页
4.1 模型总体设计	第33-37页
4.1.1 网络信息提取模型的设计思路	第33页
4.1.2 模型总体结构	第33-34页
4.1.3 模型总体时序	第34-35页
4.1.4 模型大致架构	第35-37页
4.2 信息提取的结构	第37-38页
4.3 关联规则经典算法分析	第38-40页
5 信息提取模型模拟运用及结果解析	第40-49页
5.1 信息选取及网页信息冗余去除	第40-44页
5.1.1 信息选取	第40页
5.1.2 网页块的划分及网页信息冗余去除	第40-44页
5.2 信息提取模型模拟设计	第44-49页
5.2.1 性能评价指标	第44页
5.2.2 设计目标	第44页
5.2.3 模拟系统运行环境及实现结果	第44-49页
6 研究展望	第49-50页
参考文献	第50-52页
致谢	第52-53页
作者简介及读研期间主要科研成果	第53页