摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第12-18页 |
1.1 课题背景与来源 | 第12页 |
1.2 课题研究的目的与意义 | 第12-13页 |
1.3 国内外研究现状 | 第13-14页 |
1.4 研究思路与主要技术路线 | 第14-15页 |
1.5 研究内容及章节安排 | 第15-18页 |
第2章 WEB信息抽取相关理论与技术 | 第18-28页 |
2.1 Web信息抽取 | 第18页 |
2.2 信息抽取的主要技术 | 第18-21页 |
2.2.1 HTML | 第18-19页 |
2.2.2 XML与XHTML | 第19-20页 |
2.2.3 文档对象模型 | 第20页 |
2.2.4 网页表格结构 | 第20-21页 |
2.3 文本分类的相关技术 | 第21-23页 |
2.3.1 文本分类技术概述 | 第21-22页 |
2.3.2 文本分类算法的主要研究 | 第22-23页 |
2.3.3 算法分析比较 | 第23页 |
2.4 Web信息抽取技术的主要研究 | 第23-26页 |
2.4.1 基于自然语言处理的方法 | 第24页 |
2.4.2 基于统计的方法 | 第24-25页 |
2.4.3 基于DOM树结构的方法 | 第25页 |
2.4.4 基于网页分块的方法 | 第25-26页 |
2.4.5 基于模板的方法 | 第26页 |
2.5 本章小结 | 第26-28页 |
第3章 基于模板的文献信息抽取方法设计 | 第28-46页 |
3.1 信息抽取整体结构设计 | 第28-29页 |
3.2 网页预处理方法设计 | 第29-31页 |
3.2.1 页面清洗 | 第30页 |
3.2.2 页面解析 | 第30-31页 |
3.3 主题信息模板生成方法设计 | 第31-39页 |
3.3.1 抽取规则的选择 | 第31-32页 |
3.3.2 主题信息结点及主题信息路径表示 | 第32页 |
3.3.3 主题信息定位算法设计 | 第32-38页 |
3.3.4 精确模板生成模块设计 | 第38-39页 |
3.4 主题信息抽取方法设计 | 第39-42页 |
3.4.1 主题信息路径的匹配 | 第40-41页 |
3.4.2 主题信息抽取 | 第41-42页 |
3.5 实验结果及分析 | 第42-44页 |
3.5.1 实验环境 | 第42页 |
3.5.2 实验数据集 | 第42页 |
3.5.3 抽取实验实例 | 第42-44页 |
3.5.4 文献信息抽取实验 | 第44页 |
3.6 本章小结 | 第44-46页 |
第4章 基于启发式规则的HTML表格信息抽取方法设计 | 第46-60页 |
4.1 表格信息抽取整体结构设计 | 第46-47页 |
4.2 基于启发式规则的表格定位方法设计 | 第47-54页 |
4.2.1 表格定位的启发式规则 | 第47-50页 |
4.2.2 Table-DOM树的创建 | 第50-51页 |
4.2.3 基于启发式规则的表格定位算法 | 第51-54页 |
4.3 表格信息抽取规则生成方法 | 第54-57页 |
4.3.1 表格结构与类型分类 | 第54-55页 |
4.3.2 目标属性与目标数据 | 第55页 |
4.3.3 基于启发式的表格抽取规则生成方法 | 第55-57页 |
4.4 实验结果及分析 | 第57-59页 |
4.4.1 实验环境 | 第57-58页 |
4.4.2 目标表格定位实验 | 第58页 |
4.4.3 表格信息抽取实验 | 第58-59页 |
4.5 本章小结 | 第59-60页 |
第5章 基于支持向量机的信息分类方法设计 | 第60-72页 |
5.1 文本分类方法总体流程设计 | 第60-61页 |
5.2 基于支持向量机的文本分类方法设计 | 第61-67页 |
5.2.1 支持向量机理论 | 第61-63页 |
5.2.2 文本预处理方法 | 第63页 |
5.2.3 特征项选择与提取 | 第63-65页 |
5.2.4 支持向量机的模型训练 | 第65页 |
5.2.5 支持向量机的文本分类 | 第65-67页 |
5.3 计算实验与结果分析 | 第67-70页 |
5.3.1 实验设计 | 第67页 |
5.3.2 特征选择实验 | 第67页 |
5.3.3 核函数参数选择实验 | 第67页 |
5.3.4 多分类问题实验 | 第67-68页 |
5.3.5 模型返回结果 | 第68页 |
5.3.6 分类实验结果与分析 | 第68-70页 |
5.4 本章小结 | 第70-72页 |
第6章 信息抽取技术在科研服务系统中的应用 | 第72-84页 |
6.1 科研服务系统总体结构 | 第72-79页 |
6.1.1 系统总体需求分析 | 第72页 |
6.1.2 系统总体方案设计 | 第72-73页 |
6.1.3 系统主要功能结构设计 | 第73-77页 |
6.1.4 系统总体功能模块设计 | 第77-79页 |
6.2 信息抽取方法在科研服务系统中的应用 | 第79-82页 |
6.2.1 文献信息抽取方法在文献信息管理模块的应用 | 第80-81页 |
6.2.2 表格信息提取方法在课表信息管理中的应用 | 第81-82页 |
6.3 本章小结 | 第82-84页 |
第7章 论文总结与展望 | 第84-86页 |
7.1 论文工作总结 | 第84页 |
7.2 展望 | 第84-86页 |
参考文献 | 第86-90页 |
致谢 | 第90页 |