基于深度置信网络算法的作者信息抽取研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第8-12页 |
1.1 研究背景 | 第8页 |
1.2 研究现状及存在的问题 | 第8-10页 |
1.2.1 信息抽取领域 | 第8-9页 |
1.2.2 图书评价领域 | 第9-10页 |
1.3 研究内容及意义 | 第10页 |
1.3.1 研究内容 | 第10页 |
1.3.2 研究意义 | 第10页 |
1.4 论文组织结构 | 第10-12页 |
第二章 理论基础及相关技术 | 第12-18页 |
2.1 理论基础 | 第12-15页 |
2.1.1 深度置信网络算法 | 第12-13页 |
2.1.2 数据仓库 | 第13-15页 |
2.2 相关技术 | 第15-17页 |
2.2.1 信息抽取技术 | 第15-16页 |
2.2.2 爬虫相关技术 | 第16-17页 |
2.3 本章小结 | 第17-18页 |
第三章 图书作者语料采集及影响因子分析 | 第18-25页 |
3.1 基于爬虫技术的图书作者语料采集 | 第18-21页 |
3.1.1 数据源分析 | 第18-19页 |
3.1.2 语料爬取策略 | 第19-20页 |
3.1.3 爬取结果存储 | 第20-21页 |
3.2 图书作者影响因子选取 | 第21-23页 |
3.2.1 基于五维图书评价体系分析 | 第21页 |
3.2.2 基于图书中作者简介分析 | 第21-22页 |
3.2.3 基于调查问卷分析 | 第22-23页 |
3.3 构建图书作者影响因子序列集 | 第23-24页 |
3.4 本章小结 | 第24-25页 |
第四章 图书作者信息抽取方法和策略 | 第25-32页 |
4.1 标注集介绍 | 第25页 |
4.2 深度置信算法以字为单位的识别 | 第25-28页 |
4.2.1 算法描述 | 第25-27页 |
4.2.2 图书作者姓名的抽取 | 第27-28页 |
4.3 深度置信算法以词为单位的识别 | 第28-31页 |
4.3.1 算法描述 | 第28-30页 |
4.3.2 图书作者科研职务抽取 | 第30页 |
4.3.3 图书作者工作单位抽取 | 第30-31页 |
4.3.4 图书作者学历情况抽取 | 第31页 |
4.4 本章小结 | 第31-32页 |
第五章 图书作者信息抽取系统设计与开发 | 第32-37页 |
5.1 系统总体框架设计 | 第32页 |
5.2 系统功能设计 | 第32-36页 |
5.2.1 图书作者语料采集模块 | 第33页 |
5.2.2 图书作者信息识别模块 | 第33-35页 |
5.2.3 图书作者信息补充模块 | 第35页 |
5.2.4 图书作者信息存储模块 | 第35-36页 |
5.3 本章小结 | 第36-37页 |
第六章 图书作者信息抽取系统的有效性验证 | 第37-39页 |
6.1 测评方法和评价指标 | 第37页 |
6.1.1 测评方法 | 第37页 |
6.1.2 评价指标 | 第37页 |
6.2 图书作者姓名抽取的实验 | 第37-38页 |
6.3 图书作者学历抽取的实验 | 第38页 |
6.4 图书作者工作单位抽取的实验 | 第38页 |
6.5 有效性分析 | 第38页 |
6.6 本章小结 | 第38-39页 |
第七章 总结与展望 | 第39-40页 |
7.1 论文研究内容与总结 | 第39页 |
7.2 论文下一步工作展望 | 第39-40页 |
参考文献 | 第40-43页 |
致谢 | 第43页 |