中文摘要 | 第4-8页 |
Abstract | 第8-12页 |
第1章 绪论 | 第24-54页 |
1.1 研究背景、目的与意义 | 第24-27页 |
1.1.1 研究背景 | 第24-25页 |
1.1.2 研究目的 | 第25-26页 |
1.1.3 研究意义 | 第26-27页 |
1.2 国内外研究现状 | 第27-46页 |
1.2.1 国内外研究进展 | 第27-44页 |
1.2.1.1 社交媒体研究现状 | 第27-33页 |
1.2.1.2 数据挖掘与知识发现研究现状 | 第33-37页 |
1.2.1.3 社交媒体知识发现研究现状 | 第37-40页 |
1.2.1.4 命名实体识别与实体关系识别研究现状 | 第40-41页 |
1.2.1.5 语义映射研究现状 | 第41-43页 |
1.2.1.6 推理规则研究现状 | 第43-44页 |
1.2.2 国内外研究现状述评 | 第44-46页 |
1.3 研究内容 | 第46-49页 |
1.3.1 章节安排 | 第46-48页 |
1.3.2 拟解决的关键问题 | 第48-49页 |
1.4 研究方案 | 第49-52页 |
1.4.1 研究方法 | 第49页 |
1.4.2 技术路线 | 第49-52页 |
1.5 本文的贡献或创新点 | 第52页 |
1.6 本章小结 | 第52-54页 |
第2章 相关理论与技术 | 第54-84页 |
2.1 社交媒体文本数据知识发现理论基础 | 第54-71页 |
2.1.1 社交媒体及社交媒体数据特点 | 第54-57页 |
2.1.1.1 社交媒体 | 第54-56页 |
2.1.1.2 社交媒体数据特点 | 第56-57页 |
2.1.2 知识发现理论 | 第57-62页 |
2.1.3 社交媒体文本数据信息抽取的任务和内容 | 第62-64页 |
2.1.4 数据命名实体识别及相关理论 | 第64-67页 |
2.1.5 社交媒体资源间语义关系识别相关理论 | 第67-69页 |
2.1.6 社交媒体知识发现——事件探测相关理论 | 第69-71页 |
2.2 社交媒体知识发现相关技术方法 | 第71-82页 |
2.2.1 常用知识发现技术方法 | 第72-73页 |
2.2.2 信息抽取技术 | 第73-77页 |
2.2.3 社交媒体知识发现之命名实体识别方法 | 第77-78页 |
2.2.4 社交媒体知识发现之实体语义关系识别方法 | 第78-79页 |
2.2.5 社交媒体知识发现之事件探测方法 | 第79-82页 |
2.3 本章小结 | 第82-84页 |
第3章 社交媒体文本数据知识发现策略 | 第84-104页 |
3.1 社交媒体数据挖掘与知识发现的困难 | 第85-93页 |
3.1.1 数据载体的文本化 | 第85-86页 |
3.1.2 概念描述的口语化 | 第86-91页 |
3.1.3 关系表达的自由化 | 第91页 |
3.1.4 事件阐述的模糊化 | 第91-93页 |
3.1.5 知识蕴含的隐蔽化 | 第93页 |
3.2 社交媒体文本数据命名实体识别策略 | 第93-97页 |
3.2.1 社交媒体信息资源获取方案 | 第94-95页 |
3.2.2 基于领域本体的社交媒体数据实体规范化 | 第95-97页 |
3.3 基于语法规则的实体语义关系抽取策略 | 第97-100页 |
3.3.1 基于依存距离的语义关系分析 | 第98-99页 |
3.3.2 实体语义关系抽取的推理规则 | 第99-100页 |
3.4 社交媒体文本数据中蕴含事件的探测策略 | 第100-102页 |
3.4.1 基于本体消歧主题模型的概念/关系挖掘 | 第100-101页 |
3.4.2 基于领域本体与领域金标准的事件探测和知识发现 | 第101-102页 |
3.5 社交媒体文本数据挖掘与知识发现策略 | 第102-103页 |
3.6 本章小结 | 第103-104页 |
第4章 社交媒体文本数据知识发现模型构建 | 第104-126页 |
4.1 知识发现总体架构 | 第104-107页 |
4.2 数据层 | 第107-109页 |
4.2.1 数据源选择 | 第108-109页 |
4.2.2 文本库构建 | 第109页 |
4.3 自然语言处理层 | 第109-113页 |
4.3.1 实体识别与抽取 | 第110-112页 |
4.3.2 句法分析 | 第112-113页 |
4.4 语义分析层 | 第113-116页 |
4.4.1 领域本体与本体映射 | 第114页 |
4.4.2 语义揭示 | 第114-116页 |
4.5 关系抽取层 | 第116-121页 |
4.5.1 推理规则制定 | 第117-121页 |
4.5.1.1 领域概念间的相对距离 | 第117-118页 |
4.5.1.2 推理规则 | 第118-121页 |
4.5.2 语义关系识别 | 第121页 |
4.6 事件探测层 | 第121-124页 |
4.6.1 多个领域本体之间语义映射 | 第123-124页 |
4.6.2 与领域知识库的比对 | 第124页 |
4.6.3 领域专家验证 | 第124页 |
4.7 本章小结 | 第124-126页 |
第5章 社交媒体文本数据知识发现模型运行机制 | 第126-148页 |
5.1 需求动力机制 | 第128-131页 |
5.1.1 催生模型的外部条件 | 第128-130页 |
(1) 大数据战略的牵引力 | 第128-129页 |
(2) 知识服务的驱动力 | 第129-130页 |
5.1.2 模型存在的内生动力 | 第130-131页 |
(1) 知识共享的推动力 | 第130-131页 |
(2) 知识创新的自动力 | 第131页 |
5.2 社交媒体文本数据知识发现子系统 | 第131-137页 |
5.2.1 数据获取模块 | 第133-134页 |
5.2.2 文本数据分析模块 | 第134-135页 |
5.2.3 结果评价模块 | 第135页 |
5.2.4 子系统中的数据流 | 第135-137页 |
5.3 语义映射机制 | 第137-140页 |
5.3.1 实体规范化的要素 | 第137-139页 |
(1) 社交媒体文本数据 | 第137-138页 |
(2) 自然语言处理技术 | 第138页 |
(3) 领域词表 | 第138-139页 |
5.3.2 语义映射过程中的作用机理 | 第139-140页 |
5.4 基于规则的推理机制 | 第140-142页 |
5.4.1 语义分析的要素 | 第140-141页 |
(1) 实体集合 | 第140页 |
(2) 语义关系分析 | 第140-141页 |
(3) 推理规则 | 第141页 |
5.4.2 语义分析的推理机制 | 第141-142页 |
5.5 事件探测反馈机制 | 第142-145页 |
5.5.1 事件探测的要素 | 第142-144页 |
(1) 实体关系集 | 第142页 |
(2) 语义映射 | 第142-144页 |
(3) 领域金标准 | 第144页 |
5.5.2 语义映射的事件探测反馈机制 | 第144-145页 |
5.6 连接内外通路的接口机制 | 第145-147页 |
(1) 数据通路 | 第146页 |
(2) 需求通路 | 第146-147页 |
5.7 本章小结 | 第147-148页 |
第6章 社交媒体文本数据知识发现实证研究 | 第148-188页 |
6.1 医学领域数据资源的特点 | 第150-151页 |
6.2 虚拟健康社区自由文本数据获取 | 第151-160页 |
6.2.1 数据源选择 | 第151-152页 |
6.2.2 数据获取 | 第152-153页 |
6.2.3 数据库存储表结构设计 | 第153-156页 |
6.2.4 文本库构建 | 第156-160页 |
6.3 虚拟健康社区文本数据命名实体识别 | 第160-170页 |
6.3.1 命名实体识别工具 | 第161-163页 |
6.3.2 基于UMLS的虚拟健康社区数据实体规范化 | 第163-168页 |
(1) 领域概念识别 | 第163-166页 |
(2) 句子切分 | 第166-168页 |
6.3.3 CHV对实体识别率的提高作用 | 第168-170页 |
6.4 语义关系抽取 | 第170-175页 |
6.4.1 推理规则应用 | 第171-172页 |
6.4.2 概念/关系对识别 | 第172-175页 |
6.5 虚拟健康社区中药物不良反应事件探测 | 第175-179页 |
6.5.1 金标准——SIDER药物不良反应数据库 | 第175-177页 |
6.5.2 药物不良反应事件探测 | 第177-179页 |
6.6 知识发现的验证和评价 | 第179-185页 |
6.6.1 构建评价数据集 | 第179-182页 |
6.6.2 评价过程 | 第182-185页 |
6.7 领域专家评价 | 第185-186页 |
6.8 本章小结 | 第186-188页 |
第7章 结语与展望 | 第188-192页 |
7.1 总结 | 第188-190页 |
7.1.1 本文的主要内容 | 第188-189页 |
7.1.2 本文的贡献 | 第189-190页 |
7.1.3 本研究的局限性 | 第190页 |
7.2 展望 | 第190-192页 |
参考文献 | 第192-206页 |
在学期间所取得的科研成果 | 第206-208页 |
致谢 | 第208页 |