基于社交媒体的药物副作用识别

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第9-16页
1.1 课题来源	第9页
1.2 课题研究的目的及意义	第9-11页
1.3 国内外相关技术研究现状	第11-14页
1.3.1 命名实体识别研究现状	第11-12页
1.3.2 医疗实体识别研究现状	第12-13页
1.3.3 基于社交媒体的药物副作用识别研究现状	第13-14页
1.4 本文的主要研究内容	第14-15页
1.5 本文的章节结构	第15-16页
第2章相关技术介绍	第16-25页
2.1 引言	第16页
2.2 命名实体识别	第16-17页
2.2.1 序列标注问题	第16页
2.2.2 命名实体识别方法分类	第16-17页
2.3 条件随机场	第17-19页
2.3.1 简介	第17-18页
2.3.2 线性链条件随机场	第18页
2.3.3 条件随机场的参数化形式	第18-19页
2.4 深度学习相关技术介绍	第19-24页
2.4.1 词向量模型	第19-20页
2.4.2 循环神经网络	第20-22页
2.4.3 长短时记忆网络	第22-24页
2.5 本章小结	第24-25页
第3章社交媒体中药物副作用识别的条件随机场方法	第25-34页
3.1 引言	第25页
3.2 实体标注方法介绍	第25页
3.3 现有社交媒体中药物副作用实体标注方法	第25-28页
3.3.1 BIO连续实体标注方法	第26页
3.3.2 BIOES连续实体标注方法	第26-27页
3.3.3 BIOHD非连续实体标注方法	第27-28页
3.4 社交媒体中非连续药物副作用实体的Multi-label标注方法	第28-30页
3.4.1 Multi-label非连续实体标注方法	第28-29页
3.4.2 Multi-label标注方法的优势	第29-30页
3.5 条件随机场模型	第30-33页
3.5.1 数据预处理	第30-31页
3.5.2 特征提取	第31-32页
3.5.3 模型构建	第32-33页
3.6 本章小结	第33-34页
第4章社交媒体中药物副作用识别的深度学习方法	第34-46页
4.1 引言	第34页
4.2 双向LSTM-CRF模型	第34-39页
4.2.1 整体架构	第34-35页
4.2.2 词级embedding表示	第35-36页
4.2.3 字符级embedding表示	第36-37页
4.2.4 双向LSTM	第37-38页
4.2.5 利用CRF层来预测标签序列	第38-39页
4.3 融合主题和知识库特征的双向LSTM-CRF模型	第39-42页
4.3.1 整体架构	第39-41页
4.3.2 主题特征	第41页
4.3.3 知识库特征	第41-42页
4.4 模型参数设置与相关技巧	第42-45页
4.4.1 优化器的选择	第42-43页
4.4.2 Mini-batch批量训练	第43页
4.4.3 加入Dropout	第43-44页
4.4.4 使用Earlystopping机制	第44-45页
4.5 本章小结	第45-46页
第5章实验结果与分析	第46-57页
5.1 引言	第46页
5.2 实验环境	第46页
5.3 实验数据介绍与知识库采集	第46-48页
5.3.1 社交媒体相关的药物副作用语料	第46-48页
5.3.2 药物副作用知识库采集	第48页
5.4 评价指标及交叉验证	第48-49页
5.5 基于社交媒体的药物副作用识别结果与分析	第49-56页
5.5.1 条件随机场模型识别结果	第49-52页
5.5.2 深度学习模型识别结果	第52-53页
5.5.3 实验结果对比与分析	第53-56页
5.6 本章小结	第56-57页
结论	第57-59页
参考文献	第59-63页
攻读硕士学位期间发表的论文及其它成果	第63-65页
致谢	第65页