基于模式匹配的非结构化病理报告的信息抽取方法
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
1 绪论 | 第11-16页 |
1.1 研究背景及意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.3 本文主要研究内容 | 第13-14页 |
1.4 本文的组织框架 | 第14-16页 |
2 相关技术综述 | 第16-23页 |
2.1 中文分词 | 第16-18页 |
2.1.1 分词技术简介 | 第16-18页 |
2.1.2 改进的匹配分词算法 | 第18页 |
2.2 信息抽取 | 第18-19页 |
2.3 模式匹配 | 第19-21页 |
2.4 逆向最短编辑距离泛化方法 | 第21-22页 |
2.5 本章小结 | 第22-23页 |
3 模式提取方法研究 | 第23-30页 |
3.1 基于元数据的模式提取 | 第23-24页 |
3.1.1 元数据简介 | 第23页 |
3.1.2 模式提取原理剖析 | 第23-24页 |
3.2 基于文本聚类的模式提取 | 第24-25页 |
3.2.1 文本聚类简介 | 第24-25页 |
3.2.2 模式提取原理剖析 | 第25页 |
3.3 基于模式匹配的方法 | 第25-29页 |
3.3.1 病理文本数据预处理 | 第26-28页 |
3.3.2 模式提取算法 | 第28-29页 |
3.4 本章小结 | 第29-30页 |
4 模式泛化 | 第30-35页 |
4.1 泛化方法简介 | 第30-31页 |
4.1.1 基于编辑距离的模式泛化方法 | 第30页 |
4.1.2 基于最长公共子串的模式泛化方法 | 第30-31页 |
4.2 基于正向最短编辑距离的泛化方法 | 第31-33页 |
4.3 本章小结 | 第33-35页 |
5 病理文本数据结构化处理过程及总体框架 | 第35-44页 |
5.1 病理文本数据 | 第35-38页 |
5.1.1 病理文本数据结构 | 第35-37页 |
5.1.2 病理文本概念层次结构 | 第37-38页 |
5.2 病理文本数据的结构化 | 第38-42页 |
5.2.1 病理文本数据预处理 | 第39-40页 |
5.2.2 病理文本数据模式提取 | 第40-41页 |
5.2.3 模式泛化 | 第41页 |
5.2.4 病理文本数据信息抽取 | 第41-42页 |
5.3 系统框架 | 第42-43页 |
5.4 本章小结 | 第43-44页 |
6 系统实现及效果评测 | 第44-54页 |
6.1 系统实现 | 第44-49页 |
6.1.1 系统平台搭建 | 第44-45页 |
6.1.2 中文分词及词库的实现 | 第45-47页 |
6.1.3 模式提取及模式泛化的实现 | 第47-49页 |
6.2 实验结果及评估 | 第49-53页 |
6.2.1 模式提取结果展示 | 第49页 |
6.2.2 准确率、召回率和F值 | 第49-50页 |
6.2.3 阈值的优化 | 第50-51页 |
6.2.4 自定义指标名个数的优化 | 第51-52页 |
6.2.5 测评结果评估 | 第52-53页 |
6.3 本章小结 | 第53-54页 |
7 总结和展望 | 第54-56页 |
7.1 总结 | 第54页 |
7.2 展望 | 第54-56页 |
参考文献 | 第56-59页 |
攻读学位期间的研究成果 | 第59-60页 |
致谢 | 第60页 |