医学CT报告文本结构化处理研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-23页
1.1 研究的背景及意义	第12-14页
1.2 国内外发展现状和动态	第14-16页
1.2.1 国外研究现状	第14-15页
1.2.2 国内研究现状	第15-16页
1.3 研究内容	第16-17页
1.4 研究难点与解决方案	第17-18页
1.5 研究总体框架设计	第18-21页
1.5.1 文本预处理模块	第19-20页
1.5.2 构建自定义医学词典模块	第20-21页
1.5.3 数据结构化转换模块	第21页
1.6 论文组织结构	第21-23页
第2章相关理论及技术基础	第23-31页
2.1 文本相似度计算	第23-27页
2.1.1 词向量	第23页
2.1.2 Word2vec算法	第23-25页
2.1.3 Doc2vec算法	第25-26页
2.1.4 相似度计算方法	第26-27页
2.2 文本聚类分析算法	第27-28页
2.3 中文分词方法	第28-30页
2.3.1 中文分词工具	第28-29页
2.3.2 基于词典的分词算法	第29-30页
2.4 本章小结	第30-31页
第3章数据预处理与构建自定义医学词典	第31-49页
3.1 CT报告文本数据结构特点	第31-33页
3.2 CT报告文本数据预处理	第33-36页
3.2.1 子句的切分	第34-35页
3.2.2 特殊词汇标记	第35-36页
3.3 构建文本预处理医学词库	第36-37页
3.3.1 外部词库整合导入	第36-37页
3.3.2 规范子句的关键信息抽取	第37页
3.4 CT报告文本聚类分析	第37-39页
3.4.1 相似度计算	第37-38页
3.4.2 文本聚类分析	第38-39页
3.5 关键信息提取	第39-48页
3.5.1 算法描述	第39-44页
3.5.2 算法实现	第44-48页
3.6 本章小结	第48-49页
第4章医学CT报告文本的结构化转换算法	第49-57页
4.1 CT报告文本结构化转换预处理	第49-52页
4.1.1 否定含义检测	第49-51页
4.1.2 冗余词汇过滤	第51-52页
4.2 CT报告文本结构化转换算法	第52-56页
4.2.1 算法主要处理流程及描述	第52-54页
4.2.2 算法实现	第54-56页
4.3 本章小结	第56-57页
第5章系统设计实现与实验分析	第57-63页
5.1 系统的设计与实现	第57-59页
5.1.1 CT报告文本预处理模块	第57-58页
5.1.2 构建自定义医学词典模块	第58页
5.1.3 CT报告文本结构化转换	第58-59页
5.2 实验分析	第59-62页
5.2.1 实验参数的确定	第59-61页
5.2.2 自定义医学词典性能评估	第61页
5.2.3 结构化处理算法实验对比分析	第61-62页
5.3 本章小结	第62-63页
结论	第63-65页
参考文献	第65-68页
致谢	第68-69页
附录A 攻读学位期间主要完成的成果	第69页