基于主题模型的中医药隐含语义信息挖掘
摘要 | 第3-4页 |
Abstract | 第4页 |
第1章 绪论 | 第9-16页 |
1.1 数据挖掘主题模型研究背景 | 第9-12页 |
1.1.1 数据挖掘的步骤 | 第9-11页 |
1.1.2 主题模型与潜在语义分析 | 第11-12页 |
1.2 语义Web简介 | 第12-13页 |
1.3 中医药信息学简介 | 第13-14页 |
1.3.1 中医的理论体系 | 第13页 |
1.3.2 中医药的科学属性 | 第13-14页 |
1.3.3 中医药和数据挖掘 | 第14页 |
1.3.4 Spora数据挖掘平台 | 第14页 |
1.4 本文的研究目的 | 第14-15页 |
1.5 本文主要研究内容 | 第15页 |
1.6 本文组织结构 | 第15页 |
1.7 本章小结 | 第15-16页 |
第2章 主题模型研究综述 | 第16-26页 |
2.1 向量空间模型 | 第16-18页 |
2.1.1 单词的权重 | 第17-18页 |
2.1.2 文档距离度量 | 第18页 |
2.2 奇异值分解与LSA | 第18-20页 |
2.3 概率隐含语义分析pLSA | 第20-24页 |
2.3.1 pLSA数学模型 | 第20-22页 |
2.3.2 求解模型参数 | 第22-23页 |
2.3.3 pLSA的一些改进版本 | 第23页 |
2.3.4 pLSA的优势和不足 | 第23-24页 |
2.4 潜在狄利克雷分配LDA | 第24页 |
2.5 主题模型与非负矩阵分解 | 第24-25页 |
2.6 本章小结 | 第25-26页 |
第3章 主题模型应用于中医药数据挖掘 | 第26-38页 |
3.1 中医药数据挖掘与中西医药物发现 | 第26-27页 |
3.2 LDA模型的中医药处方数据解释 | 第27-29页 |
3.3 LDA策略 | 第29-30页 |
3.3.1 先验的设定 | 第29-30页 |
3.3.2 主题数目的确定 | 第30页 |
3.4 算法 | 第30-33页 |
3.4.1 Gibbs采样 | 第31页 |
3.4.2 基于Gibbs采样的LDA算法 | 第31-33页 |
3.5 改进Gibbs-LDA算法 | 第33-35页 |
3.6 实验结果 | 第35-37页 |
3.7 本章小结 | 第37-38页 |
第4章 主题模型的语义融合 | 第38-46页 |
4.1 本体和语义Web | 第38-39页 |
4.1.1 资源描述框架RDF | 第38-39页 |
4.1.2 中医药本体库 | 第39页 |
4.2 主题数据的语义表达 | 第39-41页 |
4.2.1 主题模型的语义 | 第40页 |
4.2.2 生成主题模型语义RDF文档 | 第40-41页 |
4.3 语义数据可视化 | 第41-45页 |
4.3.1 中医药主题模型可视化 | 第42-43页 |
4.3.2 生成网络图 | 第43页 |
4.3.3 实验结果 | 第43-45页 |
4.4 本章小结 | 第45-46页 |
第5章 主题模型集成到Spora数据挖掘平台 | 第46-54页 |
5.1 Spora数据挖掘平台 | 第46页 |
5.2 Spora数据挖掘平台工作原理 | 第46-49页 |
5.2.1 Spora的架构 | 第48-49页 |
5.2.2 实验的配置 | 第49页 |
5.3 集成主题模型挖掘算子 | 第49-51页 |
5.4 运行主题模型挖掘实验 | 第51-53页 |
5.5 本章小结 | 第53-54页 |
第6章 海量资源的用户权限管理 | 第54-64页 |
6.1 用户IAM系统简介 | 第54-56页 |
6.2 需求和挑战 | 第56页 |
6.3 系统设计和实现 | 第56-63页 |
6.3.1 MongoDB中数据集合设计 | 第58-60页 |
6.3.2 资源权限管理 | 第60-61页 |
6.3.3 权限验证流程 | 第61-63页 |
6.3.4 设计思想 | 第63页 |
6.4 本章小结 | 第63-64页 |
第7章 总结与展望 | 第64-66页 |
7.1 本文总结 | 第64页 |
7.2 未来展望 | 第64-66页 |
参考文献 | 第66-68页 |
攻读硕士学位期间主要的研究成果 | 第68-69页 |
致谢 | 第69页 |