首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--在其他方面的应用论文

文本挖掘在中医药中的若干应用研究

第一章 绪论第15-20页
    第一节 文本挖掘的研究背景第15-16页
        1.1.1 海量文本数据积累第15页
        1.1.2 文本挖掘方法第15-16页
    第二节 中医药文本挖掘研究第16-17页
        1.2.1 临床方药知识发现第16页
        1.2.2 证病相关知识发现第16-17页
        1.2.3 证候分子生物学相关知识发现第17页
        1.2.4 文献主题知识发现第17页
    第三节 本文的主要贡献第17-18页
    第四节 本文的组织第18-20页
第二章 中医药学KDD基础及研究特点第20-29页
    第一节 中医药信息化研究基础第20-27页
        2.1.1 中医药学数据库资源建设第20-21页
        2.1.2 中医药学统一语言系统建设第21-25页
        2.1.3 中医药学信息化存在的问题第25-27页
    第二节 中医药学KDD研究特点第27-29页
第三章 文本挖掘综述第29-39页
    第一节 文本挖掘介绍第29-35页
        3.1.1 目标与定义第29页
        3.1.2 文本挖掘过程第29-31页
        3.1.3 研究内容和方法第31-35页
            3.1.3.1 文本分类/聚类(Text Classification/Clustering)第32-33页
            3.1.3.2 信息抽取(Information Extraction)第33页
            3.1.3.3 文本数据挖掘(Text Data Mining)第33-35页
    第二节 生物医学文献知识发现(KDiBL)第35-36页
    第三节 文本挖掘软件第36-38页
        3.3.1 商业软件第37页
        3.3.2 研究性共享软件第37-38页
    第四节 总结与结论第38-39页
第四章 基于字特征的中文文本分类研究第39-53页
    第一节 问题定义第40-41页
    第二节 关键技术第41-42页
        4.2.1 文本特征表示第41页
        4.2.2 特征抽取和选取第41-42页
        4.2.3 机器学习方法第42页
        4.2.4 分类性能评价第42页
    第四节 相关研究第42-43页
    第五节 文本分类方法第43-46页
        4.5.1 Na(?)ve Bayes第44页
        4.5.2 TFIDF/Rocchio第44-45页
        4.5.3 Support Vector Machine(SVM)第45页
        4.5.4 k-Nearest Neighbor(kNN)第45-46页
    第六节 分布字聚类第46-48页
    第七节 训练集第48-49页
    第八节 字特征比较实验第49-50页
    第九节 分布字聚类实验第50-51页
    第十节 结论及未来工作第51-53页
第五章 基于Bootstrapping的中医药文献信息抽取第53-68页
    第一节 中医药文献信息抽取研究目标第53-54页
    第二节 信息抽取相关研究第54-56页
    第三节 Bootstrapping方法介绍第56-57页
    第四节 Bootstrapping的模式定义第57-59页
        5.4.1 LTRT模式第57-58页
        5.4.2 FEP模式第58页
        5.4.3 WIP模式第58页
        5.4.4 ATP模式第58-59页
    第五节 Bubble-Bootstrapping算法第59-62页
    第六节 实验结果及分析第62-67页
        5.6.1 复方名称抽取第63-64页
        5.6.2 疾病名称抽取第64-66页
        5.6.3 副主题词抽取第66-67页
    第八节 结论与未来工作第67-68页
第六章 MeDisco/3T临床复方文本挖掘系统第68-82页
    第一节 MeDisco/3T系统体系结构第68-69页
        6.1.1 TCM Term Recognizer第69页
        6.1.2 CMF Content Extractor第69页
        6.1.3 Data Mining第69页
    第二节 MeDisco/3T术语识别模块实现第69-71页
        6.2.1 模式定义实现与特殊处理第69-70页
        6.2.2 Bubble-bootstrapping算法实现第70-71页
    第三节 MeDisco/3T应用第71-73页
        6.3.1 临床复方药物组成知识发现第71-72页
        6.3.2 临床疾病名称抽取第72-73页
        6.3.3 副主题词信息抽取第73页
    第四节 实验结果分析第73-81页
        6.4.1 临床复方内容抽取第73-74页
        6.4.2 药物组成与科属高频知识第74-78页
        6.4.3 复方药物科属分布知识第78-81页
    第五节 结论及未来工作第81-82页
第七章 MeDisco/3T中医证候分子生物学知识发现系统第82-102页
    第一节 中医药学与大生命科学的研究背景第82-83页
    第二节 中医证候分子生物学知识文本挖掘的提出第83-85页
        7.2.1 概念互补性关联第83页
        7.2.2 文本数据基础第83-84页
        7.2.3 总体框架第84-85页
        7.2.4 研究意义第85页
    第三节 系统体系结构第85-87页
    第四节 关键技术第87-92页
        7.4.1 独立互补性文献与信息整合第87-88页
        7.4.2 基于ATP的中医疾病名称抽取第88-89页
        7.4.3 标准术语库与文献术语索引第89-90页
        7.4.4 术语同现频度与关联度计算第90-91页
        7.4.5 网络图形化输出第91-92页
    第五节 实验结果分析和评价第92-100页
        7.5.1 证病关系第93-95页
        7.5.2 证候与基因关系第95-99页
        7.5.3 基因证候分型特性第99-100页
    第六节 结论及未来工作第100-102页
第八章 结论与展望第102-105页
    第一节 总结与结论第102-103页
    第二节 未来工作第103页
    第三节 展望第103-105页
附录第105-108页
参考文献第108-119页
博士期间论文第119页

论文共119页,点击 下载论文
上一篇:弥散加权成像在胰腺癌及肿块型胰腺炎鉴别诊断中的应用
下一篇:综合分析经支气管镜介入治疗大气道狭窄40例