基于Web挖掘的中医知识发现研究

致谢	第1-6页
中文摘要	第6-7页
ABSTRACT	第7-11页
1 引言	第11-16页
·中医药学	第11页
·中医知识发现概述	第11-13页
·知识发现	第11-12页
·生物医学知识发现的研究现状	第12页
·中医文献知识发现	第12-13页
·知识发现的方法:文本挖掘	第13-14页
·论文的主要研究内容和结构	第14-16页
2 网页分类的相关技术	第16-26页
·网页分类概述	第16-17页
·文本表示模型	第17-18页
·文本的向量表示	第17页
·特征权重的计算	第17-18页
·特征选择	第18-20页
·文档频率	第19页
·信息增益	第19-20页
·互信息	第20页
·文本分类的算法	第20-23页
·朴素贝叶斯算法	第20-21页
·最大熵	第21-22页
·KNN算法	第22-23页
·决策树算法	第23页
·分类性能评价	第23-25页
·准确率、召回率和F-测度值	第23-24页
·微平均和宏平均	第24-25页
·本章小结	第25-26页
3 信息抽取	第26-37页
·信息抽取	第26-28页
·信息抽取的定义	第26页
·信息抽取的发展	第26-27页
·信息抽取的处理对象	第27-28页
·评价指标	第28页
·命名实体识别	第28-30页
·命名实体识别简介	第28-29页
·生物医学命名实体识别	第29页
·常用的命名实体识别方法	第29-30页
·基于统计方法的命名实体识别	第30-34页
·隐马尔科夫模型	第30-32页
·最大熵分类模型	第32-33页
·条件随机场	第33-34页
·实体关系分析	第34-35页
·信息	第35页
·本章小结	第35-37页
4 基于Web挖掘的中医药知识发现系统实现	第37-55页
·系统总体设计	第37-39页
·系统总体框架	第37-38页
·系统开发环境	第38-39页
·网页数据采集模块	第39-41页
·网络爬虫工作流程	第39-40页
·网络爬虫构建方式	第40页
·网页链接提取	第40-41页
·一些其他问题	第41页
·网页预处理模块	第41-45页
·文档对象模型(DOM)	第42-43页
·NekoHTML提取网页正文	第43-45页
·网页分类模块	第45-48页
·基于字特征的文本特征表示	第45-46页
·分类器的实现	第46页
·分类过程	第46-48页
·医学实体识别模块	第48页
·关系建立模块	第48-52页
·中医药知识示范分析	第52-54页
·证病关系分析	第52-53页
·药症关系分析	第53-54页
·本章小结	第54-55页
5 总结与展望	第55-56页
参考文献	第56-59页
作者简历	第59-61页
学位论文数据集	第61页