摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
前言 | 第7-8页 |
1 文献相关性数据库研究概述 | 第8-9页 |
2 文献相关性数据库建设关键技术 | 第9-18页 |
·文本自动分类 | 第10-12页 |
·基于词典的分类算法 | 第10页 |
·支持向量机 | 第10-11页 |
·贝叶斯算法 | 第11页 |
·K-近邻法 | 第11-12页 |
·神经网络算法 | 第12页 |
·向量空间模型 | 第12-14页 |
·文本自动分词 | 第14-16页 |
·机械分词法 | 第14-15页 |
·基于规则的分词法 | 第15页 |
·基于统计的分词法 | 第15-16页 |
·人工智能分词法 | 第16页 |
·加权算法 | 第16-17页 |
·绝对频率加权法 | 第16页 |
·相对频率加权法 | 第16-17页 |
·逆文献频率加权法 | 第17页 |
·文献唯一标识符 | 第17-18页 |
·期刊及文献标识符 | 第17-18页 |
·出版物对象标识符 | 第18页 |
·数字对象标识符 | 第18页 |
3 PubMed文献相关性检索系统 | 第18-22页 |
·PubMed概况 | 第18-19页 |
·PubMed主要资源 | 第19-20页 |
·MEDLINE | 第19页 |
·PreMEDLINE | 第19-20页 |
·出版商提供的题录信息 | 第20页 |
·PubMed文献相关性检索功能 | 第20-22页 |
4 中国医学科学院医学信息研究所文献相关性数据库研究 | 第22-23页 |
·文献相关性判定算法研究 | 第22-23页 |
·算法运用于实际时需要解决的问题 | 第23页 |
5 中国生物医学工程文献相关性数据库建设 | 第23-37页 |
·总体设想 | 第23-25页 |
·试验数据的选取和准备 | 第25-26页 |
·生成唯一标识符 | 第26-27页 |
·构建期刊标识段 | 第26-27页 |
·构建期刊论文标识段 | 第27页 |
·构建控制段 | 第27页 |
·文献自动分类 | 第27-30页 |
·分类词表 | 第28-29页 |
·分类方法 | 第29-30页 |
·特征项抽取 | 第30-31页 |
·特征项提取字段 | 第30页 |
·分词词表 | 第30页 |
·分词方法 | 第30-31页 |
·特征项归并 | 第31-32页 |
·特征项权重计算 | 第32-34页 |
·局域权值 | 第32-33页 |
·广域权值 | 第33-34页 |
·文献相似度计算 | 第34-35页 |
·中国生物医学工程文献相关性检索系统 | 第35-37页 |
6 系统结果数据分析 | 第37-45页 |
·相关性判定效率评价 | 第37-42页 |
·评价指标 | 第37-38页 |
·评价方法 | 第38-39页 |
·数据分析 | 第39-41页 |
·结沦 | 第41-42页 |
·相似度阈值分析 | 第42-45页 |
·存在的问题分析 | 第45页 |
7 中国生物医学工程文献相关性数据库数据更新策略探讨 | 第45-51页 |
·数据添加 | 第46-50页 |
·数据添加量估算 | 第46-47页 |
·新数据去重及题录数据更新 | 第47-48页 |
·新数据初步处理 | 第48-49页 |
·相关性结果更新 | 第49-50页 |
·数据删除 | 第50-51页 |
·数据修改 | 第51页 |
8 建议 | 第51-56页 |
·建设《中文一体化医学语言系统》 | 第51-53页 |
·改进《生物医学工程主题词表》和《生物医学工程预定义类表》 | 第53页 |
·阈值的进一步研究 | 第53页 |
·更新策略的进一步验证 | 第53-54页 |
·改进现有的文献相关性判定算法 | 第54页 |
·探索不需要分词的相关性判定算法 | 第54-56页 |
参考文献 | 第56-59页 |
致谢 | 第59-60页 |
附录 | 第60-71页 |