首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于随机森林算法的医学文献检索研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-13页
    1.3 论文研究内容第13-14页
    1.4 本文研究章节结构第14-15页
第二章 相关知识介绍第15-23页
    2.1 LUCENE全文索引检索框架第15-17页
        2.1.1 Lucene系统结构第15-16页
        2.1.2 Lucene的评分机制第16-17页
    2.2 排序的评价标准第17-19页
        2.2.1 准确率和召回率第17-18页
        2.2.2 MAP第18页
        2.2.3 NDCG第18-19页
    2.3 PAGERANK算法和HITS算法介绍第19-21页
        2.3.1 PageRank算法第19-20页
        2.3.2 HITS算法第20-21页
    2.4 相似度计算方法第21-22页
        2.4.1 欧氏距离第21页
        2.4.2 余弦相似度第21页
        2.4.3 皮尔逊相似度第21-22页
        2.4.4 杰卡德相似度第22页
    2.5 本章小结第22-23页
第三章 随机森林算法第23-30页
    3.1 随机森林定义第23-24页
    3.2 决策树第24-25页
    3.3 随机森林的理论基础第25-26页
    3.4 随机森林的构建方法第26-29页
        3.4.1 从训练集中抽样用以构建决策树第26-28页
        3.4.2 构建随机森林中的决策树第28页
        3.4.3 随机森林的形成第28-29页
    3.5 本章小结第29-30页
第四章 实验说明第30-38页
    4.1 文献数据预处理第30页
    4.2 搭建LUCENE检索框架第30-31页
    4.3 基于关键词共现方法提取关键词第31-35页
    4.4 构建文献的引文网络第35-36页
    4.5 构建基于随机森林算法的重新排序框架第36-37页
    4.6 本章小结第37-38页
第五章 实验结果分析第38-50页
    5.1 基于关键词共现方法提取关键词的结果分析第38-43页
    5.2 随机森林参数选择第43-45页
        5.2.1 ntree的取值第43-44页
        5.2.2 mfeature的取值第44-45页
    5.3 运用随机森林算法的实验结果分析第45-49页
    5.4 本章小结第49-50页
第六章 总结及展望第50-52页
    6.1 本论文总结第50-51页
    6.2 未来展望第51-52页
参考文献第52-57页
致谢第57-58页
攻读硕士期间发表的论文第58页

论文共58页,点击 下载论文
上一篇:基于统计与条件随机场的中文地名识别
下一篇:我国收入差距、社会关系网络与居民主观幸福感研究