首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索及其关键算法的研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-14页
第一章 绪论第14-20页
    1.1 研究背景与意义第14页
    1.2 主题爬虫的研究现状第14-17页
        1.2.1 国外研究现状第15-17页
        1.2.2 国内研究现状第17页
    1.3 论文的主要研究内容第17-18页
    1.4 论文的结构安排第18-20页
第二章 主题爬虫的相关理论与技术第20-34页
    2.1 主题爬虫相关理论第20-24页
        2.1.1 网络爬虫的概念第20页
        2.1.2 通用网络爬虫系统框架第20-22页
        2.1.3 主题网络爬虫系统框架第22-23页
        2.1.4 通用网络爬虫与主题网络爬虫的区别第23-24页
    2.2 页面处理第24-29页
        2.2.1 HTML页面结构第25页
        2.2.2 内容提取第25-28页
        2.2.3 中文分词及去停用词第28-29页
    2.3 主题相关度计算第29-32页
        2.3.1 三种信息检索模型第29-31页
        2.3.2 主题相关度计算第31-32页
    2.4 本章总结第32-34页
第三章 引入时间因素的PageRank算法改进策略第34-42页
    3.1 PageRank算法分析第34-37页
        3.1.1 PageRank算法具体分析第34-35页
        3.1.2 PageRank算法的原理第35-37页
    3.2 引入时间因素的PageRank算法改进策略第37-40页
        3.2.1 PageRank算法优缺点分析第37页
        3.2.2 针对军事类主题页面的PageRank算法改进策略第37-40页
    3.3 本章总结第40-42页
第四章 针对主题漂移现象的PageRank算法的改进策略第42-48页
    4.1 Shark-Search算法分析第42-43页
    4.2 融合算法的改进策略第43-46页
        4.2.1 Shark-Search算法优缺点分析第43页
        4.2.2 融合Shark-Search算法和PageRank算法的改进策略第43-45页
        4.2.3 融合算法在系统具体应用流程第45-46页
    4.3 本章总结第46-48页
第五章 实验仿真与结果分析第48-60页
    5.1 实验体系结构第48-49页
        5.1.1 主题爬虫系统模块第48-49页
    5.2 实验环境与种子链接选取第49-50页
        5.2.1 实验的软硬件环境第49页
        5.2.2 种子链接的选取第49-50页
    5.3 性能评判标准第50-51页
    5.4 实验结果比较与分析第51-57页
        5.4.1 新算法性能与结果分析第51-53页
        5.4.2 应用新算法系统与传统索引性能对比第53-57页
    5.5 本章总结第57-60页
第六章 总结与展望第60-62页
    6.1 本文工作总结第60页
    6.2 未来展望第60-62页
参考文献第62-64页
致谢第64-66页
作者简介第66-67页

论文共67页,点击 下载论文
上一篇:基于感知哈希的图像重复数据删除技术的研究
下一篇:基于RSA/ECC算法的可配置加解密协处理器