首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于WEB页面的主题搜索的研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-16页
    1.1 研究背景和意义第10-11页
    1.2 搜索引擎概述第11-13页
        1.2.1 搜索引擎的概念第11页
        1.2.2 搜索引擎分类第11-12页
        1.2.3 主题搜索引擎第12-13页
    1.3 主题搜索引擎的发展及研究现状第13页
    1.4 研究内容和组织结构第13-16页
        1.4.1 本文的研究内容第13-14页
        1.4.2 本文的组织结构第14-16页
第二章 搜索引擎工作原理第16-22页
    2.1 搜索引擎工作原理第16-17页
    2.2 搜索引擎关键技术第17-18页
    2.3 通用搜索引擎的不足第18-19页
    2.4 搜索引擎核心技术第19-21页
        2.4.1 网络爬虫第19-20页
        2.4.2 网页排名算法第20-21页
    2.5 本章小结第21-22页
第三章 主题搜索引擎技术第22-30页
    3.1 主题搜索引擎概述第22-24页
        3.1.1 产生背景第22-23页
        3.1.2 基本体系结构第23页
        3.1.3 主题搜索引擎的关键技术第23-24页
    3.2 主题网络爬虫第24-29页
        3.2.1 通用网络爬虫概述第24-26页
        3.2.2 主题网络爬虫的工作原理第26页
        3.2.3 主题网络爬虫的设计第26-28页
        3.2.4 主题网络爬虫的关键技术第28-29页
    3.3 本章小结第29-30页
第四章 系统关键技术研究第30-49页
    4.1 主题网络爬虫的非贪婪遗传算法第30-35页
        4.1.1 基于网络搜索的遗传算法第30-31页
        4.1.2 基于超链接的非贪婪选择策略第31-32页
        4.1.3 非贪婪遗传搜索算法的介绍第32-33页
        4.1.4 相关性能分析第33-35页
    4.2 HTML网页解析第35-37页
        4.2.1 HTML网页的基本结构第35-36页
        4.2.2 HTML网页的树型结构第36页
        4.2.3 HTML网页解析第36-37页
    4.3 WEB网页信息分析第37-40页
        4.3.1 网页文本信息预处理第37页
        4.3.2 网页文本中文分词方法第37-39页
        4.3.3 特征向量权重计算第39-40页
    4.4 页面主题相关度判定第40-44页
        4.4.1 网页文本内容与主题相关度的判定第40-42页
        4.4.2 URL超链接与主题相关度的判定第42-44页
    4.5 WEB网页文本分类算法第44-47页
        4.5.1 WEB网页文本分类概述第44页
        4.5.2 朴素贝叶斯分类算法介绍第44-45页
        4.5.3 基于改进的K-均值的朴素贝叶斯分类算法介绍第45-47页
        4.5.4 性能分析第47页
    4.6 本章小结第47-49页
第五章 主题搜索在考研信息采集系统中的应用设计第49-69页
    5.1 系统概述第49-51页
        5.1.1 系统的设计原则第49页
        5.1.2 系统的基本结构第49-51页
    5.2 初始种子URL链接选取模块的设计第51-53页
    5.3 URL超链接调度模块的设计第53-56页
        5.3.1 URL链接的类型第53-54页
        5.3.2 URL链接的调度第54-56页
    5.4 页面采集模块的设计第56-57页
    5.5 页面解析模块的设计第57-62页
        5.5.1 页面结构解析第57-59页
        5.5.2 网页文本分析第59-62页
    5.6 主题相关性判定模块的设计第62-65页
    5.7 数据存储模块的设计第65-66页
        5.7.1 存储数据类型第65-66页
        5.7.2 数据库的设计第66页
    5.8 信息查询模块的设计第66-68页
    5.9 本章小结第68-69页
第六章 系统测试与分析第69-76页
    6.1 实验环境设置第69页
    6.2 系统实现第69-72页
    6.3 性能指标第72-73页
    6.4 结果分析第73-75页
    6.5 本章小结第75-76页
第七章 总结与展望第76-78页
    7.1 研究工作的总结第76页
    7.2 下一步的工作展望第76-78页
参考文献第78-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:“天人合一”的思维模式与现代生态伦理学的重建
下一篇:马克思主义哲学视域下的堕胎问题研究