首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于网页相似度的搜索算法改进的研究

摘要第4-5页
Abstract第5页
第1章 绪论第9-15页
    1.1 研究背景及意义第9-11页
    1.2 国内外研究现状第11-12页
        1.2.1 国外研究现状第11页
        1.2.2 国内研究现状第11-12页
    1.3 论文的主要工作第12页
    1.4 论文的组织结构第12-15页
第2章 搜索引擎及Web数据挖掘第15-25页
    2.1 搜索引擎的发展简介第15-16页
    2.2 搜索引擎的分类第16-17页
        2.2.1 目录索引搜索引擎第16页
        2.2.2 元搜索引擎第16-17页
        2.2.3 全文搜索引擎第17页
    2.3 搜索引擎的基本组成第17-19页
        2.3.1 搜索器第17-18页
        2.3.2 索引器第18页
        2.3.3 检索器第18页
        2.3.4 用户接口第18-19页
    2.4 搜索引擎的评价标准第19页
        2.4.1 查全率第19页
        2.4.2 查准率第19页
    2.5 Web数据挖掘概述第19-25页
        2.5.1 Web数据挖掘的定义第20页
        2.5.2 Web数据挖掘的特点第20-21页
        2.5.3 Web数据挖掘的流程第21-22页
        2.5.4 Web数据挖掘的分类第22-25页
第3章 PageRank算法的研究与分析第25-32页
    3.1 PageRank算法概述第25页
    3.2 PageRank算法解析第25-30页
    3.3 PageRank算法存在的问题第30-31页
    3.4 基于PageRank算法的改进算法第31-32页
第4章 基于网页相似度的PageRank改进算法第32-38页
    4.1 算法改进的基本思想第32页
    4.2 文本相似度计算方法第32-34页
        4.2.1 欧氏距离第33页
        4.2.2 Jaccard距离第33页
        4.2.3 余弦距离第33页
        4.2.4 海明距离第33-34页
        4.2.5 编辑距离第34页
    4.3 超链接相似度计算方法第34-36页
        4.3.1 两个网页最短路径的长度第34-35页
        4.3.2 两个网页的共同祖先第35页
        4.3.3 两个网页的共同子孙第35页
        4.3.4 完整的超链接相似度计算第35-36页
    4.4 PageRank算法修正公式第36页
    4.5 算法流程第36-38页
第5章 原型系统设计与实现第38-46页
    5.1 技术选型第38-39页
    5.2 Iveely介绍第39页
    5.3 系统架构第39-40页
    5.4 搭建实验环境第40-42页
    5.5 算法评测第42-46页
第6章 结论与展望第46-48页
    6.1 结论第46页
    6.2 展望第46-48页
参考文献第48-50页
攻读学位期间取得的研究成果第50-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:山东省科学院科研人员绩效考核指标体系的研究与应用
下一篇:EVA与BSC结合的互联网企业绩效评价研究--以XL公司为例