首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎关键技术研究及分布式实现

摘要第5-6页
Abstract第6页
第一章 绪论第9-15页
    1.1 研究背景第9页
    1.2 垂直搜索引擎的研究现状第9-12页
        1.2.1 主题信息采集技术概述第10页
        1.2.2 主题分类算法研究第10-11页
        1.2.3 链接分析与页面排序算法研究第11-12页
    1.3 本文的研究目标和方向第12页
    1.4 论文组织结构第12-15页
第二章 基于内容的文本主题模型研究第15-35页
    2.1 主题文档模型研究第15-24页
        2.1.1 常见主题文档模型第15-16页
        2.1.2 Latent Dirichlet Allocator模型第16-19页
        2.1.3 垂直引擎中LDA模型应用分析第19-24页
    2.2 主题词库的建立第24-30页
        2.2.1 基于语料的词库建立第24-27页
        2.2.2 基于T-PMI的词库扩展第27-30页
        2.2.3 小结第30页
    2.3 基于主题的文本分词算法第30-34页
        2.3.1 通用文本分词算法第30-33页
        2.3.2 基于主题的文本分词算法第33-34页
    2.4 本章小结第34-35页
第三章 垂直资源挖掘与主题Ranking模型研究第35-51页
    3.1 Web链接结构中的主题相关度研究第35-39页
        3.1.1 PageRank算法第35-37页
        3.1.2 HITS算法第37-39页
        3.1.3 小结第39页
    3.2 面向垂直搜索的主题爬虫研究第39-46页
        3.2.1 基本爬虫策略第39-40页
        3.2.2 Fish-Search算法与Shark-Search算法第40-43页
        3.2.3 基于链接的主题爬虫研究第43-46页
    3.3 面向垂直搜索的主题Ranking模型研究第46-49页
        3.3.1 主题敏感PageRank算法第46-48页
        3.3.2 算法讨论第48-49页
        3.3.3 模型评价第49页
    3.4 本章小结第49-51页
第四章 分布式垂直搜索引擎原型设计第51-61页
    4.1 分布式爬虫研究第51-53页
        4.1.1 通信模型第51-52页
        4.1.2 爬虫整体框架第52-53页
        4.1.3 性能优化第53页
    4.2 LDA算法分布式研究第53-57页
        4.2.1 AD-LDA算法第54页
        4.2.2 基于Map-Reduce的分布式Gibbs Sampling第54-55页
        4.2.3 AD-LDA性能分析第55-57页
    4.3 系统整体框架第57-58页
    4.4 一个图书搜索实例第58-60页
        4.4.1 数据采集与处理第58-59页
        4.4.2 搜索权重研究第59页
        4.4.3 搜索结果展示第59-60页
    4.5 本章小结第60-61页
第五章 总结与展望第61-63页
    5.1 总结第61-62页
    5.2 展望第62-63页
致谢第63-65页
参考文献第65-66页

论文共66页,点击 下载论文
上一篇:基于多特征融合算法的人脸门禁系统研究
下一篇:面向手持式三维扫描设备的本征纹理重建