首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

垂直搜索引擎网络爬虫的研究与设计

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-17页
    1.1 项目背景第10-11页
    1.2 通用搜索引擎的发展历史第11-12页
    1.3 垂直搜索引擎简介第12-15页
        1.3.1 垂直搜索引擎的发展和现状第12-13页
        1.3.2 垂直搜索引擎需求与分析第13-15页
    1.4 本文的主要成果及章节安排第15-17页
第二章 相关技术研究综述第17-25页
    2.1 搜索引擎的原理及流程第17-18页
    2.2 网络爬虫抓取策略第18-20页
    2.3 主题判断的研究现状第20-23页
        2.3.1 检索模型简介第20-21页
        2.3.2 布尔模型第21-22页
        2.3.3 向量空间模型第22-23页
    2.4 ROBOTS协议第23-24页
    2.5 开发环境第24页
    2.6 本章小结第24-25页
第三章 垂直搜索引擎的研究与设计第25-40页
    3.1 垂直搜索引擎的总体框架设计第25-27页
    3.2 网页结构化信息抽取的设计第27-32页
        3.2.1 Web信息抽取技术的分析第27-28页
        3.2.2 网页抽取模块的实现第28-32页
    3.3 中文分词模块的设计第32-34页
        3.3.1 分词模型的分析第32-33页
        3.3.2 中文分词模块的实现第33-34页
    3.4 URL判重模块的研究和实现第34-35页
    3.5 搜索引擎索引的设计第35-39页
        3.5.1 倒排索引基本原理第35-38页
        3.5.2 倒排索引的建立第38-39页
    3.6 本章小结第39-40页
第四章 面向博客领域的垂直搜索引擎的研究与设计第40-60页
    4.1 总体框架设计第40-42页
    4.2 各子系统的设计与实现第42-57页
        4.2.1 改进的网络爬虫抓取的实现第42-46页
        4.2.2 博客正文抽取的设计和实现第46-47页
        4.2.3 网页排序的研究和设计第47-52页
        4.2.4 网页去重的原理和实现第52-54页
        4.2.5 数据存储和缓存系统模块的设计第54-57页
    4.3 实验结果第57-59页
    4.4 总结第59-60页
第五章 结束语第60-62页
    5.1 论文工作总结第60-61页
    5.2 问题和展望第61-62页
参考文献第62-65页
致谢第65-66页
攻读学位期间发表的学术论文目录第66页

论文共66页,点击 下载论文
上一篇:基于宏—细观缺陷耦合的裂隙岩体动态损伤本构模型研究
下一篇:大海则煤矿大采高综采技术适应性研究