首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题爬虫的视频教程库的研究与设计--以3dmax学科为例

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-13页
    1.1 课题的研究背景和意义第8-9页
    1.2 国内外研究现状第9-11页
        1.2.1 视频教程研究现状第9-10页
        1.2.2 主题爬虫研究方面第10-11页
    1.3 本文研究工作第11-12页
    1.4 本文的组织框架第12-13页
第二章 主题爬虫及相关算法研究第13-23页
    2.1 网络爬虫第13-15页
        2.1.1 网络爬虫原理及流程第13-14页
        2.1.2 网络爬虫的爬取策略第14-15页
    2.2 主题爬虫相关技术第15-20页
        2.2.1 主题搜索引擎第15页
        2.2.2 主题爬虫的特点第15-16页
        2.2.3 主题爬虫工作原理第16-17页
        2.2.4 主题爬虫的搜索策略的研究第17-20页
    2.3 网页消重检测第20页
    2.4 网页解析器jsoup第20-23页
第三章 资源检索Lucene技术研究第23-27页
    3.1 Lucene框架概述第23-25页
        3.1.1 Lucene框架第23-24页
        3.1.2 Lucene工作流程第24页
        3.1.3 Lucene的索引和查询类第24-25页
    3.2 Lucene索引创建第25-26页
        3.2.1 Lucene创建索引第25-26页
    3.3 Lucene索引查询第26-27页
第四章 基于主题爬虫的视频教程库的设计与实现第27-45页
    4.1 爬虫工具第27-29页
        4.1.1 Heritrix爬虫系统第27页
        4.1.2 Heritrix组件第27-29页
        4.1.3 Heritrix的运行流程第29页
    4.2 系统总体设计第29-30页
    4.3 系统主要模块的实现第30-45页
        4.3.1 修改order.xml文件,Robots.txt,提高抓取效率第30-31页
        4.3.2 初始链接网站的选择第31-34页
        4.3.3 扩展类实现特定网页抓取第34-37页
        4.3.4 多线程抓取网页第37-38页
        4.3.5 视频页面信息抽取模块第38-41页
        4.3.6 视频资源信息索引模块第41-43页
        4.3.7 视频资源信息搜索模块第43-45页
第五章 基于主题爬虫的视频教程库的测试与分析第45-54页
    5.1 系统开发环境与工具第45页
    5.2 JDK开发环境参数第45-46页
    5.3 视频教程库系统的原型设计第46页
    5.4 系统运行结果第46-51页
    5.5 系统性能分析第51-53页
        5.5.1 抓取效率分析第51-52页
        5.5.2 准确率性能分析第52-53页
        5.5.3 实验的对比及优缺点第53页
    5.6 本章小结第53-54页
第六章 总结与展望第54-56页
    6.1 研究总结第54页
    6.2 工作进一步展望第54-56页
参考文献第56-59页
致谢第59-60页
攻读硕士学位期间发表的学术论文目录第60页

论文共60页,点击 下载论文
上一篇:基于路径相似度测量的谱聚类算法研究
下一篇:网站数据完整性检测工具的设计与实现