首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向舆情监测的主题爬虫设计与分析

摘要第4-5页
ABSTRACT第5页
1 绪论第8-11页
    1.1 论文研究背景与意义第8-9页
    1.2 论文研究内容第9-11页
        1.2.1 研究内容第9页
        1.2.2 本文工作第9页
        1.2.3 论文组织结构第9-11页
2 相关研究第11-18页
    2.1 主题爬虫研究第11-14页
        2.1.1 传统网络爬虫第11-12页
        2.1.2 主题爬虫第12-14页
    2.2 网页净化和中文分词研究第14-16页
        2.2.1 网页净化第14-15页
        2.2.2 中文分词第15-16页
    2.3 SVM在主题爬虫中的应用研究第16页
    2.4 本章小结第16-18页
3 主题爬虫框架与网页预处理第18-33页
    3.1 主题爬虫框架分析第18-22页
        3.1.1 主题爬虫总体框架和搜索策略第18-20页
        3.1.2 主题爬虫网页下载模块第20页
        3.1.3 主题爬虫网页分析模块第20-22页
        3.1.4 主题爬虫URL去重模块第22页
        3.1.5 主题爬虫相关度分析模块第22页
    3.2 网页预处理分析第22-32页
        3.2.1 网页净化第23-25页
        3.2.2 中文分词第25-28页
        3.2.3 网页文本表示第28-30页
        3.2.4 文本相似度计算第30-32页
    3.3 本章小结第32-33页
4 主题爬虫SVM算法的研究与改进第33-43页
    4.1 支持向量机分类算法第33-38页
        4.1.1 基于二次规划的支持向量机线性分类算法第33-34页
        4.1.2 基于二次规划的支持向量机非线性分类算法第34-38页
    4.2 网页的SVM主题分类算法第38页
    4.3 改进的SVM主题分类算法第38-40页
    4.4 实验结果的比较与分析第40-42页
        4.4.1 数据准备第40页
        4.4.2 实验结果及比较第40-42页
    4.5 本章小结第42-43页
5 基于增量学习的SVN主题爬虫系统设计与实现第43-48页
    5.1 总体设计和框架结构第43-44页
    5.2 开发环境与开发工具第44-45页
    5.3 系统功能实现第45页
    5.4 舆情抓取第45-47页
    5.5 本章小结第47-48页
6 结论与展望第48-49页
    6.1 工作总结第48页
    6.2 工作展望第48-49页
7 参考文献第49-55页
8 攻读硕士学位期间论文发表情况第55-56页
9 致谢第56页

论文共56页,点击 下载论文
上一篇:基于Petri网的铁路运输安全的研究及应用
下一篇:模糊神经Petri网模型优化及应用