首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

舆情挖掘系统的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 概述第10-18页
    1.1 网络舆情的研究背景第10页
    1.2 舆情挖掘系统研究背景第10-12页
        1.2.1 舆情挖掘系统概述第10-11页
        1.2.2 舆情挖掘系统与搜索引擎第11-12页
    1.3 国内外舆情挖掘系统研究现状第12-16页
        1.3.1 国外研究现状第12-14页
        1.3.2 国内研究现状第14-15页
        1.3.3 小型用户需求分析第15-16页
    1.4 本文的组织结构第16-18页
第二章 舆情相关技术第18-29页
    2.1 概述第18页
    2.2 网络爬虫第18-20页
        2.2.1 网络爬虫概述第18页
        2.2.2 通用爬虫介绍第18-19页
        2.2.3 主题爬虫介绍第19-20页
        2.2.4 定向爬虫介绍第20页
    2.3 正文提取方法第20-22页
    2.4 链接排重第22-24页
        2.4.1 链接排重概述第22页
        2.4.2 散列表排重第22-23页
        2.4.3 布隆过滤器排重第23-24页
    2.5 中文分词第24-28页
        2.5.1 中文分词概述第24-25页
        2.5.2 基于字符串匹配的分词方法第25-26页
        2.5.3 基于统计的分词方法第26-27页
        2.5.4 基于语义理解的分词方法第27-28页
    2.6 本章小结第28-29页
第三章 舆情挖掘系统分析与设计第29-44页
    3.1 概述第29页
    3.2 舆情挖掘系统架构设计第29-30页
    3.3 信息采集系统第30-33页
        3.3.1 信息采集系统概述第30页
        3.3.2 采集目标第30-31页
        3.3.3 采集频率第31-32页
        3.3.4 链接排重第32-33页
    3.4 信息处理系统第33-41页
        3.4.1 信息处理系统概述第33-34页
        3.4.2 论坛分割方法第34-36页
        3.4.3 基于模式的论坛正文提取方法第36-41页
        3.4.4 发帖时间提取方法第41页
    3.5 信息分析系统第41-43页
        3.5.1 中文分词第42页
        3.5.2 相似性计算第42-43页
    3.6 本章小结第43-44页
第四章 舆情挖掘系统的实现第44-60页
    4.1 系统开发概述第44-46页
        4.1.1 开发环境第44页
        4.1.2 开源工具第44-45页
        4.1.3 系统实现第45-46页
    4.2 系统功能实现第46-51页
        4.2.1 采集目标第46-47页
        4.2.2 采集频率第47-48页
        4.2.3 链接排重第48-50页
        4.2.4 新链接提取第50-51页
        4.2.5 论坛网页正文提取方法第51页
    4.3 系统实现结果第51-57页
    4.4 系统性能第57-59页
    4.5 本章小结第59-60页
第五章 总结与展望第60-61页
参考文献第61-64页
致谢第64-65页
攻读学位期间发表的学术论文第65页

论文共65页,点击 下载论文
上一篇:气流床煤气化模拟中反应动力学参数的优化研究
下一篇:鼓泡流化床气固两相流颗粒行为数值模拟研究