首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

互联网舆情信息挖掘技术研究与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-15页
    1.1 研究背景及意义第11-12页
        1.1.1 背景第11页
        1.1.2 意义第11-12页
    1.2 国内外互联网舆情信息研究现状第12-13页
        1.2.1 国内研究现状第12页
        1.2.2 国外研究现状第12-13页
    1.3 本文主要研究内容第13页
    1.4 本文的组织和结构第13-15页
第二章 网络舆情信息挖掘第15-22页
    2.1 网络信息采集基础介绍第15页
    2.2 互联网舆情信息的获取第15-16页
    2.3 热点舆情话题判断第16-18页
    2.4 文本分类技术第18-19页
    2.5 语义分析技术第19-20页
    2.6 文本的情感倾向性分析第20页
    2.7 小结第20-22页
第三章 文本分类第22-35页
    3.1 文本分类技术研究现状第22页
    3.2 文本分类相关技术第22-33页
        3.2.1 文本分词第22-29页
        3.2.2 文本表示第29页
        3.2.3 特征词选择第29-31页
        3.2.4 文本分类算法第31-33页
    3.3 分类算法评价策略第33-34页
        3.3.1 召回率和准确率第33-34页
    3.4 本章小结第34-35页
第四章 网络爬虫与锚文本应用第35-48页
    4.1 网络爬虫应用背景第35页
    4.2 爬虫的搜索策略第35-36页
    4.3 网络爬虫的研究第36-39页
        4.3.1 通用爬虫技术第37-38页
        4.3.2 主题爬虫技术第38-39页
    4.4 基于锚文本的爬虫概要设计第39-42页
        4.4.1 高性能网络爬虫分析第40页
        4.4.2 基于锚文本的网络爬虫第40-42页
    4.5 锚文本应用分析第42-46页
        4.5.1 锚文本与热点关键词第42页
        4.5.2 锚文本分词第42-45页
        4.5.3 锚文本与关键词匹配第45-46页
    4.6 本章小结第46-48页
第五章 基于锚文本网络爬虫系统实现和测试第48-66页
    5.1 下载模块第48-53页
    5.2 网页分析模块第53-55页
        5.2.1 页面内容提取第53-54页
        5.2.2 URL 解析第54-55页
    5.3 网页内容去重模块第55-58页
    5.4 锚文本匹配模块第58-60页
        5.4.1 匹配流程第58-59页
        5.4.2 关键词存储第59-60页
    5.5 URL 分配模块第60-61页
    5.6 系统测试结果与分析第61-64页
        5.6.1 热点选词及分词结果第62-63页
        5.6.2 实验结果第63-64页
        5.6.3 结论第64页
    5.7 本章小结第64-66页
第六章 总结与展望第66-67页
参考文献第67-69页
攻读硕士学位期间取得的研究成果第69-70页
致谢第70-71页
附件第71页

论文共71页,点击 下载论文
上一篇:基于风险管控的实时动态安全生产管理信息系统设计与实现
下一篇:物资管理系统的设计与实现