首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于微博的数据获取与过滤技术研究

摘要第5-6页
Abstract第6-7页
1 绪论第11-16页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-14页
        1.2.1 微博数据获取方法的研究第12-13页
        1.2.2 基于文本分类的数据过滤方法研究第13-14页
    1.3 论文研究内容第14-15页
    1.4 论文组织及结构第15-16页
2 微博研究背景基础与相关理论基础第16-28页
    2.1 微博背景及发展现状第16页
    2.2 意见领袖的选取第16-18页
    2.3 网络文本获取技术第18-23页
        2.3.1 网络爬虫简介第18-19页
        2.3.2 爬虫基本步骤及爬取策略第19-20页
        2.3.3 常用网络爬虫简介第20-23页
    2.4 文本分类第23-28页
        2.4.1 文本分词第24页
        2.4.2 特征选择第24-25页
        2.4.3 传统文本分类模型第25-28页
3 基于微博的数据获取方法第28-40页
    3.1 基于微博开放平台API第28-32页
        3.1.1 微博开放平台使用流程第28-29页
        3.1.2 授权机制第29-31页
        3.1.3 授权有效期第31页
        3.1.4 微博API第31-32页
    3.2 定向网络爬虫第32-37页
        3.2.1 模拟登录第33-35页
        3.2.2 网络爬虫数据获取第35-37页
    3.3 基于关注-分组模式第37-40页
        3.3.1 微博关注特点第37页
        3.3.2 微博分组功能第37页
        3.3.3 关注-分组接收机第37-40页
4 基于微博的数据过滤方法第40-48页
    4.1 文本分类流程第40-41页
    4.2 支持向量机分类器第41-48页
        4.2.1 SVM简介与思想第41-42页
        4.2.2 最优超平面第42-43页
        4.2.3 线性可分SVM第43-44页
        4.2.4 线性不可分SVM第44-45页
        4.2.5 非线性可分SVM第45页
        4.2.6 核函数第45-46页
        4.2.7 SVM使用步骤第46-47页
        4.2.8 SVM优缺点第47-48页
5 基于微博的数据获取与过滤系统设计与实现第48-66页
    5.1 系统介绍与整体框架第48-49页
    5.2 意见领袖选取模块第49页
    5.3 数据获取模块第49-57页
        5.3.1 基于微博API数据获取第49-52页
        5.3.2 基于定向网络爬虫数据获取第52-56页
        5.3.3 基于关注-分组模式自动接收数据获取第56-57页
    5.4 微博数据抓取内容第57-58页
    5.5 数据过滤模块第58-60页
    5.6 系统实验与分析第60-66页
        5.6.1 实验环境和实验数据第60页
        5.6.2 实验结果及分析第60-66页
6 总结和展望第66-68页
    6.1 本文工作总结第66页
    6.2 展望第66-68页
致谢第68-69页
参考文献第69-71页
硕士研究生阶段取得的主要成果第71页

论文共71页,点击 下载论文
上一篇:哈佛大学与芝加哥大学通识教育课程比较研究
下一篇:岸基GNSS-R多源海面测高技术研究