首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于自然语言处理的社交网络数据挖掘研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-13页
    1.1 选题背景和意义第10-11页
    1.2 国内外研究动态第11页
    1.3 本文主要研究内容第11-12页
    1.4 论文结构第12-13页
第2章 社交网络微博数据挖掘系统结构第13-20页
    2.1 数据挖掘系统结构第13页
    2.2 微博数据获取与存储第13-15页
        2.2.1 微博数据爬取策略第14页
        2.2.2 微博数据存储方法第14-15页
    2.3 微博数据处理中的自然语言处理第15-18页
        2.3.1 中文分词第15-17页
        2.3.2 特征表示第17-18页
    2.4 微博用户数据挖掘与分析第18-19页
        2.4.1 微博用户识别第18-19页
        2.4.2 微博用户划分第19页
    2.5 本章小结第19-20页
第3章 社交网络微博数据获取第20-28页
    3.1 微博数据爬虫系统设计第20-21页
    3.2 微博爬虫运行过程第21页
    3.3 用户模拟登录第21-22页
    3.4 微博页面解析第22-25页
    3.5 数据存储工具选择第25-26页
    3.6 数据存储格式设计第26-27页
    3.7 本章小结第27-28页
第4章 微博数据的自然语言处理研究第28-44页
    4.1 中文分词算法设计第28-29页
    4.2 分词模型训练方法第29-32页
        4.2.1 匹配词典选择第29页
        4.2.2 训练语料生成第29-30页
        4.2.3 自学习方法第30-31页
        4.2.4 分词结果融合方法第31-32页
    4.3 中文分词算法实验第32-36页
        4.3.1 验证算法的分词效果第33页
        4.3.2 验证算法的普遍适应性第33-36页
    4.4 用户特征表示第36-42页
        4.4.1 用户个人信息特征描述第36-39页
        4.4.2 用户微博信息特征描述第39-41页
        4.4.3 用户个人信息和微博信息融合第41-42页
    4.5 本章小结第42-44页
第5章 社交网络微博数据挖掘第44-56页
    5.1 基于SVM模型的垃圾用户识别第44-47页
        5.1.1 基于SVM模型的分类算法第44-46页
        5.1.2 SVM模型中核函数选择第46页
        5.1.3 SVM模型中松弛变量控制第46-47页
    5.2 基于SVM的用户识别实验第47-49页
    5.3 基于K-means算法的用户聚类分析第49-52页
        5.3.1 K-means聚类算法第49-50页
        5.3.2 K-means用户聚类算法评估第50-51页
        5.3.3 用户聚类分析第51-52页
    5.4 基于K-means的用户聚类算法实验第52-55页
    5.5 本章小结第55-56页
第6章 总结与展望第56-58页
    6.1 论文的主要贡献第56-57页
    6.2 工作展望第57-58页
参考文献第58-61页
攻读硕士学位期间发表的论文及参与科研情况第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于Web的S-76飞控系统故障诊断专家系统研究
下一篇:戏剧理论在青少年自我意识建构小组中的运用--以“小童大义”项目为例