首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA的微博短文本分类技术的研究与实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·微博文本分类的意义第10页
   ·微博文本分类的作用第10-11页
   ·国内外研究现状第11-13页
     ·短文本分类研究现状第11-12页
     ·研究难度及解决方法第12-13页
   ·本文的主要工作第13-14页
   ·本文的组织结构第14-16页
第2章 相关理论及技术第16-28页
   ·文本预处理第16-19页
     ·分词技术第16-17页
     ·针对微博去除噪音第17-18页
     ·正则表达式第18-19页
   ·网络爬虫第19-22页
     ·网络爬虫概念及简介第20页
     ·工作原理第20-22页
   ·文本分类第22-25页
     ·文本分类概述第22-23页
     ·文档的相似性计算第23-24页
     ·对分类效果的评价第24-25页
   ·文档模型表示第25-26页
     ·向量空间模型(VSM)第25页
     ·LSA第25页
     ·PLSA第25页
     ·LDA第25-26页
   ·本章小结第26-28页
第3章 基于LDA的微博语义空间分析第28-38页
   ·LDA模型的详细描述第28-29页
   ·应用LDA的语义分析第29-32页
     ·Gibbs Sampling第29-30页
     ·Dirichlet分布第30-32页
     ·LDA模型的参数意义第32页
   ·基于LDA语义的微博文档特征第32-37页
     ·微博语义的表示形式第32-34页
     ·基于主题特征的微博文档表示形式第34-37页
   ·本章小结第37-38页
第4章 基于LDA的微博短文本分类第38-52页
   ·基于LDA的微博短文本分类框架第38-39页
   ·面向短文本的支持向量机的分类算法第39-46页
     ·支持向量机简介第40-41页
     ·面向短文本分类的支持向量机算法流程第41-44页
     ·短文本中多类问题的解决方案第44-46页
   ·微博数据下载第46-48页
   ·对文档-语义矩阵的分析及处理第48-49页
   ·基于LDA的微博短文本分类算法描述及实现第49-50页
   ·本章小结第50-52页
第5章 基于内容的微博用户分析第52-60页
   ·微博用户数据特点第52-54页
   ·微博用户数据获取第54-56页
   ·基于PMI及语义——单词矩阵的分析及处理第56-59页
   ·本章小结第59-60页
第6章 实验结果及分析第60-68页
   ·实验语料与实验环境第60-61页
     ·实验语料第60页
     ·实验环境第60-61页
   ·实验设计与分析第61-67页
     ·特征放大算法对文档-语义矩阵的影响第61-62页
     ·支持向量机参数空间搜索第62-63页
     ·主题数对于分类精度的影响第63页
     ·不同类别各自的分类结果第63-65页
     ·基于内容的用户微博分析第65-67页
   ·本章小结第67-68页
第7章 结论及未来工作第68-70页
   ·总结第68页
   ·进一步工作第68-70页
参考文献第70-72页
致谢第72-74页
攻硕期间参与项目及发表的论文第74页

论文共74页,点击 下载论文
上一篇:基于车载鱼眼机的运动目标检测与跟踪算法的研究
下一篇:基于手绘草图识别的电原理图生成