首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA多模型中文短文本主题分类体系构建与分类

摘要第4-5页
Abstract第5页
第1章 绪论第8-14页
    1.1 课题来源及研究目的和意义第8-9页
    1.2 国内外相关研究第9-11页
        1.2.1 文本分类历史第9-10页
        1.2.2 文本分类方法第10-11页
    1.3 短文本特点第11页
    1.4 本文研究内容第11-14页
        1.4.1 文本预处理第12页
        1.4.2 LDA 模型优质 Topic 筛选第12-13页
        1.4.3 多模型完备文本主题分类体系构建第13页
        1.4.4 LDA 多模型联合分类第13-14页
第2章 基于 LDA 单模型文本主题分类第14-33页
    2.1 文本预处理第14-17页
        2.1.1 数据基本情况第14页
        2.1.2 数据规格第14-15页
        2.1.3 数据去噪第15-16页
        2.1.4 主题表征词选择第16-17页
    2.2 LDA 主题模型简介第17-20页
        2.2.1 LDA 模型理论基础第17-19页
        2.2.2 LDA 模型文件解析第19-20页
    2.3 LDA 优质 Topic 筛选算法第20-26页
        2.3.1 独立性检测第21-23页
        2.3.2 表征词覆盖率第23-24页
        2.3.3 表征词方差第24-25页
        2.3.4 信息熵统计第25-26页
        2.3.5 优质 Topic 筛选算法的比较第26页
    2.4 LDA 单模型分类第26-28页
    2.5 SVM 短文本主题分类第28-31页
        2.5.1 SVM 简介第28-29页
        2.5.2 文本表示第29-30页
        2.5.3 LDA 单模型与 SVM 短文本主题分类比较第30-31页
    2.6 本章小结第31-33页
第3章 基于 LDA 多模型文本主题分类第33-51页
    3.1 多模型分类优点第33-35页
        3.1.1 不同分类粒度模型具备主题互补性第34页
        3.1.2 多模型提升分类稳定性与准确率第34-35页
    3.2 多模型文本主题分类体系构建第35-47页
        3.2.1 聚类算法简介第36-37页
        3.2.2 聚类算法评估第37-39页
        3.2.3 最佳聚类数目的确定第39-40页
        3.2.4 最佳模型个数确定第40-41页
        3.2.5 实验结果第41-44页
        3.2.6 标签词获取第44页
        3.2.7 分类体系简介第44-47页
    3.3 多模型文本主题分类方法第47-48页
    3.4 未登陆词处理第48页
    3.5 分类评测第48-50页
    3.6 本章小结第50-51页
第4章 基于 LDA 多模型微博文本主题分类第51-60页
    4.1 微信分类系统对微博分类第51页
    4.2 微博数据预处理第51-53页
        4.2.1 微博数据统计第52页
        4.2.2 微博主题性分析第52-53页
        4.2.3 微博高频词分析第53页
    4.3 微博文本主题分类第53-54页
        4.3.1 微博单模型主题分类第53页
        4.3.2 微博多模型分类体系构建与分类第53-54页
    4.4 微博与微信文本主题分类对比第54-59页
        4.4.1 文本基本统计信息对比第54-55页
        4.4.2 文本主题分类体系对比第55页
        4.4.3 文本主题分布对比第55-59页
    4.5 本章小结第59-60页
第5章 中文短文本主题分类系统第60-64页
    5.1 系统设计方法第60页
    5.2 系统模块介绍第60-62页
        5.2.1 文本分词第60-61页
        5.2.2 文本去噪第61页
        5.2.3 同义词林第61页
        5.2.4 单模型分类第61-62页
        5.2.5 多模型投票决策第62页
    5.3 系统使用方法第62-64页
结论第64-65页
参考文献第65-69页
攻读学位期间发表的学术论文第69-71页
致谢第71-72页

论文共72页,点击 下载论文
上一篇:偏振高光谱图像多维度信息提取及目标检测算法研究
下一篇:LANDMARC定位系统及其算法的研究