首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短文本分类技术研究

摘要第4-5页
Abstract第5-6页
1 绪论第9-14页
    1.1 研究背景及意义第9-11页
    1.2 短文本分类的研究现状第11-12页
    1.3 论文的相关内容第12-13页
    1.4 论文的结构安排第13-14页
2 短文本分类技术简介第14-26页
    2.1 基本概念第14-15页
    2.2 短文本的特点第15页
    2.3 文本分类相关技术第15-21页
        2.3.1 文本分类主要流程第15-16页
        2.3.2 文本分类算法第16-19页
        2.3.3 文本预处理第19页
        2.3.4 文本表示第19-21页
        2.3.5 特征降维第21页
    2.5 概率主题模型第21-24页
        2.5.1 一元混合模型(Mixture of unigrams)第22-23页
        2.5.2 LSI模型第23-24页
        2.5.3 pLSI模型第24页
    2.6 本章小结第24-26页
3 基于信息增益和LDA的中文短文本分类第26-35页
    3.1 信息增益第26-27页
    3.2 LDA模型第27-29页
        3.2.1 LDA模型的基本概念第27-28页
        3.2.2 LDA算法描述第28-29页
        3.2.3 建模结果第29页
    3.3 实验结果和分析第29-35页
        3.3.1 实验语料第29-30页
        3.3.2 实验过程与说明第30-32页
        3.3.3 评价指标第32-33页
        3.3.4 实验结果及分析第33-34页
        3.3.5 小结第34-35页
4 基于改进信息增益和LDA的中文短文本分类第35-43页
    4.1 信息增益的不足及相关定义第35页
    4.2 基于特征关联树模型剔除类内冗余特征第35-39页
        4.2.1 相关定义第35-36页
        4.2.2 改善类内特征分布不均第36-37页
        4.2.3 通过类内特征关联树模型清除冗余特征第37-38页
        4.2.4 基于类间加权离散度的信息增益公式改进第38-39页
    4.3 基本算法描述第39-40页
    4.4 实验结果及分析第40-43页
        4.4.1 实验语料第40页
        4.4.2 实验过程与说明第40-41页
        4.4.3 结果分析第41-42页
        4.4.4 小结第42-43页
结论第43-45页
参考文献第45-49页
攻读硕士学位期间发表学术论文情况第49-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:区域卫生一体化信息平台研究与实现
下一篇:数字图像修复技术在唐墓壁画中的应用