首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA的短文本分类中特征扩展方法的研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 本文的研究内容第12-13页
    1.4 本文的组织结构第13-14页
第2章 相关技术与理论第14-23页
    2.1 文本表示模型第14-16页
        2.1.1 向量空间模型第14-15页
        2.1.2 向量权重计算方法第15-16页
    2.2 特征选择第16-19页
        2.2.1 基于文档频率的特征选择方法第16-17页
        2.2.2 信息增益法第17-18页
        2.2.3 X~2统计量法第18页
        2.2.4 互信息法第18-19页
    2.3 常用的分类方法第19-22页
        2.3.1 支持向量机第19-21页
        2.3.2 朴素贝叶斯第21-22页
    2.4 本章小结第22-23页
第3章 基于LDA的短文本特征扩展第23-38页
    3.1 LDA模型的详细描述第23-25页
    3.2 应用LDA的语义分析第25-28页
        3.2.1 Gibbs抽样第25-26页
        3.2.2 Dirichlet分布第26-27页
        3.2.3 LDA模型的参数第27-28页
    3.3 数据的获取和表示第28-32页
        3.3.1 数据获取第29页
        3.3.2 数据预处理第29-31页
        3.3.3 数据的特征选择第31-32页
    3.4 基于LDA的主题分布进行特征扩展第32-36页
        3.4.1 LDA模型的主题-词分布第32-35页
        3.4.2 根据LDA的主题进行特征词扩展第35-36页
    3.5 基于LDA进行特征扩展的局限性第36-37页
    3.6 本章小结第37-38页
第4章 基于特征分类权重的自选机制第38-49页
    4.1 特征分类权重第38-42页
        4.1.1 特征词的类间分布第39-40页
        4.1.2 特征词的类内离散度第40页
        4.1.3 特征词的不完全分类的权重第40-41页
        4.1.4 特征词的分类权重及相关性计算第41-42页
    4.2 特征自选机制第42-48页
        4.2.1 特征项与文档的相关性计算第42-43页
        4.2.2 基于特征项与文档分类相关性的特征自选机制第43-48页
    4.3 本章小结第48-49页
第5章 短文本分类实验第49-58页
    5.1 短文本分类第49-50页
    5.2 实验数据准备第50-51页
    5.3 分类评价标准第51-54页
    5.4 实验结果分析第54-57页
    5.5 本章小结第57-58页
第6章 总结和展望第58-61页
    6.1 工作总结第58-59页
    6.2 工作展望第59-61页
致谢第61-63页
参考文献第63-66页
附录第66页

论文共66页,点击 下载论文
上一篇:基于PXI的无线信道测量技术及其传播特性研究
下一篇:基于群体特征的页面抽取方法研究