首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

改进的互信息与LDA结合的特征降维方法研究

摘要第5-6页
Abstract第6页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
        1.1.1 研究背景第10页
        1.1.2 研究意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 研究内容及主要工作第12-13页
    1.4 论文的组织结构第13-14页
第二章 相关技术概述第14-24页
    2.1 文本分类介绍与预处理第14-16页
        2.1.1 文本分类介绍第14-16页
        2.1.2 文本预处理第16页
    2.2 文本表示模型第16-17页
    2.3 文本特征选择方法第17-19页
        2.3.1 文档频数第17-18页
        2.3.2 信息增益第18页
        2.3.3 χ~2统计量第18-19页
        2.3.4 互信息第19页
    2.4 常用文本分类算法第19-21页
        2.4.1 朴素贝叶斯第19-20页
        2.4.2 支持向量机第20页
        2.4.3 KNN算法第20-21页
    2.5 文本分类评估指标第21-23页
        2.5.1 准确率和召回率第22页
        2.5.2 F值第22页
        2.5.3 宏平均和微平均第22-23页
    2.6 本章小结第23-24页
第三章 互信息特征选择方法改进第24-34页
    3.1 传统互信息特征选择第24-26页
        3.1.1 传统互信息特征选择方法第24-25页
        3.1.2 传统互信息特征选择方法不足第25-26页
    3.2 影响强信息特征的因素第26页
    3.3 特征词词频第26-27页
        3.3.1 特征类频度第26-27页
        3.3.2 特征类内文本平均次数第27页
        3.3.3 最小词频数第27页
    3.4 类别区分词第27-29页
        3.4.1 类内分散度第28页
        3.4.2 类间离散度第28-29页
    3.5 特征词词频与类别区分词结合的改进第29-30页
    3.6 实验结果与分析第30-33页
        3.6.1 实验语料预处理第30页
        3.6.2 KNN算法中K值确定第30-32页
        3.6.3 实验对比分析第32-33页
    3.7 本章小结第33-34页
第四章 特征选择与LDA相结合的分类实现第34-49页
    4.1 主题模型第34-36页
        4.1.1 PLSA模型第34-35页
        4.1.2 LDA模型第35-36页
    4.2 改进的互信息特征选择与LDA模型相结合第36-39页
        4.2.1 基本流程图第36-37页
        4.2.2 LDA模型初始参数设定第37-38页
        4.2.3 LDA模型的推断第38-39页
        4.2.4 特征选择与LDA相结合的分类过程第39页
    4.3 实验结果与分析第39-48页
        4.3.1 实验环境与工具第39-40页
        4.3.2 实验语料预处理第40-41页
        4.3.3 主题数的选取第41-42页
        4.3.4 LDA训练过程第42-43页
        4.3.5 实验对比分析第43-48页
    4.4 本章小结第48-49页
第五章 总结与展望第49-51页
    5.1 全文总结第49页
    5.2 研究展望第49-51页
参考文献第51-54页
在校期间发表的论文、科研成果第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:婆媳关系中的孝与孝道
下一篇:企业员工个人—组织价值观匹配、组织承诺与工作绩效的关系研究