首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于综合比率因子的互信息特征选择方法的改进

中文摘要第5-6页
Abstract第6-7页
第一章 绪论第11-15页
    1.1 课题研究背景与意义第11-12页
        1.1.1 研究背景第11页
        1.1.2 研究意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 研究内容以及主要工作第13-14页
    1.4 论文的组织结构第14-15页
第二章 文本分类技术的概述第15-26页
    2.1 文本分类的介绍第15-16页
    2.2 文本预处理第16页
        2.2.1 中文分词第16页
        2.2.2 去停用词第16页
    2.3 文本的特征选择第16-19页
        2.3.1 文档频率特征选择第17页
        2.3.2 信息增益特征选择第17-18页
        2.3.3 卡平方特征选择第18-19页
        2.3.4 互信息特征选择第19页
    2.4 文本的表示模型第19-20页
    2.5 文本分类算法第20-23页
        2.5.1 朴素贝叶斯算法第21页
        2.5.2 支持向量机算法第21-22页
        2.5.3 K近邻算法第22-23页
    2.6 分类评估指标第23-25页
        2.6.1 准确率和召回率第23页
        2.6.2 F值第23-24页
        2.6.3 微平均和宏平均第24-25页
    2.7 本章小结第25-26页
第三章 基于综合比率因子的改进第26-42页
    3.1 互信息特征选择方法第26-29页
        3.1.1 传统互信息方法的介绍第26-27页
        3.1.2 传统互信息方法存在的不足第27-29页
    3.2 强信息特征的标准第29页
    3.3 互信息改进的设计第29-33页
        3.3.1 类内平均词频信息第30-31页
        3.3.2 类内分散度信息第31-32页
        3.3.3 正负特征的比例第32-33页
    3.4 基于综合比例因子的改进第33-34页
    3.5 实验结果与分析第34-41页
        3.5.1 实验准备第34-35页
        3.5.2 平衡因子的α的选取第35-36页
        3.5.3 KNN算法中k值的确定第36-39页
        3.5.4 实验结果与对比分析第39-40页
        3.5.5 时间复杂度分析第40-41页
    3.6 本章小结第41-42页
第四章 结合语义的改进第42-50页
    4.1 语义信息的分析第42-43页
    4.2 结合语义的互信息第43-47页
        4.2.1 《知网》的简介第43-44页
        4.2.2 构建“概念-领域”表第44-45页
        4.2.3 结合语义信息的改进第45-46页
        4.2.4 词与向量空间的映射第46-47页
    4.3 实验及结果分析第47-49页
    4.4 本章小结第49-50页
第五章 总结与展望第50-52页
    5.1 全文总结第50页
    5.2 研究展望第50-52页
参考文献第52-55页
在校期间发表的论文、科研成果第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于分层的中文句子相似度的研究
下一篇:基于语义特征的微博评价对象抽取