首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互信息的短文本分类技术

摘要第5-7页
Abstract第7-8页
第1章 绪论第12-16页
    1.1 研究背景第12-14页
    1.2 本文的研究内容及面临的挑战第14页
    1.3 本文的贡献第14-15页
    1.4 本文的组织结构第15-16页
第2章 相关工作第16-28页
    2.1 文本相似度算法第16-21页
        2.1.1 基于向量空间模型VSM的方法第16-18页
        2.1.2 潜在语义索引方法第18-19页
        2.1.3 基于属性的文本相似度计算方法第19-20页
        2.1.4 基于语义的文本相似度计算方法第20-21页
    2.2 文本分类算法第21-27页
        2.2.1 K最近邻分类算法第21-22页
        2.2.2 朴素贝叶斯分类器第22-23页
        2.2.3 最大熵分类器第23-24页
        2.2.4 支持向量机(SVM)分类器第24-27页
    2.3 本章小结第27-28页
第3章 问题定义与问题分析第28-32页
    3.1 背景介绍第28-29页
    3.2 问题定义第29页
    3.3 问题分析第29-31页
    3.4 本章小结第31-32页
第4章 基于互信息的相似度函数第32-44页
    4.1 互信息第32-39页
        4.1.1 信息论中的重要概念第32-36页
        4.1.2 互信息定义第36-39页
    4.2 基于互信息的相似度函数第39-43页
        4.2.1 特征词间的互信息第39-41页
        4.2.2 基于互信息的相似度函数第41-43页
    4.3 本章小结第43-44页
第5章 基于主题词的短文本分类第44-54页
    5.1 文本预处理及特征选择第44-45页
        5.1.1 文本预处理第44-45页
        5.1.2 特征选择算法第45页
    5.2 主题词与类别的映射关系的抽取第45-49页
    5.3 基于主题词与类别的二元关系的文本分类第49-53页
        5.3.1 主题词与SVM相结合的短文本分类算法第50-51页
        5.3.2 基于主题词的短文本分类算法第51-53页
    5.4 本章小结第53-54页
第6章 实验与分析第54-66页
    6.1 实验设置及数据集分析第54-56页
    6.2 实验方法及步骤第56页
        6.2.1 基于互信息的短文本检索实验步骤第56页
        6.2.2 基于主题词的SVM短文本分类实验步骤第56页
    6.3 实验结果评价标准第56-57页
    6.4 RIS-SIR与COSIN-SIR的对比实验与结果分析第57-61页
    6.5 主题词与SVM相结合的文本分类器的实验与分析第61-63页
        6.5.1 KW-SVM的准确率实验与分析第61-62页
        6.5.2 KW-SVM的时间性能实验与分析第62-63页
    6.6 本章小结第63-66页
第7章 结束语第66-68页
    7.1 本文总结第66-67页
    7.2 工作展望第67-68页
参考文献第68-72页
致谢第72-74页
攻硕期间参加的项目及发表的论文第74页

论文共74页,点击 下载论文
上一篇:基于MFAC的独立光伏发电控制系统的研究
下一篇:面向科技领域的多文档摘要与综述报告自动生成