首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

政府服务直通车上基于主题模型的信件分类管理

摘要第3-5页
Abstract第5-6页
第一章 绪论第9-17页
    1.1 选课背景及意义第9-11页
    1.2 相关知识点研究现状第11-14页
        1.2.1 文本自动分类技术的研究现状第11-12页
            1.2.1.1 文本自动分类总体研究第11-12页
            1.2.1.2 中文文本分类研究现状第12页
        1.2.2 主题模型的研究现状第12-14页
    1.3 文本挖掘概述第14-15页
    1.4 本文的主要内容与结构第15-16页
    1.5 本章小结第16-17页
第二章 文本分类相关知识第17-30页
    2.1 文本分类概述第17-18页
    2.2 文本预处理第18-21页
        2.2.1 词干提取第18-19页
        2.2.2 去停用词第19页
        2.2.3 中文分词第19-20页
        2.2.4 词性标注第20-21页
    2.3 文本表示第21-25页
        2.3.1 文档—词项矩阵第21页
        2.3.2 倒排索引结构第21-22页
        2.3.3 向量空间模型第22-25页
            2.3.3.1 TF-IDF权重计算第23-24页
            2.3.3.2 余弦相似度计算第24-25页
            2.3.3.3 空间向量模型表示信件文本的不适性第25页
        2.3.4 概率模型第25页
    2.4 特征选择第25-27页
        2.4.1 文档频率第26-27页
        2.4.2 卡方统计量(χ~2)第27页
    2.5 分类算法概述第27-29页
        2.5.1 朴素贝叶斯分类算法第27-28页
        2.5.2 k最邻近分类算法第28-29页
    2.6 本章小结第29-30页
第三章 主题模型第30-47页
    3.1 主题模型概述第30-31页
        3.1.1 主题的介绍第30-31页
        3.1.2 主题模型简介第31页
    3.2 隐性语义索引第31-32页
    3.3 概率隐性语义索引第32-34页
    3.4 LDA主题模型第34-37页
        3.4.1 LDA模型表示第34-35页
        3.4.2 LDA生成文档的过程第35-36页
        3.4.3 LDA主题模型的训练与推断第36-37页
    3.5 空间向量模型和主题模型的比较第37-38页
    3.6 基于LDA模型的信件分类实验第38-46页
        3.6.1 实验流程第38-39页
        3.6.2 实验环境及结果评价指标第39页
        3.6.3 实验数据集第39-40页
        3.6.4 预处理第40-41页
            3.6.4.1 一般预处理第40-41页
            3.6.4.2 空格处理程序第41页
        3.6.5 JGibbLDA第41-43页
            3.6.5.1 参数介绍第41-42页
            3.6.5.2 JGibbLDA的输入与输出第42-43页
        3.6.6 WEKA 3.6的使用第43-44页
        3.6.7 实验结果第44-46页
    3.7 本章小结第46-47页
第四章 BTM主题模型与信件分类管理的实现第47-66页
    4.1 概述第47页
    4.2 BTM主题模型第47-51页
        4.2.1 BTM主题模型的简介第48页
        4.2.2 BTM主题模型表示第48-50页
        4.2.3 BTM的参数估计第50-51页
    4.4 基于BTM模型建模的信件分类实验第51-55页
        4.4.1 实验流程第51页
        4.4.2 BTM模型的预处理第51-52页
        4.4.3 BTM模型的输入与输出第52-53页
        4.4.4 实验结果第53-55页
    4.5 二级词表处理方法第55-60页
        4.5.1 一般预处理及其不适性第55-56页
        4.5.2 二级词表处理方法第56-60页
    4.6 BTM建模结合二级词表处理技术的实验第60-64页
        4.6.1 实验流程第60-62页
        4.6.2 二级词表处理过程第62页
        4.6.3 实验结果第62-64页
    4.7 本章小节第64-66页
第五章 总结与展望第66-69页
    5.1 工作总结第66页
    5.2 笔者的收获第66-67页
    5.3 研究展望第67-69页
参考文献第69-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:石油污染土壤修复植物根际修复潜力评价研究
下一篇:JQ学院员工满意度研究