首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题相似度的短文本分类方法研究

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 概率主题模型研究现状第11-13页
        1.2.2 短文本分类研究现状第13-14页
    1.3 研究内容及创新点第14页
    1.4 论文结构安排第14-16页
第二章 相关理论知识概述第16-28页
    2.1 文本分类第16-21页
        2.1.1 文本分类概述第16页
        2.1.2 文本分类的流程第16-17页
        2.1.3 文本分类介绍第17-21页
    2.2 文本预处理第21-23页
        2.2.1 文本切分第22-23页
        2.2.2 分词第23页
        2.2.3 去除噪音第23页
    2.3 特征选择方法和建模第23-26页
        2.3.1 特征选择第23-24页
        2.3.2 建模第24-26页
    2.4 文本分类性能评价指标第26页
    2.5 本章小结第26-28页
第三章 基于主题相似度的短文本模型构造第28-35页
    3.1 短文本特征分析第28-29页
    3.2 LDA主题模型第29-31页
        3.2.1 LDA主题模型的生成过程第30-31页
        3.2.2 吉布斯抽样原理第31页
    3.3 文本主题向量化第31-32页
    3.4 基于LDA模型的短文本分类第32页
    3.5 实验结果与分析第32-34页
        3.5.1 文本集预处理第32-33页
        3.5.2 实验结果分析第33-34页
    3.6 本章小结第34-35页
第四章 改进KNN分类算法设计实现第35-45页
    4.1 文本分类器第35-37页
        4.1.1 KNN分类算法第35-36页
        4.1.2 相似性度量第36-37页
        4.1.3 改进的KNN算法第37页
    4.2 改进KNN算法分类器第37-41页
        4.2.1 实验流程第37-38页
        4.2.2 参数设置第38-40页
        4.2.3 对比实验设计第40-41页
    4.3 实验结果与分析第41-44页
        4.3.1 实验环境第41页
        4.3.2 实验语料处理第41页
        4.3.3 吉布斯抽样过程第41-43页
        4.3.4 结果分析第43-44页
    4.4 本章小结第44-45页
第五章 总结展望第45-47页
    5.1 总结第45页
    5.2 展望第45-47页
参考文献第47-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:CRISPR/Cas9系统在斑马鱼基因编辑研究中的应用
下一篇:鸡快慢羽候选基因的筛选