基于主题模型的新闻标题分类方法研究

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-16页
·研究背景及意义	第9-10页
·国内外研究现状	第10-13页
·文本分类的国外研究现状	第11-12页
·文本分类国内研究现状	第12-13页
·新闻标题的文本特点	第13页
·本文主要工作	第13-14页
·文章组织结构	第14-15页
·本章小结	第15-16页
第二章短文本分类相关理论概述	第16-28页
·文本分类流程	第16-17页
·文本预处理	第17-19页
·特征提取	第19-22页
·文档频率(DF)	第20页
·信息增益(IG)	第20-21页
·互信息(MI)	第21页
·卡方统计量(CHI)	第21-22页
·期望交叉熵(ECE)	第22页
·文本表示	第22-24页
·布尔模型	第22-23页
·概率模型	第23页
·向量空间模型	第23页
·一主题模型	第23-24页
·特征权重计算	第24-25页
·词频权重(TF)	第24页
·TF-IDF权重	第24-25页
·常见文本分类算法	第25-27页
·朴素贝叶斯分类算法(NB)	第25-26页
·类中心点分类算法(Rocchio)	第26页
·K最近邻分类算法(KNN)	第26-27页
·支持向量机分类算法(SVM)	第27页
·本章小结	第27-28页
第三章主题模型	第28-40页
·主题模型简介	第28-29页
·传统主题模型	第29-32页
·LSI模型	第29-30页
·PLSI主题模型	第30-31页
·一元混合模型	第31-32页
·LDA主题模型	第32-35页
·LDA模型表示	第32-34页
·LDA模型参数估计	第34页
·JGibbLDA介绍	第34-35页
·BTM主题模型	第35-39页
·BTM模型表示	第36-37页
·BTM模型参数估计	第37-38页
·BTM模型使用介绍	第38-39页
·本章小结	第39-40页
第四章基于主题模型的新闻标题分类方法研究	第40-59页
·实验环境与实验流程	第40页
·实验语料库及预处理	第40-44页
·语料库的获取	第40-41页
·评估标准	第41-42页
·数据预处理以及新闻领域词典的使用	第42-43页
·新闻领域词典对分类结果的影响实验	第43-44页
·基于TF-IDF方法的不足	第44-46页
·基于LDA主题模型的新闻标题分类实验	第46-49页
·最优主题个数选取实验	第46-47页
·基于LDA模型的不同分类算法对比实验	第47-49页
·基于BTM主题模型的新闻标题分类实验	第49-52页
·最优主题个数选取实验	第49-50页
·基于BTM模型的不同分类算法对比实验	第50-52页
·TF-IDF、LDA、BTM三种方法对比实验	第52-53页
·关于民生类新闻的细分类研究	第53-57页
·基于BTM模型的细分类算法对比实验	第53-55页
·TF-IDF与BTM模型相结合的实验	第55-56页
·民生类新闻的细分类方法对比实验	第56-57页
·本章小结	第57-59页
第五章总结与展望	第59-61页
·本文总结	第59-60页
·未来展望	第60-61页
参考文献	第61-67页
致谢	第67页