首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题模型的新闻标题分类方法研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-16页
   ·研究背景及意义第9-10页
   ·国内外研究现状第10-13页
     ·文本分类的国外研究现状第11-12页
     ·文本分类国内研究现状第12-13页
   ·新闻标题的文本特点第13页
   ·本文主要工作第13-14页
   ·文章组织结构第14-15页
   ·本章小结第15-16页
第二章 短文本分类相关理论概述第16-28页
   ·文本分类流程第16-17页
   ·文本预处理第17-19页
   ·特征提取第19-22页
     ·文档频率(DF)第20页
     ·信息增益(IG)第20-21页
     ·互信息(MI)第21页
     ·卡方统计量(CHI)第21-22页
     ·期望交叉熵(ECE)第22页
   ·文本表示第22-24页
     ·布尔模型第22-23页
     ·概率模型第23页
     ·向量空间模型第23页
     ·一主题模型第23-24页
   ·特征权重计算第24-25页
     ·词频权重(TF)第24页
     ·TF-IDF权重第24-25页
   ·常见文本分类算法第25-27页
     ·朴素贝叶斯分类算法(NB)第25-26页
     ·类中心点分类算法(Rocchio)第26页
     ·K最近邻分类算法(KNN)第26-27页
     ·支持向量机分类算法(SVM)第27页
   ·本章小结第27-28页
第三章 主题模型第28-40页
   ·主题模型简介第28-29页
   ·传统主题模型第29-32页
     ·LSI模型第29-30页
     ·PLSI主题模型第30-31页
     ·一元混合模型第31-32页
   ·LDA主题模型第32-35页
     ·LDA模型表示第32-34页
     ·LDA模型参数估计第34页
     ·JGibbLDA介绍第34-35页
   ·BTM主题模型第35-39页
     ·BTM模型表示第36-37页
     ·BTM模型参数估计第37-38页
     ·BTM模型使用介绍第38-39页
   ·本章小结第39-40页
第四章 基于主题模型的新闻标题分类方法研究第40-59页
   ·实验环境与实验流程第40页
   ·实验语料库及预处理第40-44页
     ·语料库的获取第40-41页
     ·评估标准第41-42页
     ·数据预处理以及新闻领域词典的使用第42-43页
     ·新闻领域词典对分类结果的影响实验第43-44页
   ·基于TF-IDF方法的不足第44-46页
   ·基于LDA主题模型的新闻标题分类实验第46-49页
     ·最优主题个数选取实验第46-47页
     ·基于LDA模型的不同分类算法对比实验第47-49页
   ·基于BTM主题模型的新闻标题分类实验第49-52页
     ·最优主题个数选取实验第49-50页
     ·基于BTM模型的不同分类算法对比实验第50-52页
   ·TF-IDF、LDA、BTM三种方法对比实验第52-53页
   ·关于民生类新闻的细分类研究第53-57页
     ·基于BTM模型的细分类算法对比实验第53-55页
     ·TF-IDF与BTM模型相结合的实验第55-56页
     ·民生类新闻的细分类方法对比实验第56-57页
   ·本章小结第57-59页
第五章 总结与展望第59-61页
   ·本文总结第59-60页
   ·未来展望第60-61页
参考文献第61-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:社会资本在农户借贷中的作用机制及其统计分析
下一篇:中国承接服务外包的经济效应分析