首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文短文本分类技术的研究与实现

摘要第1-4页
Abstract第4-5页
目录第5-7页
第一章 绪论第7-15页
   ·选题背景及意义第7-8页
   ·国内外短文本分类技术研究现状第8-13页
     ·短文本分类研究现状第8-10页
     ·短文本的特点及分类研究中存在的难点第10-13页
   ·自然语言处理简介第13-14页
   ·本文内容组织结构第14页
   ·本章小结第14-15页
第二章 信息检索模型第15-24页
   ·布尔模型第15页
   ·概率模型第15-16页
   ·语言模型第16页
   ·向量空间模型第16-17页
   ·LDA主题模型第17-22页
     ·主题模型简介第17-18页
     ·LDA主题模型输入第18-19页
     ·主题模型假设第19页
     ·LDA主题模型表示第19-20页
     ·参数估计与Gibbs抽样第20-21页
     ·狄利克雷(Dirichlet)分布第21-22页
   ·向量空间模型和主题模型比较分析第22-23页
   ·本章小结第23-24页
第三章 常用文本分类相关技术第24-37页
   ·相关技术概述第24-25页
   ·文本预处理第25-29页
     ·词干提取第25页
     ·中文文本分词第25-29页
     ·去除停用词第29页
   ·文本表示第29页
   ·特征提取第29-32页
     ·互信息(MI)第30-31页
     ·卡方统计量(CHI)第31页
     ·信息增益(IG)第31-32页
     ·期望交叉熵(ECE)第32页
     ·文档频率(DF)第32页
   ·常用分类方法第32-36页
     ·Rocchio分类算法第33页
     ·贝叶斯分类算法第33-34页
     ·K最近邻分类算法第34-35页
     ·支持向量机分类算法第35-36页
   ·本章小结第36-37页
第四章 短文本信息扩充第37-46页
   ·常用的短文本信息扩充方法第37页
   ·基于搜索引擎的URL信息扩充方法第37-45页
     ·网络爬虫第38-39页
     ·搜索引擎选择第39-43页
     ·URL信息获取算法第43页
     ·JSOUP工具包第43-44页
     ·短文本扩充算法第44-45页
   ·本章小结第45-46页
第五章 实验与结果分析第46-57页
   ·实验环境第46页
   ·实验数据及结果评价指标第46-47页
   ·预处理第47-48页
   ·LDA模型工具使用第48-52页
     ·JGibbLDA第48-51页
     ·模型训练及实验方法输入第51-52页
   ·SVM实验结果第52-53页
     ·最优主题个数和主题模型分类结果第52-53页
     ·基于卡方特征提取的分类结果第53页
   ·朴素贝叶斯(NB)分类结果第53-55页
     ·主题模型分类结果第54-55页
     ·基于卡方特征提取的分类结果第55页
   ·基于共现网页的相似度比较分类结果第55-56页
   ·实验结果分析第56页
   ·本章小结第56-57页
第六章 结束语第57-59页
   ·总结第57页
   ·研究展望第57-59页
参考文献第59-62页
致谢第62-63页
攻读硕士期间发表的论文第63页

论文共63页,点击 下载论文
上一篇:智能优化算法在考虑加工成本的多目标差异工件平行机批调度问题中的应用研究
下一篇:云计算环境下基于属性加密的访问控制研究