首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于元信息的文本分类与优化技术研究与实现

摘要第1-10页
ABSTRACT第10-11页
第一章 绪论第11-16页
   ·研究背景及意义第11-12页
   ·国内外相关研究的现状第12-14页
     ·文本分类研究现状第12-13页
     ·文本分类面临问题第13-14页
   ·本文研究的主要内容第14页
   ·本文的组织结构第14-16页
第二章 文本分类相关研究第16-30页
   ·训练语料的构建第17-18页
   ·爬虫技术第18页
   ·数据预处理第18-21页
     ·文本解析第18-19页
     ·分词第19-20页
     ·停用词去除第20-21页
   ·文本表示模型第21-22页
   ·特征降维第22-26页
     ·特征选择第22-24页
     ·特征提取第24-26页
   ·分类方法第26-28页
   ·分类效果评估体系第28-29页
   ·本章小结第29-30页
第三章 基于元信息的文本分类方法第30-41页
   ·研究背景第30页
   ·Web 文本元信息第30-35页
     ·新闻网页第30-31页
     ·博客第31-33页
     ·论坛,杂谈(BBS)第33-34页
     ·即时通信第34页
     ·微博第34-35页
   ·基于LDA 的文本分类算法第35-38页
     ·主题建模背景第36页
     ·LDA 主题建模第36-37页
     ·中心向量法第37页
     ·算法流程第37-38页
   ·基于元信息的文本分类算法第38-39页
   ·实验分析第39-41页
第四章 基于元信息的文本分类性能优化算法第41-48页
   ·问题背景第41页
   ·基于信息增益和 LDA 的文本分类第41-43页
     ·信息增益预过滤词汇的必要性第42页
     ·算法流程第42-43页
   ·分布式文本分类第43-45页
   ·实验分析第45-48页
     ·基于信息增益和 LDA 文本分类实验第45-47页
       ·分类F1 值与α 关系第46页
       ·分类器运行速度与α 关系第46-47页
     ·分布式文本分类第47-48页
第五章 面向网络舆情监测的大规模文本分类系统设计第48-61页
   ·YHPODS 系统简介第48-49页
   ·UIMA AS 架构简介第49-53页
     ·UIMA 简介第49-51页
       ·UIMA 基本概念第50-51页
       ·UIMA 数据处理流程第51页
     ·UIMA AS 简介第51-53页
       ·UIMA AS 相关概念第52-53页
       ·UIMA AS 并行机制第53页
   ·面向舆情监测的大规模文本分类系统第53-57页
     ·MTCS 整体设计第53-55页
     ·大规模文件的读取第55-56页
     ·文件解析第56页
     ·文本分类第56-57页
   ·系统演示第57-61页
第六章 结束语第61-63页
致谢第63-64页
参考文献第64-68页
作者在学期间取得的学术成果第68-69页
作者在学期间参加的科研工作第69页

论文共69页,点击 下载论文
上一篇:Krylov子空间方法的GPU加速算法研究
下一篇:基于元数据的数据库可扩展设计关键技术