首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类的文档索引机制及分类模型的研究

目录第1-7页
图表目录第7-9页
摘要第9-10页
ABSTRACT第10-11页
第一章 引言第11-17页
 §1.1 概述第11-12页
 §1.2 文本自动分类的研究现状第12-14页
 §1.3 本文的主要工作第14-15页
 §1.4 本文的结构第15-17页
第二章 分类任务描述及性能评价第17-23页
 §2.1 分类任务第17-18页
  2.1.1 任务描述第17-18页
  2.1.2 不同类型的文本分类任务第18页
 §2.2 分类系统的性能评价第18-22页
  2.2.1 样本集的划分第19-20页
  2.2.2 性能指标第20-22页
 §2.3 小结第22-23页
第三章 常用文本分类模型第23-33页
 §3.1 常用文本分类模型第23-30页
  3.1.1 Rocchio分类模型第23-24页
  3.1.2 朴素贝叶斯模型(Naive Bayes,NB)第24-25页
  3.1.3 决策树学习算法(Decision Tree)第25页
  3.1.4 kNN(kNearest Neighbor,k最邻近)算法第25-27页
  3.1.5 支撑向量机(Support Vector Machine,SVM)第27-28页
  3.1.6 神经网络模型(Neural Network,NN)第28页
  3.1.7 投票分类模型(Voted Classification)第28-30页
 §3.2 “最优”的分类模型?第30-32页
 §3.3 小结第32-33页
第四章 文档索引对分类效果的影响第33-66页
 §4.1 文档索引策略第33-44页
  4.1.1 文本表示(Text Representation)第33-35页
  4.1.2 可用的中文文档索引策略第35-42页
  4.1.3 实验及结果分析第42-43页
  4.1.4 小结第43-44页
 §4.2 特征空间的降维第44-58页
  4.2.1 特征选取第45-52页
  4.2.2 特征重构第52-57页
  4.2.3 小结第57-58页
 §4.3 索引项权重计算方法第58-63页
  4.3.1 权重的作用第58-59页
  4.3.2 之前的一些研究发现第59页
  4.3.3 经典的权重计算方法及其改进第59-62页
  4.3.4 分类实验及结果分析第62-63页
  4.3.5 小结第63页
 §4.4 章小结第63-66页
  4.4.1 所做工作总结第63-64页
  4.4.2 结论和建议第64-66页
第五章 辅以规则补充的文本分类研究第66-75页
 §5.1 基于规则的文本分类第66-67页
  5.1.1 基于知识工程的分类系统第66页
  5.1.2 基于规则学习的分类系统第66-67页
 §5.2 规则的学习第67-70页
  5.2.1 关联规则的挖掘第67-68页
  5.2.2 序列覆盖算法第68-69页
  5.2.3 并行覆盖算法第69-70页
  5.2.4 之前的一些研究工作第70页
 §5.3 辅以规则补充的文本分类第70-73页
 §5.4 分类实验及结果分析第73-74页
 §5.5 小结第74-75页
第六章 基于N元语言模型的文本分类研究第75-90页
 §6.1 N元语言模型第75-78页
  6.1.1 文本的“词链”表示法第75页
  6.1.2 之前的一些工作第75-76页
  6.1.3 常见的几种N元语言模型第76-78页
  6.1.4 语言模型的评价第78页
 §6.2 参数估计与平滑第78-83页
  6.2.1 Additive第79-80页
  6.2.2 Discounting第80-83页
  6.2.3 Back-off第83页
 §6.3 基于N元语言模型的文本分类第83-89页
  6.3.1 如何应用N元语言模型来进行文本分类?第83-84页
  6.3.2 分类实验结果第84-85页
  6.3.3 实验结果分析及结论第85-89页
 §6.4 小结第89-90页
结束语第90-92页
致谢第92-93页
攻读硕士期间发表的论文第93-94页
参考文献第94-101页
附录A: DF和DFR选取出的特征项子集第101页

论文共101页,点击 下载论文
上一篇:文昌鱼胰岛素类似肽的体外折叠行为和胰岛素的三个Val的结构、折叠作用的研究
下一篇:探寻“它之世界”--《智血》主题研究