首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

蒙文文本分类技术研究与系统设计实现

摘要第1-6页
ABSTRACT第6-8页
目录第8-10页
图表目录第10-11页
第一章 引言第11-15页
   ·课题背景及文本分类发展现状第11-12页
   ·主要研究内容和目的第12-13页
   ·文本分类的应用第13-14页
     ·网页的自动分类第13页
     ·垃圾邮件过滤第13页
     ·个性化服务第13-14页
   ·开发工具、技术及开发环境第14页
   ·论文结构第14-15页
第二章 文本分类的概念和向量空间模型第15-21页
   ·文本分类的概念第15-19页
     ·现代文本分类的基础理论──机器学习第15-16页
     ·文本分类的定义第16-18页
       ·文本采集第17页
       ·特征选择第17页
       ·分类器第17-18页
       ·训练、测试及结果评价第18页
     ·单分类、多分类第18-19页
     ·阈值策略第19页
     ·以文档为主的分类方法和以类别为主的分类方法第19页
   ·向量空间模型第19-21页
第三章 分类器第21-27页
   ·分类器概述第21页
   ·K-邻近算法第21-22页
   ·支持向量机算法第22-23页
     ·支持向量机简介第22-23页
   ·分类系统的性能评价第23-27页
     ·常用的评估参数介绍第23-25页
     ·其他一些评估参数介绍第25-27页
第四章 蒙文文本分类系统设计与关键技术问题第27-40页
   ·系统总体框架第27-28页
   ·词干提取第28-29页
   ·特征提取第29-35页
     ·单词的权重计算方法第29-31页
       ·布尔表示方法第29-30页
       ·词频度表示方法第30页
       ·TF×IDF 权重法第30页
       ·TFC 权重法第30页
       ·LTC 权重法第30-31页
     ·文本的降维和特征选择方法第31-35页
       ·文档频率第31页
       ·互信息第31-32页
       ·信息增益第32-33页
       ·卡方统计量第33-34页
       ·交叉熵第34页
       ·几种方法的比较第34-35页
   ·样本库和数据表第35-36页
   ·分类器第36-39页
     ·K-邻近算法第36页
     ·支持向量机线性可分模式的最优超平面构造第36-37页
     ·支持向量机线性不可分模式的最优超平面构造第37-38页
     ·常用核函数介绍第38-39页
   ·系统的各项参数第39-40页
第五章 蒙文文本分类系统的实现第40-54页
   ·蒙文词根词干提取第40-43页
     ·名义字符和变显字符第40页
     ·目的和工作第40-41页
     ·数据结构与算法第41-43页
   ·分类部分的主要数据结构与算法第43-52页
   ·分类结果分析和未知文档的分类第52-54页
第六章 试验结果和总结第54-61页
   ·试验结果第54-59页
     ·K-邻近算法试验结果第54-57页
     ·支持向量机算法试验结果第57-59页
   ·论文总结第59-60页
   ·进一步研究工作第60-61页
用到的数学符号、公式介绍第61-62页
参考文献第62-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:朝阳地区油松天然更新规律及人工促进措施研究
下一篇:反人类罪研究