首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于N-Gram模型的藏文文本分类技术研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-14页
   ·文本分类的研究背景及意义第9-10页
   ·国内外研究概况第10页
   ·文本分类概述第10-13页
     ·文本自动分类第11页
     ·文本分类类型第11-12页
     ·文本分类模型第12-13页
   ·论文内容第13-14页
第二章 文本分类模型和常用分类方法第14-29页
   ·文本表示定义第14页
   ·文本分类常用模型第14-17页
     ·表示模型概述第14-15页
     ·向量空间模型第15-16页
     ·统计语言模型第16-17页
   ·常用文本分类算法介绍第17-19页
     ·神经网络算法第17页
     ·基于投票的方法第17-18页
     ·决策树分类算法第18页
     ·贝叶斯分类算法第18-19页
   ·藏文文本分类的步骤第19-20页
   ·特征降维第20-22页
     ·文档频率方法第20页
     ·互信息方法第20-21页
     ·χ2 统计量第21-22页
     ·单词权(Term Strength)第22页
   ·常用的文本分类器第22-25页
     ·Rocchio分类器第22-23页
     ·K近邻分类器第23-24页
     ·朴素贝叶斯分类器第24-25页
   ·文本分类模型的评估第25-28页
     ·分类模型的评估方法第25-26页
     ·文本分类器性能评估指标第26-28页
   ·本章小结第28-29页
第三章 基于N-Gram的藏文文本模型第29-36页
   ·藏文特点第29-31页
   ·基于N-Gram藏文语言模型的文本表示第31-32页
   ·N-GRAM模型关键问题第32-35页
     ·参数N的选择第32-33页
     ·N-Gram信息提取第33-34页
     ·N-Gram项生成算法第34-35页
   ·本章小结第35-36页
第四章 藏文文本分类系统设计第36-44页
   ·藏文文本分类系统第36-37页
   ·藏文文本分类器的设计第37-39页
     ·多项式朴素贝叶斯分类器第37-38页
     ·多类别处理第38-39页
   ·数据分析功能第39页
   ·多项式贝叶斯分类算法的实现第39-43页
     ·分类算法的详细设计与实现第39-41页
     ·训练算法的实现部分第41-43页
   ·本章小结第43-44页
第五章 实验结果与分析第44-50页
   ·语料库规模对分类系统的影响第44-45页
   ·特征降维实验第45-49页
     ·重叠的Bigrams第45-46页
     ·提升高度重叠的Bigrams到相应的Trigrams第46-49页
   ·小结第49-50页
第六章 总结与展望第50-51页
   ·总结第50页
   ·展望第50-51页
参考文献第51-54页
附录第54-57页
在校期间研究成果第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于ExtJS的馆藏少数民族文献信息编目系统的设计研究
下一篇:基于语义的唐卡图像标注与检索研究