首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类技术研究

摘要第1-8页
ABSTRACT第8-10页
插图索引第10-11页
附表索引第11-12页
第1章 绪论第12-18页
   ·研究背景和意义第12-14页
   ·国内外研究的现状第14-15页
   ·文本分类技术的应用领域第15-16页
   ·本文的研究内容第16页
   ·本文的结构组织第16-18页
第2章 文本分类的理论基础和技术第18-34页
   ·文本挖掘和文本表示第18-19页
     ·文本挖掘第18页
     ·文本表示技术第18-19页
   ·中文文本的词语切分技术第19-22页
     ·汉语自动分词的必要性第19-20页
     ·汉语自动分词的难度第20-21页
     ·文本自动分词算法的分类第21-22页
     ·分词目标及评价第22页
   ·文本特征选择第22-27页
     ·特征项粒度第23页
     ·特征项选择方法第23-26页
     ·特征项权重计算第26-27页
   ·文本分类算法第27-32页
     ·文本分类的过程第27-28页
     ·传统的文本分类算法第28-32页
   ·分类性能评估第32-33页
   ·本章小结第33-34页
第3章 最大熵模型理论第34-40页
   ·统计语言模型第34页
   ·最大熵原理及其模型第34-36页
     ·最大熵原理的引入第34-35页
     ·最大熵的数学模型第35-36页
   ·参数估计算法第36-37页
     ·GIS算法第37页
     ·IIS算法第37页
   ·平滑技术第37-39页
     ·Good-Turing估计第38页
     ·Gaussian prior第38-39页
     ·exponential prior第39页
   ·本章小结第39-40页
第4章 用不等式约束改善最大熵模型的分类性能第40-47页
   ·最大熵在中文文本分类中的应用第40-41页
   ·不等式约束和不等式最大熵模型第41-42页
   ·基于不等式最大熵的特征选择算法第42-44页
     ·cut-off方法的问题第42页
     ·顺序前进法的问题第42-43页
     ·改进的顺序前进式特征选择算法第43-44页
   ·实验结果及分析第44-46页
     ·实验所用数据语料库第44页
     ·实验结果分析第44-46页
   ·本章小结第46-47页
第5章 面向中文文本分类的分词方法第47-51页
   ·汉语自动分词现状第47页
   ·中文文本自动分词算法第47-48页
   ·词条筛选第48-49页
   ·试验及结果分析第49-50页
     ·实验所用数据语料库第49页
     ·实验结果分析第49-50页
   ·本章小结第50-51页
结论第51-52页
参考文献第52-57页
致谢第57-58页
附录A 攻读学位期间所发表的学术论文目录第58页

论文共58页,点击 下载论文
上一篇:表面三维重建算法的研究及系统实现
下一篇:基于小波变换的图像融合技术研究