首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--文献标引与编目论文--分类法论文

多层次中文文本分类技术的研究

第1章 引言第1-12页
   ·研究背景第7-8页
   ·文本自动分类概述第8-9页
     ·概念第8页
     ·发展历程第8-9页
   ·文本自动分类的主要研究方法第9-10页
     ·自动聚类技术第9页
     ·自动归类技术第9-10页
   ·作者的主要工作第10-11页
   ·论文内容简介第11-12页
第2章 自动分类的国内外研究概况第12-28页
   ·自动分类中的基本概念第12-13页
   ·自动分类中的几个重要技术环节第13-14页
   ·特征加权算法第14-17页
     ·频率算法TF第14-15页
     ·反文档频率算法IDF第15-16页
     ·其它影响权重的信息第16-17页
   ·缩减维数算法第17-19页
     ·文档频率 Document Frequency第17页
     ·信息获取 Information Gain第17-18页
     ·互信息 Mutual Information第18页
     ·统计量CHI第18-19页
   ·分类器设计第19-28页
     ·纯粹贝叶斯法 Na?ve Bayes第19-20页
   ·2  最大熵模型 Maximum Entropy Model第20-21页
     ·最近邻法 K-Nearest Neighbor第21-22页
     ·神经元网络法 Neutral Network第22页
     ·支持向量机法 Support Vector Machines第22-24页
     ·向量空间模型 Vector Space Model第24-25页
     ·决策树 Decision Tree第25-26页
     ·小结-Bag of Word的可行性第26-28页
第3章 综合加权的特征提取算法第28-35页
   ·传统权重算法的不足第28-30页
   ·综合加权的特征提取算法第30-33页
     ·使用DI的改进算法第30-32页
     ·低频高权特征LFHW第32-33页
   ·特征重要度的测试TIT第33-35页
第4章 多层次分类算法第35-40页
   ·概念第35页
   ·意义第35页
   ·层次分类第35-40页
     ·多层次的分类体系第35-37页
     ·多层次分类与单层分类的比较第37-38页
     ·构造多层次模型第38-40页
第5章 分类与检索第40-43页
   ·检索的定义第40页
   ·检索的意义第40-41页
   ·检索的主要方法第41-42页
   ·自动分类对检索的意义第42-43页
第6章 系统的设计与实现第43-66页
   ·系统简介第43-45页
   ·系统总体流程图第45页
   ·系统分类体系第45-48页
   ·系统核心模块第48-66页
     ·词典及特征集的构造第48-52页
     ·预处理模块第52-57页
     ·特征提取模块第57-61页
     ·多层次的训练模块第61-62页
     ·多层次的识别模块第62-65页
     ·系统维护第65-66页
第7章 系统评测第66-77页
   ·测试目的第66页
   ·测试目标第66-70页
     ·分类系统的参数调整第66页
     ·性能指标测试第66-70页
   ·测试的环境和条件第70页
   ·分类的数据集第70-71页
   ·测试方案第71-77页
     ·开放式和封闭式测试第71页
     ·对分类性能的影响程度测试第71-76页
     ·多层次算法的实验结果第76-77页
第8章 结论与展望第77-78页
参考文献第78-82页
致谢、声明第82-83页
附录1第83-88页
附录2第88-89页
作者简历第89页

论文共89页,点击 下载论文
上一篇:跨国公司在华并购行为分析
下一篇:企业局域网环境入侵检测系统的研究