首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类中文本表示模型和特征选择算法研究

提要第1-5页
摘要第5-8页
Abstract第8-16页
第1章 绪论第16-26页
   ·研究背景第16页
   ·研究意义第16-18页
     ·信息过滤第16-17页
     ·信息组织和管理第17页
     ·词义辨析第17页
     ·数字图书馆第17-18页
   ·研究现状第18-23页
     ·文本表示第18-20页
     ·空间维度约减第20-21页
     ·文本分类器研究第21-23页
   ·本文的研究内容及组织结构第23-26页
     ·研究内容第23-24页
     ·组织结构第24-26页
第2章 文本分类技术第26-46页
   ·问题描述第26-28页
     ·单标号文本分类和多标号文本分类第26-27页
     ·以类别为中心和以文档为中心的文本分类第27页
     ·柔性文本文类和硬性文本分类第27页
     ·单层文本分类和分层文本分类第27-28页
   ·文本分类的框架第28-29页
   ·文本预处理及特征的识别第29-31页
     ·文本预处理第29-30页
     ·特征的识别第30-31页
   ·特征加权第31-32页
   ·特征选择和特征提取第32-35页
     ·特征选择第33-34页
     ·特征提取第34-35页
   ·文本分类器第35-40页
     ·朴素贝叶斯分类器第35-37页
     ·支持向量机第37-39页
     ·K 近邻算法第39-40页
     ·Rocchio 算法第40页
   ·分类性能评估第40-44页
     ·评价方法第40-41页
     ·评价标准第41-44页
   ·本章小结第44-46页
第3章 基于二项假设检验的特征选择第46-66页
   ·引言第46页
   ·相关特征选择算法第46-49页
     ·信息增益第47页
     ·基尼指数第47页
     ·卡方统计第47-48页
     ·基于泊松分布的特征选择第48-49页
   ·二项分布及假设检验第49-50页
   ·基于二项假设检验的特征选择算法第50-53页
     ·算法的理论依据第50-51页
     ·算法的实现第51-52页
     ·算法时间复杂度分析第52-53页
   ·模拟实验第53-65页
     ·数据集第53-54页
     ·分类器及评价标准第54页
     ·实验结果第54-61页
     ·统计分析与讨论第61-65页
   ·本章小结第65-66页
第4章 类内类间综合度量特征重要度的特征选择算法第66-82页
   ·引言第66页
   ·相关特征选择算法第66-67页
     ·文档频率第66-67页
     ·正交质心特征选择第67页
     ·DIA 关联因子第67页
   ·特征×类别矩阵第67-68页
   ·算法描述与实现第68-71页
     ·算法的研究动机第68-69页
     ·算法的实现第69-71页
     ·算法的时间复杂度分析第71页
   ·实验设计及结果第71-77页
     ·分类器、比对基准和评价标准第71-72页
     ·数据集第72-73页
     ·实验结果第73-77页
   ·统计分析与讨论第77-81页
     ·统计分析第77-78页
     ·讨论第78-81页
   ·结论第81-82页
第5章 基于文本关键词的文本表示模型第82-100页
   ·引言第82页
   ·常见的文本表示方法及其特点第82-83页
   ·基于文本关键词的文本表示方法第83-87页
     ·算法的理论基础第83-84页
     ·算法的实现第84-86页
     ·时间复杂度分析第86-87页
   ·模拟实验第87-97页
     ·实验环境设计第87页
     ·实验结果第87-94页
     ·实验结果分析第94-97页
   ·结论第97-100页
第6章 基于特征聚类的降维方法和文本表示第100-118页
   ·引言第100页
   ·常见的特征聚类方法第100-102页
   ·基于特征相对贡献度的特征聚类方法第102-106页
     ·算法的基本原理第102-104页
     ·基于特征相对贡献的相似性度量第104-105页
     ·基于聚类簇的文本表示第105-106页
   ·模拟实验第106-115页
     ·数据集、分类器和评价标准第106-107页
     ·采用的聚类算法第107-108页
     ·相关的相似性度量方法第108-109页
     ·实验结果第109-115页
     ·分析与讨论第115页
   ·结论第115-118页
第7章 总结和展望第118-122页
   ·本文工作总结第118-120页
   ·未来研究展望第120-122页
参考文献第122-134页
攻读博士学位期间发表的论文及参加的科研项目第134-136页
致谢第136页

论文共136页,点击 下载论文
上一篇:针对多维混合属性数据的聚类算法研究
下一篇:可变形形状分析与识别中若干问题的研究