基于类别结构的文本层次分类方法研究
摘要 | 第1-15页 |
ABSTRACT | 第15-20页 |
第1章 绪论 | 第20-28页 |
·研究背景 | 第20-22页 |
·目前存在的问题和挑战 | 第22-24页 |
·主要研究内容 | 第24-26页 |
·创新点 | 第26页 |
·研究意义 | 第26-27页 |
·本文的组织结构 | 第27-28页 |
第2章 基础知识及相关研究 | 第28-47页 |
·基础知识 | 第28-38页 |
·类别层次结构的类型 | 第28-29页 |
·层次型文本分类的类型 | 第29-31页 |
·层次型文本分类的特点 | 第31-34页 |
·层次型文本分类的评价标准 | 第34-38页 |
·平面型文本分类的评价标准 | 第34-36页 |
·基于类别相似度的评价方法 | 第36-38页 |
·基于类别距离的评价方法 | 第38页 |
·相关研究 | 第38-46页 |
·基于爆炸式的层次分类方法 | 第39-40页 |
·基于自顶向下式的层次分类方法 | 第40-43页 |
·基于类树的层次分类方法 | 第40-43页 |
·基于自学习类树结构的层次分类方法 | 第43页 |
·大规模分类中的层次分类方法 | 第43-46页 |
·本章小结 | 第46-47页 |
第3章 面向层次分类的文本特征选择方法 | 第47-73页 |
·问题描述 | 第47-48页 |
·常用的文本特征选择方法 | 第48-50页 |
·相关工作 | 第50-51页 |
·目前研究中存在的问题 | 第51-52页 |
·类别层次相关度 | 第52-56页 |
·类别层次相关的概念 | 第52-53页 |
·类别层次相关度 | 第53-56页 |
·基于类别层次相关度的文本特征选择方法 | 第56-59页 |
·类别的层次重要度 | 第56页 |
·文档特征的类别相关性 | 第56-57页 |
·特征词的类别区分能力 | 第57-58页 |
·CHC算法的步骤 | 第58-59页 |
·算法时间复杂度分析 | 第59页 |
·实验 | 第59-71页 |
·数据集 | 第59-60页 |
·性能评价 | 第60-61页 |
·实验结果 | 第61-71页 |
·本章小结 | 第71-73页 |
第4章 一种基于类树全局信息的文本层次分类方法 | 第73-92页 |
·问题描述 | 第73页 |
·相关工作 | 第73-77页 |
·集成学习 | 第73-74页 |
·Boosting方法及其应用 | 第74-76页 |
·AdaBoost算法原理 | 第76-77页 |
·层次型文本分类中的Blocking现象 | 第77-79页 |
·一种基于类树全局信息的文本层次分类方法 | 第79-86页 |
·样本的层次重要性 | 第80页 |
·全局损失函数 | 第80-82页 |
·样本的权重更新 | 第82-83页 |
·训练层次分类器方法步骤 | 第83-85页 |
·时间复杂度分析 | 第85-86页 |
·实验 | 第86-91页 |
·数据集 | 第86-87页 |
·实验结果 | 第87-91页 |
·本章小结 | 第91-92页 |
第5章 基于回溯算法的文本层次分类方法 | 第92-107页 |
·问题描述 | 第92-93页 |
·相关工作 | 第93-95页 |
·回溯算法 | 第93-94页 |
·KNN算法 | 第94-95页 |
·目前研究中存在的问题 | 第95-96页 |
·基于回溯算法的文本层次分类方法 | 第96-103页 |
·特征的选择方法 | 第97-98页 |
·基于回溯算法的文本层次分类算法 | 第98-103页 |
·阈值的确定 | 第98-101页 |
·算法步骤 | 第101-103页 |
·算法分析 | 第103页 |
·实验 | 第103-106页 |
·数据集 | 第103-104页 |
·评价指标 | 第104页 |
·实验结果 | 第104-106页 |
·本章小结 | 第106-107页 |
第6章 总结与展望 | 第107-111页 |
·主要工作总结 | 第107-109页 |
·未来工作展望 | 第109-111页 |
参考文献 | 第111-122页 |
致谢 | 第122-123页 |
攻读学位期间发表的学术论文目录 | 第123-124页 |
攻读学位期间参与科研项目情况 | 第124-126页 |
学位论文评阅及答辩情况表 | 第126-128页 |
外文论文 | 第128-147页 |