摘要 | 第1-6页 |
Research on High-Performance Text Categorization | 第6-16页 |
第一章 引言 | 第16-26页 |
·研究背景 | 第16-17页 |
·研究意义 | 第17-19页 |
·信息组织 | 第17页 |
·信息过滤 | 第17页 |
·邮件分类 | 第17-18页 |
·话题跟踪 | 第18页 |
·新信息检测 | 第18-19页 |
·研究历史 | 第19页 |
·研究现状 | 第19-23页 |
·特征选择与压缩 | 第20页 |
·分类器组合 | 第20-21页 |
·小样本问题 | 第21页 |
·层次文本分类 | 第21-22页 |
·样本不均衡问题 | 第22-23页 |
·研究内容 | 第23-26页 |
第二章 文本分类方法总结 | 第26-42页 |
·文本的表示与计算 | 第26-31页 |
·文本特征的表示 | 第26-27页 |
·文本相似度计算模型 | 第27-30页 |
·向量空间模型 | 第30-31页 |
·文本分类算法总结 | 第31-37页 |
·统计方法 | 第32-36页 |
·规则方法 | 第36-37页 |
·评价指标 | 第37-39页 |
·召回率与精确率 | 第37-38页 |
·BEP 与F-Measure | 第38页 |
·微平均与宏平均 | 第38-39页 |
·文本分类语料库 | 第39-42页 |
·Reuter | 第40页 |
·NewsGroup | 第40页 |
·IndustrySector | 第40页 |
·WebKB | 第40-41页 |
·TDT | 第41页 |
·OHSUMED | 第41页 |
·TanCorp | 第41-42页 |
第三章 基于粗集理论的文本特征选择算法 | 第42-56页 |
·粗集理论简介 | 第42-45页 |
·基于粗集理论的特征选择算法 | 第45-49页 |
·已有特征选择算法总结 | 第49-52页 |
·文档频次 | 第49-50页 |
·互信息 | 第50页 |
·信息增益 | 第50-51页 |
·CHI 统计量 | 第51页 |
·交叉熵 | 第51页 |
·优势率 | 第51-52页 |
·词强度 | 第52页 |
·实验测评 | 第52-55页 |
·实验设计 | 第52-53页 |
·比较与分析 | 第53-55页 |
·本章小结 | 第55-56页 |
第四章 基于拉推策略的文本分类器修正算法 | 第56-74页 |
·分类器偏差 | 第56-57页 |
·相关研究 | 第57-61页 |
·Bagging | 第57-58页 |
·Boosting | 第58-59页 |
·查询学习 | 第59-60页 |
·纠错输出编码 | 第60页 |
·Wu 的优化策略 | 第60-61页 |
·拉推策略 | 第61-67页 |
·基本原理 | 第61-63页 |
·应用到中心分类器 | 第63-64页 |
·应用到贝叶斯分类器 | 第64-65页 |
·应用到最近邻分类器 | 第65-67页 |
·与已有工作进行比较 | 第67页 |
·实验测评 | 第67-73页 |
·实验设计 | 第67-68页 |
·比较与分析 | 第68-73页 |
·本章小结 | 第73-74页 |
第五章 拉推策略的改进与推广 | 第74-86页 |
·基于Margin 的拉推策略 | 第74-77页 |
·拉推策略的不足 | 第74页 |
·基于Margin 的拉推策略 | 第74-75页 |
·实验测评 | 第75-77页 |
·结合层次结构的拉推策略 | 第77-84页 |
·层次分类的优势 | 第77-78页 |
·把拉推策略引入到层次结构 | 第78-80页 |
·实验测评 | 第80-84页 |
·本章小结 | 第84-86页 |
第六章 概念索引的改进与推广 | 第86-94页 |
·概念索引的改进 | 第86-90页 |
·概念索引 | 第86-87页 |
·概念索引的不足 | 第87页 |
·修正的概念索引 | 第87页 |
·实验测评 | 第87-90页 |
·分类器索引 | 第90-93页 |
·概念索引的推广 | 第90页 |
·分类器索引 | 第90-91页 |
·实验测评 | 第91-93页 |
·本章小结 | 第93-94页 |
第七章 基于近似Margin 的分类器全局优化策略 | 第94-110页 |
·Margin 思想的由来 | 第94-100页 |
·统计学习理论 | 第94-97页 |
·支持向量机 | 第97-100页 |
·基于近似Margin 的全局优化函数 | 第100-101页 |
·基于近似Margin 的全局优化算法 | 第101-104页 |
·梯度修正公式 | 第101-102页 |
·两个修正算法 | 第102-104页 |
·实验测评 | 第104-109页 |
·实验设计 | 第104页 |
·比较与分析 | 第104-109页 |
·本章小结 | 第109-110页 |
第八章 结束语 | 第110-114页 |
·本文主要贡献与创新 | 第110-111页 |
·下一步研究工作 | 第111-114页 |
参考文献 | 第114-122页 |
致谢 | 第122-123页 |
作者简历 | 第123-124页 |