| 摘要 | 第1-6页 |
| Research on High-Performance Text Categorization | 第6-16页 |
| 第一章 引言 | 第16-26页 |
| ·研究背景 | 第16-17页 |
| ·研究意义 | 第17-19页 |
| ·信息组织 | 第17页 |
| ·信息过滤 | 第17页 |
| ·邮件分类 | 第17-18页 |
| ·话题跟踪 | 第18页 |
| ·新信息检测 | 第18-19页 |
| ·研究历史 | 第19页 |
| ·研究现状 | 第19-23页 |
| ·特征选择与压缩 | 第20页 |
| ·分类器组合 | 第20-21页 |
| ·小样本问题 | 第21页 |
| ·层次文本分类 | 第21-22页 |
| ·样本不均衡问题 | 第22-23页 |
| ·研究内容 | 第23-26页 |
| 第二章 文本分类方法总结 | 第26-42页 |
| ·文本的表示与计算 | 第26-31页 |
| ·文本特征的表示 | 第26-27页 |
| ·文本相似度计算模型 | 第27-30页 |
| ·向量空间模型 | 第30-31页 |
| ·文本分类算法总结 | 第31-37页 |
| ·统计方法 | 第32-36页 |
| ·规则方法 | 第36-37页 |
| ·评价指标 | 第37-39页 |
| ·召回率与精确率 | 第37-38页 |
| ·BEP 与F-Measure | 第38页 |
| ·微平均与宏平均 | 第38-39页 |
| ·文本分类语料库 | 第39-42页 |
| ·Reuter | 第40页 |
| ·NewsGroup | 第40页 |
| ·IndustrySector | 第40页 |
| ·WebKB | 第40-41页 |
| ·TDT | 第41页 |
| ·OHSUMED | 第41页 |
| ·TanCorp | 第41-42页 |
| 第三章 基于粗集理论的文本特征选择算法 | 第42-56页 |
| ·粗集理论简介 | 第42-45页 |
| ·基于粗集理论的特征选择算法 | 第45-49页 |
| ·已有特征选择算法总结 | 第49-52页 |
| ·文档频次 | 第49-50页 |
| ·互信息 | 第50页 |
| ·信息增益 | 第50-51页 |
| ·CHI 统计量 | 第51页 |
| ·交叉熵 | 第51页 |
| ·优势率 | 第51-52页 |
| ·词强度 | 第52页 |
| ·实验测评 | 第52-55页 |
| ·实验设计 | 第52-53页 |
| ·比较与分析 | 第53-55页 |
| ·本章小结 | 第55-56页 |
| 第四章 基于拉推策略的文本分类器修正算法 | 第56-74页 |
| ·分类器偏差 | 第56-57页 |
| ·相关研究 | 第57-61页 |
| ·Bagging | 第57-58页 |
| ·Boosting | 第58-59页 |
| ·查询学习 | 第59-60页 |
| ·纠错输出编码 | 第60页 |
| ·Wu 的优化策略 | 第60-61页 |
| ·拉推策略 | 第61-67页 |
| ·基本原理 | 第61-63页 |
| ·应用到中心分类器 | 第63-64页 |
| ·应用到贝叶斯分类器 | 第64-65页 |
| ·应用到最近邻分类器 | 第65-67页 |
| ·与已有工作进行比较 | 第67页 |
| ·实验测评 | 第67-73页 |
| ·实验设计 | 第67-68页 |
| ·比较与分析 | 第68-73页 |
| ·本章小结 | 第73-74页 |
| 第五章 拉推策略的改进与推广 | 第74-86页 |
| ·基于Margin 的拉推策略 | 第74-77页 |
| ·拉推策略的不足 | 第74页 |
| ·基于Margin 的拉推策略 | 第74-75页 |
| ·实验测评 | 第75-77页 |
| ·结合层次结构的拉推策略 | 第77-84页 |
| ·层次分类的优势 | 第77-78页 |
| ·把拉推策略引入到层次结构 | 第78-80页 |
| ·实验测评 | 第80-84页 |
| ·本章小结 | 第84-86页 |
| 第六章 概念索引的改进与推广 | 第86-94页 |
| ·概念索引的改进 | 第86-90页 |
| ·概念索引 | 第86-87页 |
| ·概念索引的不足 | 第87页 |
| ·修正的概念索引 | 第87页 |
| ·实验测评 | 第87-90页 |
| ·分类器索引 | 第90-93页 |
| ·概念索引的推广 | 第90页 |
| ·分类器索引 | 第90-91页 |
| ·实验测评 | 第91-93页 |
| ·本章小结 | 第93-94页 |
| 第七章 基于近似Margin 的分类器全局优化策略 | 第94-110页 |
| ·Margin 思想的由来 | 第94-100页 |
| ·统计学习理论 | 第94-97页 |
| ·支持向量机 | 第97-100页 |
| ·基于近似Margin 的全局优化函数 | 第100-101页 |
| ·基于近似Margin 的全局优化算法 | 第101-104页 |
| ·梯度修正公式 | 第101-102页 |
| ·两个修正算法 | 第102-104页 |
| ·实验测评 | 第104-109页 |
| ·实验设计 | 第104页 |
| ·比较与分析 | 第104-109页 |
| ·本章小结 | 第109-110页 |
| 第八章 结束语 | 第110-114页 |
| ·本文主要贡献与创新 | 第110-111页 |
| ·下一步研究工作 | 第111-114页 |
| 参考文献 | 第114-122页 |
| 致谢 | 第122-123页 |
| 作者简历 | 第123-124页 |