高性能文本分类算法研究

摘要	第1-6页
Research on High-Performance Text Categorization	第6-16页
第一章引言	第16-26页
·研究背景	第16-17页
·研究意义	第17-19页
·信息组织	第17页
·信息过滤	第17页
·邮件分类	第17-18页
·话题跟踪	第18页
·新信息检测	第18-19页
·研究历史	第19页
·研究现状	第19-23页
·特征选择与压缩	第20页
·分类器组合	第20-21页
·小样本问题	第21页
·层次文本分类	第21-22页
·样本不均衡问题	第22-23页
·研究内容	第23-26页
第二章文本分类方法总结	第26-42页
·文本的表示与计算	第26-31页
·文本特征的表示	第26-27页
·文本相似度计算模型	第27-30页
·向量空间模型	第30-31页
·文本分类算法总结	第31-37页
·统计方法	第32-36页
·规则方法	第36-37页
·评价指标	第37-39页
·召回率与精确率	第37-38页
·BEP 与F-Measure	第38页
·微平均与宏平均	第38-39页
·文本分类语料库	第39-42页
·Reuter	第40页
·NewsGroup	第40页
·IndustrySector	第40页
·WebKB	第40-41页
·TDT	第41页
·OHSUMED	第41页
·TanCorp	第41-42页
第三章基于粗集理论的文本特征选择算法	第42-56页
·粗集理论简介	第42-45页
·基于粗集理论的特征选择算法	第45-49页
·已有特征选择算法总结	第49-52页
·文档频次	第49-50页
·互信息	第50页
·信息增益	第50-51页
·CHI 统计量	第51页
·交叉熵	第51页
·优势率	第51-52页
·词强度	第52页
·实验测评	第52-55页
·实验设计	第52-53页
·比较与分析	第53-55页
·本章小结	第55-56页
第四章基于拉推策略的文本分类器修正算法	第56-74页
·分类器偏差	第56-57页
·相关研究	第57-61页
·Bagging	第57-58页
·Boosting	第58-59页
·查询学习	第59-60页
·纠错输出编码	第60页
·Wu 的优化策略	第60-61页
·拉推策略	第61-67页
·基本原理	第61-63页
·应用到中心分类器	第63-64页
·应用到贝叶斯分类器	第64-65页
·应用到最近邻分类器	第65-67页
·与已有工作进行比较	第67页
·实验测评	第67-73页
·实验设计	第67-68页
·比较与分析	第68-73页
·本章小结	第73-74页
第五章拉推策略的改进与推广	第74-86页
·基于Margin 的拉推策略	第74-77页
·拉推策略的不足	第74页
·基于Margin 的拉推策略	第74-75页
·实验测评	第75-77页
·结合层次结构的拉推策略	第77-84页
·层次分类的优势	第77-78页
·把拉推策略引入到层次结构	第78-80页
·实验测评	第80-84页
·本章小结	第84-86页
第六章概念索引的改进与推广	第86-94页
·概念索引的改进	第86-90页
·概念索引	第86-87页
·概念索引的不足	第87页
·修正的概念索引	第87页
·实验测评	第87-90页
·分类器索引	第90-93页
·概念索引的推广	第90页
·分类器索引	第90-91页
·实验测评	第91-93页
·本章小结	第93-94页
第七章基于近似Margin 的分类器全局优化策略	第94-110页
·Margin 思想的由来	第94-100页
·统计学习理论	第94-97页
·支持向量机	第97-100页
·基于近似Margin 的全局优化函数	第100-101页
·基于近似Margin 的全局优化算法	第101-104页
·梯度修正公式	第101-102页
·两个修正算法	第102-104页
·实验测评	第104-109页
·实验设计	第104页
·比较与分析	第104-109页
·本章小结	第109-110页
第八章结束语	第110-114页
·本文主要贡献与创新	第110-111页
·下一步研究工作	第111-114页
参考文献	第114-122页
致谢	第122-123页
作者简历	第123-124页