中文Web文本分类关键技术研究与实现

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-13页
·课题背景	第7-8页
·Web 文本分类问题描述	第8页
·国内外研究现状	第8-10页
·本文的研究工作	第10页
·论文的组织结构	第10-13页
第二章 Web 文本挖掘概述	第13-19页
·Web 上的数据	第13-14页
·Web 数据挖掘分类	第14-15页
·Web 文本挖掘	第15-17页
·Web 文本挖掘的定义	第15-16页
·Web 文本挖掘过程	第16-17页
·本章小结	第17-19页
第三章中文 Web 文本分类关键技术	第19-43页
·基于 MapReduce 原理的 Web 文本预处理	第19-27页
·MapReduce 原理介绍	第19-21页
·Web 网页信息预处理	第21页
·中文分词技术	第21-24页
·词性标注方法	第24-27页
·文本特征表示	第27-34页
·文本向量的特征表示	第27-30页
·文本向量的特征权重计算	第30-32页
·向量空间模型的相似度计算方法	第32-33页
·基于关键词组合的 VSM 模型	第33-34页
·特征选择约减方法	第34-36页
·互信息量 MI	第35-36页
·X2统计量	第36页
·联合特征选择方法 UT	第36页
·文本分类器方法	第36-40页
·分类结果性能评估技术	第40-41页
·本章小结	第41-43页
第四章基于 Naive Bayes 理论文本分类器研究	第43-55页
·引言	第43页
·贝叶斯定理	第43-46页
·基于独立分量分析的朴素贝叶斯分类器	第46-49页
·独立分量分析(ICA)概述	第46-47页
·基于改进的 ICA 算法的 NB 分类器	第47-48页
·实验结果	第48-49页
·基于 SVM 文本分类器设计	第49-50页
·基于 Na ve Bayes 理论和 NB 相结合的 Web 分类器	第50-53页
·多分类器组合的两种框架	第51-52页
·朴素贝叶斯组合方法	第52-53页
·本章小结	第53-55页
第五章中文 Web 文本分类系统设计与实现	第55-73页
·系统介绍	第55页
·系统总体设计	第55-58页
·系统设计框架	第55-56页
·系统体系结构设计	第56-58页
·系统功能设计	第58页
·系统各模块详细设计	第58-67页
·多核多线程 MapReduce 原理应用	第59-60页
·Web 网页信息预处理	第60-63页
·中文自动分词模块	第63-64页
·特征约减提取模块	第64-65页
·多分类器组合分类模块	第65-67页
·分类系统运行界面	第67-70页
·系统实验结果分析	第70-71页
·本章小结	第71-73页
第六章总结与展望	第73-77页
·总结	第73-74页
·展望	第74-77页
致谢	第77-79页
参考文献	第79-82页