Web文本分类方法研究与系统实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章引言	第10-18页
·研究背景和意义	第10-12页
·研究背景	第10页
·Web 挖掘意义	第10-11页
·Web 文本分类意义	第11-12页
·文本分类技术的研究现状	第12-15页
·国外文本分类研究现状	第12-13页
·国内文本分类研究现状	第13-14页
·Web 文本分类研究现状	第14-15页
·课题研究难点及突出问题	第15-16页
·本文所作主要工作	第16-17页
·论文章节安排	第17-18页
第二章 Web 文本分类简介	第18-30页
·Web 挖掘简介	第18-21页
·什么是数据挖掘	第19页
·什么是Web 挖掘	第19-21页
·Web 文本挖掘	第21-24页
·Web 文本挖掘定义	第21页
·Web 文本挖掘的功能	第21-24页
·Web 文本分类	第24-29页
·Web 文本分类的定义	第24-25页
·Web 文本分类的关键技术	第25-26页
·Web 文本分类方法	第26-29页
·本章小结	第29-30页
第三章系统设计原理及总体框架	第30-36页
·系统设计原理	第30-31页
·系统总体框架	第31-34页
·逻辑架构模型概览	第31-33页
·系统用例图	第33-34页
·系统评估方法	第34-35页
·评估方法	第34页
·查准率、查全率、F-score	第34-35页
·本章小结	第35-36页
第四章 Web 文本自动抽取器的实现及分类训练集的建立	第36-45页
·Web 文本自动抽取器的实现	第36-42页
·网页爬取	第36-37页
·网页解析	第37-39页
·Web 文本自动抽取器实现	第39-41页
·自动抽取器抽取结果	第41-42页
·层次化训练集的建立	第42-44页
·本章小结	第44-45页
第五章 Web 文本分类的预处理研究与实现	第45-60页
·中文分词	第45-50页
·中文分词难点	第45-46页
·中文分词算法比较	第46-48页
·中文分词实现	第48-50页
·文本表示	第50-51页
·特征权重计算	第51-52页
·特征提取	第52-58页
·常用的特征提取方法比较	第52-54页
·基于改进的CHI 的特征提取方法	第54页
·特征提取实现	第54-57页
·特征提取算法测试	第57-58页
·本章小结	第58-60页
第六章 Web 文本的多层次分类器实现	第60-74页
·决策树和贝叶斯分类算法介绍	第61-64页
·决策树分类算法	第61-63页
·贝叶斯分类算法	第63-64页
·一种基于χ~2 值加权的层次分类方法	第64-72页
·Web 文本关键词提取	第64-67页
·一种基于 χ~2值加权的层次分类方法实现	第67-72页
·分类测试结果与分析	第72-73页
·本章小结	第73-74页
第七章总结与展望	第74-76页
·全文总结	第74-75页
·展望	第75-76页
致谢	第76-77页
参考文献	第77-81页
在学期间的研究成果	第81-82页
附录一	第82-84页