基于Web挖掘的中文网页分类的研究与实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-15页
·研究背景与意义	第10-11页
·国内外研究现状	第11-13页
·本文主要工作	第13页
·论文组织结构	第13-15页
第二章 Web 挖掘概述	第15-21页
·Web 挖掘基础	第15页
·Web 挖掘的分类	第15-18页
·Web 挖掘技术及应用	第18-20页
·本章小结	第20-21页
第三章中文网页分类技术	第21-32页
·网页分类模型	第21页
·关键技术	第21-24页
·分类算法	第24-30页
·分类算法类型	第24-26页
·文本分类算法	第26-28页
·算法评价	第28-30页
·综合分析	第30-31页
·目前网页分类中存在的问题	第30-31页
·本文系统模型	第31页
·本章小结	第31-32页
第四章网页正文净化模块的实现	第32-44页
·存储结构设计	第32-33页
·网页的特征分析	第33-36页
·结构特征	第33-35页
·语义特征	第35-36页
·基于启发规则的单模型净化方法	第36-41页
·清理 DOM 树	第36-37页
·第一阶段净化	第37-39页
·第二阶段净化	第39-41页
·实验	第41-43页
·实验环境及数据源	第41页
·结果及分析	第41-43页
·本章小结	第43-44页
第五章基于 SVM 的网页分类实现	第44-63页
·正文分词	第44-46页
·特征选择	第46-47页
·相关问题分析	第47-49页
·分类算法比较	第47-48页
·选择核函数	第48-49页
·SVM 多类分类	第49页
·基于多项式核函数的 BT-SVM	第49-58页
·基于二叉树的训练方法研究	第50-52页
·决策函数的计算量研究	第52-56页
·改进算法的流程	第56-58页
·实验及分析	第58-62页
·实验一	第58-60页
·分析	第60-61页
·实验二	第61-62页
·本章小结	第62-63页
第六章总结及展望	第63-64页
参考文献	第64-68页
致谢	第68-69页
在学期间的研究成果	第69页