WEB文本模糊分类及其预处理的研究与实现

摘要	第1-3页
Abstract	第3-6页
第一章引言	第6-11页
·本论文的研究背景和意义	第6-7页
·Web 分类的国内外研究现状	第7-8页
·本文的创新点	第8页
·系统功能概述	第8-10页
·系统结构框架	第8-9页
·系统设计	第9-10页
·论文的组织安排	第10-11页
第二章 Web 文本挖掘	第11-20页
·Web 挖掘	第11-15页
·Web 挖掘的定义	第11页
·Web 挖掘的特点	第11-12页
·Web 挖掘的分类	第12-15页
·Web 文本挖掘	第15-19页
·Web 文本挖掘的定义	第15-16页
·Web 文本挖掘主要研究内容	第16-17页
·Web 文本挖掘的过程	第17-19页
·本章小结	第19-20页
第三章 Web 挖掘预处理	第20-32页
·Web 文本收集	第20-21页
·天网数据存储格式定义	第20-21页
·天网数据解压的实现	第21页
·Web 文本解析	第21-24页
·HTML 标记的去除	第22-23页
·Web 文本预处理器的实现	第23-24页
·中文分词	第24-31页
·常用中文分词算法	第25-27页
·未登录词的识别	第27-29页
·设计实现与分析	第29-31页
·本章小结	第31-32页
第四章文本特征向量提取	第32-38页
·向量空间模型	第32-33页
·常用的特征抽取方法	第33-35页
·TF*IDF	第35-37页
·特征项频率	第35页
·特征项倒排文档频率	第35-36页
·传统TF*IDF 的不足	第36-37页
·TF*IDF 的改进	第37页
·本章小结	第37-38页
第五章文本分类	第38-57页
·支持向量机	第38-43页
·最优分类面	第38-39页
·线性情况	第39-41页
·非线性情况	第41-43页
·支持向量机的进一步研究	第43-45页
·SVM 训练算法	第43-44页
·核函数及选择	第44-45页
·SVM 方法在文本分类中的应用	第45-46页
·双隶属度多类模糊支持向量机	第46-52页
·模糊支持向量机	第46-47页
·多类支持向量机	第47-48页
·双隶属度模糊支持向量机	第48-50页
·双隶属度多类模糊支持向量机	第50-52页
·实验结果及分析	第52-56页
·本章小结	第56-57页
第六章结束语	第57-58页
·本文的主要工作和贡献	第57页
·下一步的工作和展望	第57-58页
参考文献	第58-61页
致谢	第61-62页
个人简历、在学期间发表的学术论文与研究成果	第62页