Web文本挖掘的研究

摘要	第1-5页
Abstract	第5-8页
第一章绪论	第8-13页
·数据挖掘	第8页
·Web 数据挖掘	第8-10页
·Web 挖掘的过程	第8页
·Web 的特点	第8-9页
·Web 数据挖掘的目标	第9-10页
·Web 文本挖掘系统体系结构	第10-11页
·Web 文本挖掘的意义	第11页
·Web 文本挖掘的应用	第11-12页
·本文组织结构	第12页
·小结	第12-13页
第二章 Web 文本预处理	第13-21页
·文本提取	第13页
·文本形式化处理	第13页
·分词	第13-17页
·正向最大匹配算法(maximum match)	第14-15页
·逆向最大匹配算法	第15-16页
·基于统计的最短路径分词算法	第16-17页
·无词典的分词方法	第17页
·Web 文本特征表示	第17-18页
·文本特征选择	第18-20页
·信息增益	第18-19页
·互信息	第19页
·χ~2(CHI)统计	第19-20页
·本章小结	第20-21页
第三章 Web 文本数据挖掘	第21-36页
·Web 文本分类	第21-22页
·文本分类的两种类型	第21-22页
·文本分类的两种方式	第22页
·常用的方法	第22-27页
·Rocchio 方法-相似度计算方法	第22-24页
·Naive Bayes-朴素贝叶斯分类	第24页
·K 近邻文本分类法(KNN)	第24-25页
·支持向量机分类(SVM)	第25页
·决策树方法(Decision Tree)	第25-26页
·神经网络分类方法(Neural Networks)	第26-27页
·阈值选择策略	第27-28页
·Web 文本分类流程	第28页
·评估方法	第28-29页
·Web 文本聚类	第29-30页
·Web 文本聚类方法	第30-34页
·划分聚类法	第30-31页
·k-均值聚类	第31-32页
·对分k-平均法(Bisection k-means)	第32页
·层次聚类法	第32-34页
·聚类的评估	第34-35页
·小结	第35-36页
第四章基于属性加权的web 文本分类	第36-42页
·引言	第36页
·贝叶斯分类基本思想	第36页
·贝叶斯定理	第36-37页
·朴素贝叶斯文本分类模型	第37-39页
·模型构建	第37页
·参数估计	第37-38页
·分类	第38页
·加权朴素贝叶斯Web 文本分类	第38-39页
·基于加权朴素贝叶斯的分类算法	第39-40页
·分类结果评估	第40页
·实验测试与分析	第40-41页
·小结	第41-42页
第五章一种改进的支持向量机Web 文本分类	第42-48页
·引言	第42页
·支持向量机简介	第42页
·支持向量	第42-44页
·支持向量机分类方法	第44页
·改进的分类方法	第44-46页
·实验及分析	第46-47页
·小结	第47-48页
第六章总结和展望	第48-49页
·全文总结	第48页
·展望	第48-49页
参考文献	第49-52页
致谢	第52-53页