Web挖掘中超文本分类的研究与实现

摘要	第1-4页
ABSTRACT	第4-5页
目录	第5-7页
第一章绪论	第7-15页
·选题背景	第7页
·研究意义	第7-10页
·Web挖掘和Web文本分类	第7-8页
·文本分类的应用	第8-10页
·研究现状	第10-13页
·文献综述	第10-13页
·潜在的研究方向	第13页
·论文内容安排	第13-15页
第二章 Web挖掘概述	第15-27页
·引言	第15页
·数据挖掘	第15-17页
·数据挖掘的概念	第15页
·数据挖掘的分类	第15-17页
·Web挖掘	第17-25页
·Web数据的特点	第17-18页
·Web挖掘的概念	第18-19页
·Web挖掘流程	第19-20页
·Web挖掘分类	第20-25页
·Web内容挖掘(Web Content Mining)	第20-23页
·Web结构挖掘(Web Structure Mining)	第23-24页
·Web使用挖掘(Web Usage Mining)	第24-25页
·Web挖掘分类总结	第25页
·本章小结	第25-27页
第三章文本分类	第27-49页
·引言	第27页
·文本分类的概念	第27-28页
·文本分类方法分类	第28-29页
·文本表示方法	第29-30页
·向量空间模型的相关概念	第29-30页
·文本分类的特征抽取	第30-32页
·文本分类的特征选择	第32-37页
·特征选择的概念	第32-33页
·特征选择的类别可分性判据	第33页
·特征选择的方式	第33-34页
·常用特征选择方法	第34-37页
·文档频率(DF)	第34页
·信息增益(IG)	第34-35页
·互信息(MI)	第35-36页
·x~2统计量(CHI)	第36页
·特征词强度(TS)	第36-37页
·典型文本分类方法	第37-40页
·KNN	第37-38页
·TFIDF	第38-39页
·Naive Bayes	第39-40页
·分类评价标准	第40-41页
·文本分类实验方法	第41-42页
·基于Lee模型的Naive Bayes分类方法	第42-48页
·Sanban的文本分类方法	第42-44页
·我们的方法	第44-45页
·分类试验	第45页
·试验数据集	第45页
·试验方法	第45页
·试验结果及其分析	第45-47页
·训练百分比对分类精度的影响	第45页
·测试文档的部分读策略对分类算法的影响	第45-47页
·对两种策略下试验结果的解释	第47页
·结论	第47-48页
·本章小结	第48-49页
第四章基于规则的超文本分类	第49-59页
·引言	第49页
·超文本特点	第49-50页
·超文本的结构性特点	第49-50页
·超文本的组成	第50页
·超文本分类方法	第50-51页
·基于规则的超文本分类	第51-58页
·Yiming Yang超文本规则	第52页
·超文本表示方法	第52-53页
·分类试验	第53-55页
·试验数据集	第53页
·试验步骤	第53-54页
·预处理和特征提取	第54-55页
·试验结果及其分析	第55-57页
·分类精度随表示方法的变化情况	第55-56页
·运行时间比较	第56-57页
·结论	第57-58页
·本章小结	第58-59页
第五章结论和展望	第59-61页
·论文的工作总结	第59-60页
·论文的工作	第59页
·有待改进的地方	第59-60页
·进一步的研究方向	第60-61页
参考文献	第61-64页
攻读硕士学位期间发表(或己录用)的学术论文	第64-65页
致谢	第65-66页
附录1 试验中特征词被去掉的前缀和后缀	第66-67页
附录2 试验中选用的停止词表	第67-69页
西北工业大学学位论文知识产权声明书	第69页
西北工业大学学位论文原创性声明	第69页