基于C 4.5算法的BBS检索排名策略

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-12页
·研究背景	第9-10页
·论文主要创新点和章节安排	第10-12页
·创新点	第10-11页
·本文结构	第11-12页
第二章检索模型分类	第12-22页
·布尔模型	第12-13页
·向量空间模型	第13-15页
·概率模型	第15页
·BBS检索系统的检索模型	第15-17页
·Web Spam分类	第17-19页
·垃圾索引(Spamdexing)	第17-18页
·Content Spam(内容垃圾)	第18-19页
·可编辑网页Spam	第19页
·Spam对于用户检索的影响	第19-20页
·本章工作总结	第20-22页
第三章系统总体介绍	第22-28页
·系统框图	第22-24页
·heritrix爬虫介绍	第23-24页
·数据预处理	第24-26页
·本章工作总结	第26-28页
第四章属性抽取模块	第28-35页
·属性抽取模块概述	第28页
·属性选取(Attributes Selection)	第28-32页
·论坛网页帖子结构的特点	第28-30页
·论坛网页抽取属性的确定	第30-32页
·基于英文内容的句子分析	第32-34页
·词性标注	第32-33页
·词性标注工具介绍	第33-34页
·本章工作总结	第34-35页
第五章分类模块及分类算法选择	第35-42页
·分类模块介绍	第35页
·分类算法的选择	第35-40页
·常见分类算法	第35-37页
·分类算法的选择	第37页
·决策树算法比较	第37-40页
·本章工作总结	第40-42页
第六章试验及相关结果分析	第42-54页
·试验平台Weka介绍	第42页
·Weka相关算法使用介绍	第42页
·WEKA数据格式	第42-44页
·试验流程	第44-47页
·WEKA C4.5参数设置	第45-46页
·WEKA C4.5分类器训练	第46-47页
·实验结果以及结果分析	第47-53页
·实验生成决策树的分析	第47-50页
·试验结果数据分析	第50-52页
·试验本身存在的问题	第52-53页
·本章工作总结	第53-54页
第七章结束语	第54-55页
参考文献	第55-57页
致谢	第57-58页
作者攻读学位期间发表的学术论文目录	第58页