首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于C 4.5算法的BBS检索排名策略

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-12页
   ·研究背景第9-10页
   ·论文主要创新点和章节安排第10-12页
     ·创新点第10-11页
     ·本文结构第11-12页
第二章 检索模型分类第12-22页
   ·布尔模型第12-13页
   ·向量空间模型第13-15页
   ·概率模型第15页
   ·BBS检索系统的检索模型第15-17页
   ·Web Spam分类第17-19页
     ·垃圾索引(Spamdexing)第17-18页
     ·Content Spam(内容垃圾)第18-19页
     ·可编辑网页Spam第19页
   ·Spam对于用户检索的影响第19-20页
   ·本章工作总结第20-22页
第三章 系统总体介绍第22-28页
   ·系统框图第22-24页
     ·heritrix爬虫介绍第23-24页
   ·数据预处理第24-26页
   ·本章工作总结第26-28页
第四章 属性抽取模块第28-35页
   ·属性抽取模块概述第28页
   ·属性选取(Attributes Selection)第28-32页
     ·论坛网页帖子结构的特点第28-30页
     ·论坛网页抽取属性的确定第30-32页
   ·基于英文内容的句子分析第32-34页
     ·词性标注第32-33页
     ·词性标注工具介绍第33-34页
   ·本章工作总结第34-35页
第五章 分类模块及分类算法选择第35-42页
   ·分类模块介绍第35页
   ·分类算法的选择第35-40页
     ·常见分类算法第35-37页
     ·分类算法的选择第37页
     ·决策树算法比较第37-40页
   ·本章工作总结第40-42页
第六章 试验及相关结果分析第42-54页
   ·试验平台Weka介绍第42页
     ·Weka相关算法使用介绍第42页
   ·WEKA数据格式第42-44页
   ·试验流程第44-47页
     ·WEKA C4.5参数设置第45-46页
     ·WEKA C4.5分类器训练第46-47页
   ·实验结果以及结果分析第47-53页
     ·实验生成决策树的分析第47-50页
     ·试验结果数据分析第50-52页
     ·试验本身存在的问题第52-53页
   ·本章工作总结第53-54页
第七章 结束语第54-55页
参考文献第55-57页
致谢第57-58页
作者攻读学位期间发表的学术论文目录第58页

论文共58页,点击 下载论文
上一篇:一种网络安全审计系统的设计与实现
下一篇:基于虚拟化技术的网络访问控制系统模型研究