首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于weka的web文本挖掘的研究和实现

摘要第1-5页
Abstract第5-6页
目录第6-9页
第一章 绪论第9-12页
   ·研究背景及研究意义第9页
   ·国内外研究现状第9-10页
   ·本文主要研究内容第10页
   ·本文的组织结构第10-12页
第二章 web挖掘简介第12-17页
   ·web内容挖掘第13-14页
     ·web文本挖掘第14页
   ·web结构挖掘第14-15页
   ·web使用挖掘第15-17页
第三章 基于Nutch的文本数据的获取第17-38页
   ·Nutch简介第17-19页
   ·Nutch爬虫的工作策略第19-21页
   ·Nutch所使用的索引算法第21-22页
   ·Nutch所使用的排序算法第22-23页
   ·Nutch的二次开发第23-25页
     ·基于nutch的垂直搜索引擎的性能分析第24-25页
   ·hadoop计算模型—MapReduce第25-37页
     ·hadoop架构第25-27页
     ·HDFS的使用第27-37页
   ·本章小结第37-38页
第四章 基于weka文本挖掘第38-49页
   ·简介第38-39页
   ·weka支持的文件和实验类型第39-41页
     ·weka支持的文件第39-40页
     ·weka支持的实验类型第40-41页
   ·基于weka的实验结果第41-47页
     ·决策树分类结果第41-43页
     ·K最近邻算法分类结果第43-45页
     ·朴素贝叶斯分类结果第45-46页
     ·三类分类方法的校验结果比较第46页
     ·训练最优模型第46-47页
   ·本章小结第47-49页
第五章 系统实现与部署第49-66页
   ·软硬件环境第49页
   ·Nutch的安装第49-56页
     ·需求部分第49页
     ·安装步骤第49-56页
   ·Nutch中添加IKAnalyzer中文切词第56-59页
   ·hadoop的配置第59-62页
     ·安装sshd服务第59-61页
     ·安装hadoop第61-62页
   ·配置MapReduce的编写和调试环境第62-65页
     ·MapReduce对文件的提取第63-65页
   ·安装weka第65页
   ·本章小结第65-66页
第六章 总结及展望第66-68页
   ·总结第66页
   ·展望第66-68页
参考文献第68-70页
个人简历第70-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:基于3G网络的无线税源监控管理系统
下一篇:基于B/S架构的钢铁在线交易系统设计与实现