首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce的分布式文本数据过滤技术研究与系统实现

摘要第1-9页
ABSTRACT第9-10页
第一章 绪论第10-16页
   ·研究背景第10-12页
   ·研究现状第12-14页
   ·本文的主要研究内容和组织结构第14-16页
     ·本文的主要研究内容第14-15页
     ·本文的组织结构第15-16页
第二章 相关知识第16-29页
   ·信息过滤第16-23页
     ·信息过滤流程第16-17页
     ·信息过滤模型第17-19页
     ·文本分类第19-22页
     ·性能评价第22-23页
   ·MapReduce 及相关组件第23-28页
     ·MapReduce第23-26页
     ·HDFS第26-27页
     ·HBase第27-28页
   ·本章小结第28-29页
第三章 基于MapReduce 的分布式文本过滤关键技术研究第29-46页
   ·文本数据的预处理第29-33页
     ·网页数据的降噪处理第29-31页
     ·中文分词第31-33页
   ·文本数据的形式化表示第33-41页
     ·特征项选取第33-36页
     ·权重计算第36-38页
     ·基于HowNet 的特征项扩展第38-41页
   ·反馈学习第41-43页
     ·用户兴趣模板的反馈学习第41-43页
     ·过滤阈值的反馈学习第43页
   ·传统文本过滤技术的分布式扩展第43-45页
     ·分布式数据存储与索引第44页
     ·MapReduce 任务的优化第44-45页
   ·本章小结第45-46页
第四章 基于MapReduce 的分布式文本数据过滤系统设计与实现第46-57页
   ·系统总体架构的设计第46-47页
   ·文本数据的形式化表示模块第47-50页
     ·数据降噪子模块第47-48页
     ·中文分词子模块第48页
     ·特征提取子模块第48-50页
     ·基于HowNet 的特征扩展模块第50页
     ·权重计算子模块第50页
   ·相似度比较模块第50页
   ·自适应学习模块第50-51页
     ·用户兴趣模板自适应学习子模块第51页
     ·过滤阈值自适应学习模块第51页
   ·实验及结果分析第51-56页
     ·网页数据降噪第52页
     ·过滤精度测试第52-53页
     ·初始阈值的设定第53-54页
     ·基于HowNet 的特征扩展第54-55页
     ·过滤速度测试第55-56页
   ·本章小结第56-57页
第五章 结束语第57-59页
致谢第59-60页
参考文献第60-64页
作者在学期间取得的学术成果第64-65页
作者在学期间参加的科研工作第65页

论文共65页,点击 下载论文
上一篇:文件型恶意程序的定义及防御方法研究与实现
下一篇:基于WCET分析技术的程序实时性模型检验方法研究