首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的Web文本挖掘的关键技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·研究背景与意义第9-10页
   ·相关技术的国内外现状第10-12页
     ·云计算技术的国内外研究现状第10-11页
     ·数据挖掘技术的国内外研究现状第11-12页
   ·主要研究内容第12-13页
   ·论文组织结构第13页
   ·小结第13-14页
第二章 Hadoop 技术架构及 Web 文本挖掘理论基础第14-30页
   ·Hadoop第14-20页
     ·Hadoop 技术背景第14-16页
       ·GFS第14-15页
       ·Map/Reduce 编程模式第15-16页
     ·HDFS 机制第16-18页
     ·Hadoop MapReduce 编程模型第18-20页
       ·相关操作第18-19页
       ·MapReduce 执行流程第19-20页
   ·Web 挖掘第20-29页
     ·Web 文本挖掘定义第20页
     ·Web 挖掘分类第20-22页
       ·Web 内容挖掘第21-22页
       ·Web 结构挖掘第22页
       ·Web 使用记录挖掘第22页
     ·Web 文本挖掘流程第22-23页
     ·Web 文本挖掘的常用技术第23-29页
       ·文本摘要第23页
       ·文本分类第23-27页
       ·文本聚类第27-29页
   ·小结第29-30页
第三章 Web 文本预处理研究第30-38页
   ·文本提取第30页
   ·中文分词第30-32页
     ·基于词典的分词算法第30-31页
     ·基于统计的分词算法第31页
     ·基于理解的分词算法第31-32页
   ·Web 文本表示第32-35页
     ·权值计算第33-34页
     ·向量相似度度量第34-35页
   ·Web 文本特征选择第35-36页
     ·χ2(CHI)统计第35页
     ·信息增益第35-36页
     ·互信息第36页
   ·改进的特征项表示模型第36-37页
   ·小结第37-38页
第四章 基于改进 SVM 的文本分类算法研究第38-47页
   ·支持向量机分类方法第38-43页
   ·SVM 算法的改进第43-44页
   ·SVM 算法的并行实现第44-45页
   ·分类器的结果评价第45-46页
   ·小结第46-47页
第五章 实验评估及分析第47-56页
   ·分布式实验环境的搭建第47-50页
     ·硬件描述第47页
     ·软件描述第47页
     ·Hadoop 平台的搭建第47-50页
   ·实验过程及评估第50-55页
     ·改进的特征项表示模型的分析及评估第50-52页
       ·实验步骤第51-52页
       ·实验结果的评估第52页
     ·改进 SVM 算法的分析及评估第52-55页
   ·小结第55-56页
第六章 总结与展望第56-57页
   ·总结第56页
   ·展望第56-57页
参考文献第57-61页
致谢第61-62页
攻读学位期间的主要研究成果第62页

论文共62页,点击 下载论文
上一篇:Web数据挖掘在个性化自适应网站中的应用研究
下一篇:基于GPU的网络编码的并行计算研究