首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的网络文本分析技术研究与实现

摘要第5-7页
Abstract第7-8页
第一章 绪论第11-14页
    1.1 研究背景与意义第11-12页
    1.2 本文研究内容第12页
    1.3 本文组织结构第12-14页
第二章 Hadoop相关技术介绍第14-23页
    2.1 Hadoop环境介绍第14-15页
    2.2 HDFS关键技术第15-17页
    2.3 MapReduce原理第17-19页
    2.4 HBase第19-23页
第三章 基于Hadoop的网络数据获取与解析第23-36页
    3.1 分布式网络爬虫概述第23页
    3.2 基本结构第23-25页
    3.3 下载模块第25-27页
    3.4 抽取链接模块第27-28页
    3.5 去重模块第28-29页
    3.6 抽取正文模块第29-32页
    3.7 实验第32-36页
第四章 基于Hadoop的信息检索第36-44页
    4.1 主要思路第36页
    4.2 基于MapReduce的分词第36-38页
    4.3 Lucene原理第38页
    4.4 Lucene功能扩展第38-40页
    4.5 基于MapReduce的索引第40-41页
    4.6 实验第41-44页
第五章 基于Hadoop的文本聚类第44-53页
    5.1 文本聚类概述第44-45页
    5.2 系统设计第45-46页
    5.3 K-Means算法描述第46-48页
    5.4 文本聚类分析的逻辑设计第48-49页
    5.5 实验第49-53页
第六章 总结和展望第53-55页
    6.1 总结第53页
    6.2 下一步研究工作第53-55页
参考文献第55-57页
攻读硕士学位期间参加的科研项目与公开发表的学术论文第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:商业银行人力资源管理系统的设计与应用
下一篇:基于iOS的“游厦门”系统设计与实现