首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的Web评论自动抽取方法研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-13页
   ·引言第9-10页
   ·研究背景和意义第10-11页
   ·研究内容及论文结构第11-13页
第二章 信息抽取及 Hadoop 相关技术综述第13-25页
   ·信息抽取研究概述第13-16页
     ·信息抽取简介第13页
     ·信息抽取与信息检索第13-14页
     ·研究现状第14-15页
     ·信息抽取评价指标第15-16页
   ·Web 信息抽取技术发展第16-18页
     ·Web 信息抽取简介第16页
     ·Web 信息抽取技术第16-17页
     ·Web 信息抽取面临的问题第17-18页
   ·Hadoop 平台概述第18-24页
     ·Hadoop 平台背景第18-19页
     ·MapReduce 计算模型第19-22页
     ·HDFS 分布式文件系统第22-24页
   ·本章总结第24-25页
第三章 基于 Hadoop 的 Web 评论自动抽取方法设计第25-40页
   ·基于 Hadoop 的 Web 评论自动抽取方法的提出第25-26页
     ·现有 Web 评论抽取方法的不足第25页
     ·基于 Hadoop 的 Web 评论自动抽取方法的总体设计第25-26页
   ·Web 页面解析第26-29页
     ·Web 页面预处理第27页
     ·对 Web 页面构建 DOM 树第27-29页
   ·基于 Hadoop 的 Web 评论记录抽取算法第29-34页
     ·评论记录区域自动识别算法设计第30-32页
     ·评论记录子树节点相似度算法设计第32页
     ·评论记录子树去噪算法设计第32-33页
     ·评论记录子树抽取算法设计第33-34页
   ·基于 Hadoop 的 Web 评论内容抽取算法第34-39页
     ·评论内容抽取特征第35-36页
     ·评论内容区域自动识别算法设计第36-37页
     ·评论内容抽取算法设计第37-39页
   ·本章总结第39-40页
第四章 基于 Hadoop 的 Web 评论自动抽取系统实现第40-48页
   ·现有典型 Web 信息抽取系统第40-41页
   ·基于 Hadoop 的 Web 评论自动抽取系统的设计第41-43页
     ·系统体系结构第41-42页
     ·系统主要特点第42页
     ·系统应用场景第42-43页
   ·基于 Hadoop 的 Web 评论自动抽取系统的实现第43-45页
     ·系统实现第43页
     ·系统工作原理第43-45页
   ·基于 hadoop 的 Web 评论自动抽取系统的部署第45-47页
     ·系统平台搭建第45-46页
     ·Hadoop 环境配置第46-47页
   ·本章总结第47-48页
第五章 实验测试与分析第48-57页
   ·实验数据源的获取第48-49页
   ·评论自动抽取方法测试与分析第49-52页
     ·评论记录抽取算法实验评估第49-51页
     ·评论内容抽取算法实验评估第51-52页
   ·评论自动抽取系统测试与分析第52-56页
     ·系统准确性分析第52-54页
     ·系统性能分析第54-56页
   ·本章总结第56-57页
第六章 总结与展望第57-59页
   ·总结第57-58页
   ·研究展望第58-59页
致谢第59-60页
参考文献第60-63页
附录 作者在读期间发表的学术论文及参加的科研项目第63页

论文共63页,点击 下载论文
上一篇:基于高阶累积量的空时码识别方法
下一篇:基于维基百科的汉语词语及短文本相关度计算方法研究