首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于评论性网站用户发言的数据挖掘研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-15页
   ·研究背景第9-12页
   ·国内外研究现状第12-13页
   ·本文研究方法和章节安排第13-15页
第二章 搜索引擎及网页排序算法概述第15-29页
   ·搜索引擎原理第15-21页
     ·搜索引擎结构第15-20页
     ·搜索引擎核心技术第20-21页
     ·搜索引擎运行流程第21页
   ·国内外搜索引擎对比第21-24页
   ·网页排序算法原理第24页
   ·网页排序算法对比第24-26页
   ·搜索引擎评判标准第26-27页
   ·本章小结第27-29页
第三章 开源搜索引擎Nutch框架分析第29-39页
   ·Nutch数据结构分析第29页
   ·网页抓取框架分析第29-33页
     ·初始化Injector模块第29-31页
     ·目标网页处理Generator模块第31-32页
     ·网页内容下载Fetcher模块第32-33页
   ·数据存储框架分析第33-36页
     ·网页数据分析ParseSegment模块第33页
     ·网页过滤与聚合CrawlDb模块第33-34页
     ·数据反向链接LinkDb模块第34-35页
     ·索引数据处理SolrIndexer模块第35-36页
   ·Nutch运行流程第36-38页
   ·本章小结第38-39页
第四章 Nutch框架下中文分词和PageRank算法的实现第39-54页
   ·Nutch中文分词背景第39-40页
   ·Nutch中文分词实现方法第40-42页
   ·PageRank算法原理第42-44页
   ·Nutch框架下PageRank算法流程设计第44-47页
   ·PageRank值存储设计和实现第47-49页
   ·性能评价第49-53页
     ·系统评价标准第49页
     ·PageRank值偏差对比实验第49-51页
     ·Nutch抓取效率对比实验第51页
     ·Nutch检索时间对比实验第51-53页
   ·本章小结第53-54页
第五章 基于PageRank值的OPIC改进算法第54-70页
   ·数据挖掘算法背景第54页
   ·网页排序算法对比第54-58页
     ·HITS算法研究第54-55页
     ·PageRank相关算法研究第55-56页
     ·OPIC算法研究第56-58页
   ·OPIC算法性能的不足第58页
   ·OPIC改进算法(P-OPIC算法)第58-61页
     ·BBS网页排序算法核心思想第58-59页
     ·P-OPIC算法关键步骤第59-60页
     ·外链比例调节因子第60-61页
     ·关键词权重修正PageRank算法第61页
   ·算法性能测试第61-69页
     ·网页排序算法评价标准第62页
     ·OPIC算法和P-OPIC算法TOPN查准率对比试验第62-64页
     ·OPIC算法和P-OPIC算法排序效果对比试验第64-66页
     ·P-OPIC算法外链比例因子对比实验第66-69页
   ·本章小结第69-70页
第六章 系统分析及展望第70-71页
参考文献第71-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:中文多文档自动文摘的研究与实现
下一篇:能力开放平台管理子系统的设计与实现