首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于快速相似度的Web结构挖掘的研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-12页
   ·研究背景第8-9页
   ·国内外研究现状第9-10页
     ·Web数据挖掘研究现状第9-10页
     ·文本相似度研究现状第10页
   ·本文研究内容第10-11页
   ·本文组织安排第11-12页
第二章 Web数据挖掘和文本相似度第12-22页
   ·Web数据挖掘定义第12页
   ·Web数据挖掘分类第12-17页
     ·Web内容挖掘第13-14页
     ·Web结构挖掘第14-15页
     ·Web使用挖掘第15-17页
   ·Web数据挖掘流程第17-18页
   ·文本相似度介绍第18-21页
     ·向量空间模型文本相似度算法第19-20页
     ·基于汉明距离的文本相似度算法第20-21页
   ·本章小结第21-22页
第三章 Web结构挖掘第22-29页
   ·Web结构挖掘第22-23页
     ·Web结构挖掘的理论基础第22页
     ·Web结构挖掘算法描述第22-23页
   ·PageRank算法分析第23-27页
     ·PageRank算法的定义第23-24页
     ·PageRank算法演示第24-26页
     ·PageRank算法的优缺点第26-27页
   ·PageRank改进算法第27-28页
   ·本章小结第28-29页
第四章 基于快速相似度PageRank算法第29-36页
   ·汉明距离相似度算法的快速性第29-32页
     ·复杂度对比第29-30页
     ·实验对比第30-32页
   ·快速相似度PageRank算法定义第32-33页
   ·快速相似度PageRank算法第33-35页
     ·引入问题第33页
     ·改进的汉明距离相似度算法第33-34页
     ·快速相似度RageRank算法公式第34-35页
   ·本章小结第35-36页
第五章 快速相似度搜索引擎的设计与实现第36-53页
   ·技术描述第36-37页
     ·Lucene第36页
     ·Nutch第36页
     ·HTMLParser第36-37页
     ·JE中文分词器第37页
   ·开发环境描述第37页
   ·快速相似度搜索引擎模型设计第37-45页
     ·网页信息抓取第38页
     ·网页内容分析第38-40页
     ·网页索引建立第40-42页
     ·网页索引结果排序第42-43页
     ·网页检索工具与接口第43-45页
   ·结果分析第45-52页
     ·查全率(recall)分析第45-48页
     ·查准率(precision)分析第48-50页
     ·F-score平衡分析第50-52页
   ·本章小结第52-53页
第六章 总结与展望第53-54页
   ·主要工作和成果第53页
   ·展望第53-54页
参考文献第54-57页
作者简介第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于数据挖掘的入侵检测算法研究
下一篇:退火进化算法在网格任务调度中的应用和研究