首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎去重算法的研究与实现

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-16页
   ·研究背景第9页
   ·搜索引擎第9-15页
     ·搜索引擎的特点第9-10页
     ·搜索引擎的分类第10-11页
     ·搜索引擎的系统架构第11-12页
     ·搜索引擎的缺陷第12-15页
   ·本文的研究内容及论文组织结构第15-16页
第二章 相关技术介绍第16-38页
   ·关键字提取技术分析第16-21页
     ·关键字提取算法第16-17页
     ·文本预处理第17页
     ·朴素贝叶斯模型:第17-18页
     ·评估函数第18页
     ·TF~*IDF方法第18-21页
   ·网页去重算法分析第21-25页
     ·SCAM算法第21-22页
     ·基于特征串的网页去重算法第22-23页
     ·基于特征句抽取的网页去重第23-24页
     ·算法比较第24-25页
   ·页面排序算法分析第25-37页
     ·PageRank算法第25-26页
     ·PageRank算法的改进第26-28页
     ·WTPR算法第28-37页
   ·本章小结第37-38页
第三章 基于关键词和特征码的网页去重K-CC算法第38-47页
   ·算法框架第38-39页
   ·关键词的提取第39-42页
     ·词义第40页
     ·选择候选关键词第40-41页
     ·特征选择和离散化第41-42页
     ·关键词的提取第42页
   ·特征串的提取第42-44页
   ·特征串相似度计算第44-46页
   ·本章小结第46-47页
第四章 基于Lucene的搜索引擎系统实现第47-62页
   ·基于Lucene搜索引擎系统的框架设计第47-50页
     ·Lucene页面排序算法分析第49-50页
     ·基于Lucene搜索引擎系统的流程设计第50页
   ·K-CC网页去重算法的实现第50-52页
   ·WTPR算法的实现第52-54页
   ·系统测试分析第54-60页
     ·测试环境第54页
     ·去重算法比较第54-58页
     ·排序算法比较第58-60页
   ·本章小结第60-62页
第五章 总结与展望第62-64页
   ·工作总结第62页
   ·工作展望第62-64页
致谢第64-65页
参考文献第65-68页
在学期间发表的论文第68页

论文共68页,点击 下载论文
上一篇:基于粗糙集与混合特征的人脸表情识别研究
下一篇:基于HNC的汉语句子相似度算法的研究