首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

网络原创文章优先的搜索引擎排序算法研究

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-18页
   ·搜索引擎的现状第8-10页
     ·搜索引擎的发展历史第8-9页
     ·搜索引擎的分类第9-10页
   ·典型搜索引擎介绍第10-12页
     ·Google第10-11页
     ·Baidu第11页
     ·Yahoo第11页
     ·Sogou第11-12页
   ·SEO 技术第12-16页
     ·SEO 技术的主要方法和策略第12-13页
     ·SEO 技术的发展趋势第13-14页
     ·网页作弊的几种方式第14-16页
   ·本文的主要工作第16-17页
   ·本章小结第17-18页
2 经典排序算法及其比较第18-28页
   ·PageRank 算法第18-21页
   ·HITS 算法第21-23页
   ·Hilltop 算法第23页
   ·收费排名第23-25页
   ·经典算法评价第25-27页
     ·PageRank 算法的缺点与改进第25-26页
     ·HITS 算法的缺点与改进第26页
     ·经典排序算法对网络原创文章的不公平之处第26-27页
   ·本章小结第27-28页
3 网络原创文章的判定算法第28-32页
   ·网络文章的分类第28页
   ·网站的三个“信用度”第28-29页
   ·文章原创可能性的确定第29-30页
   ·文章原创可能性对网站信用度的修正第30-31页
   ·本章小结第31-32页
4 原创优先的搜索引擎排序算法第32-42页
   ·内容重复网页的确定第32-36页
     ·网页的重复特点第32页
     ·现有网页去重的方法简介第32-33页
     ·基于特征串重复网页判定方法第33-36页
   ·原创文章判定结果对网页权威度的修正第36-38页
   ·综合排序模型第38-41页
     ·基于网页内容的相关度算法第38-39页
     ·最终检索排名方法第39-41页
   ·本章小结第41-42页
5 原型系统研究第42-57页
   ·技术选型第42-43页
     ·数据库选择第42页
     ·搜索引擎平台选择第42页
     ·开发平台选择第42-43页
   ·Nutch第43-48页
     ·Lucene第43-46页
     ·Nutch 爬虫第46-48页
   ·系统设计与实现第48-55页
     ·系统用例第48-49页
     ·系统构建流程第49-50页
     ·系统结构分析第50页
     ·主要数据表定义第50-52页
     ·程序设计第52-54页
     ·程序运行效果第54-55页
   ·算法验证第55页
     ·算法验证方法第55页
     ·结果分析第55页
   ·本章小结第55-57页
6 结论与展望第57-59页
   ·总结第57页
   ·展望第57-59页
致谢第59-60页
参考文献第60-62页
附录第62页

论文共62页,点击 下载论文
上一篇:论自白及自白任意性规则
下一篇:我国刑事诉讼领域对公民财产权保护问题初探