首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向论坛爬行器中链接提取算法研究

摘要第1-4页
Abstract第4-8页
第1章 绪论第8-16页
   ·课题研究的背景和意义第8-9页
   ·国内外研究现状及分析第9-13页
   ·本文主要研究工作第13页
   ·本文主要内容和组织第13-16页
第2章 链接分析相关技术研究第16-30页
   ·HITS算法第16-19页
   ·PageRank算法第19-22页
   ·HITS和PageRank算法总结第22-25页
     ·两种算法存在的区别第22-23页
     ·经典算法的不足第23-25页
   ·基于传统算法的融合与改进第25-28页
     ·面向主题的Blog爬行器研究第25-27页
     ·基于链接分析的Blog网页算法研究第27-28页
   ·本章小结第28-30页
第3章 论坛入口点探测第30-36页
   ·算法提出的背景第30-32页
   ·相关研究工作第32页
   ·入口点探测算法第32-34页
   ·本章小结第34-36页
第4章 论坛页面链接的抽取第36-46页
   ·相关观察以及算法提出背景第36-38页
   ·本章节中需要引用到的相关术语第38-40页
   ·链接抽取第40-45页
     ·索引和帖子URL识别第40-43页
     ·“入口-索引-分页”正则式识别第43-45页
   ·本章小结第45-46页
第5章 相关实验及结果分析评估第46-58页
   ·实验设计的相关说明第46页
   ·实验环境第46页
   ·实验运行第46-52页
     ·索引帖子URL探测模块第47-48页
     ·分页URL探测模块第48页
     ·入口URL探测模块第48-49页
     ·爬行流程图第49页
     ·实验运行第49-52页
   ·实验结果分析与评估第52-56页
     ·入口页面爬行结果及评估第52-55页
     ·各类型页面爬行结果及评估第55-56页
   ·应用扩展第56-57页
   ·本章小结第57-58页
结论与展望第58-60页
致谢第60-62页
参考文献第62-66页
附录 攻读学位期间申请软件著作权第66页

论文共66页,点击 下载论文
上一篇:基于二部图及合约的测试用例自动生成方法研究与实现
下一篇:融合显式与隐式关系的专家层次关系网络构建方法研究