首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中主题网络爬虫算法研究

摘要第1-6页
ABSTRACT第6-8页
第一章 绪论第8-13页
   ·研究背景和意义第8-9页
   ·国内外研究现状第9-12页
     ·通用网络爬虫研究现状第9-10页
     ·主题网络爬虫研究现状第10-12页
   ·研究内容及组织结构第12-13页
第二章 搜索引擎中的网络爬虫第13-27页
   ·搜索引擎简介第13-16页
     ·搜索引擎的发展史第13-14页
     ·搜索引擎的分类第14-15页
     ·搜索引擎工作原理第15-16页
   ·通用网络爬虫第16-19页
     ·通用网络爬虫体系结构第16-17页
     ·通用网络爬虫的搜索策略第17-19页
   ·主题网络爬虫第19-25页
     ·主题网络爬虫体系结构第19-20页
     ·主题网络爬虫的搜索策略第20-25页
   ·通用网络爬虫与主题网络爬虫的区别第25-26页
   ·本章小结第26-27页
第三章 主题网络爬虫关键技术第27-36页
   ·网页预处理第27-29页
     ·HTML 网页结构第27-28页
     ·网页内容的提取第28-29页
     ·文本分词第29页
   ·主题相关性判定算法第29-35页
     ·向量空间模型判定算法第30-32页
     ·向量空间模型算法的优点和缺点第32-33页
     ·朴素贝叶斯分类算法第33-35页
     ·朴素贝叶斯分类算法优点和缺点第35页
   ·本章小结第35-36页
第四章 基于候选链接主题边缘文本的主题爬虫第36-43页
   ·杜威十进分类法第36-37页
   ·候选链接主题边缘文本的提取第37-38页
   ·构建朴素贝叶斯文本分类器第38-40页
   ·主题网络爬虫体系结构第40-41页
   ·本章小结第41-43页
第五章 实验分析第43-47页
   ·评价方法第43-44页
   ·实验环境第44页
   ·实验结果与分析第44-46页
   ·本章小结第46-47页
第六章 总结与展望第47-48页
   ·总结第47页
   ·展望第47-48页
参考文献第48-51页
攻读硕士期间发表的学术论文和科研成果第51-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:融合表情符号的微博文本倾向性分析
下一篇:扫描文档图像的处理方法的研究和应用