首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于HTML标记的主题爬行器的设计与实现

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-15页
   ·研究背景第9-10页
   ·国内外研究现状第10-13页
   ·目的和意义第13页
   ·主要工作内容第13-14页
   ·本文的组织结构第14-15页
第二章 主题爬行器相关技术第15-28页
   ·搜索引擎简介第15-16页
   ·通用爬行器介绍第16-18页
     ·通用爬行器的基本原理第16-17页
     ·通用爬行器的工作流程第17-18页
   ·主题爬行器介绍第18-21页
     ·主题爬行器的基本原理第19页
     ·主题爬行器的工作流程第19-20页
     ·主题爬行器与通用爬行器的区别第20-21页
   ·页面搜索策略第21-22页
   ·页面分析算法第22-27页
     ·基于Web 链接分析算法第22-25页
     ·基于网页内容的分析算法第25-27页
   ·本章小结第27-28页
第三章 基于HTML 标记的主题相关性判定方法第28-36页
   ·文本主题相关性的判定第28-32页
     ·文档表示第28页
     ·文本向量特征权重第28-30页
     ·文本分类算法第30-32页
   ·基于HTML 标记的主题相关性判定第32-33页
   ·性能评估标准第33-35页
   ·本章小结第35-36页
第四章 主题爬行器总体设计第36-40页
   ·系统总体设计第36-39页
     ·系统总的工作流程图第36-38页
     ·系统总设计图第38-39页
   ·系统环境及平台第39页
   ·本章小结第39-40页
第五章 主题爬行器系统详细设计及实现第40-67页
   ·系统配置模块第40-41页
   ·HTTP 分析模块第41-46页
   ·WEB 链接过滤模块第46-47页
   ·HTML 解析模块第47-56页
     ·线程池介绍第47-49页
     ·HTML 解析第49-56页
   ·数据库存储模块第56-58页
   ·增量检测模块第58-59页
   ·系统运行界面第59-66页
   ·本章小结第66-67页
第六章 实验结果及分析第67-70页
   ·实验数据采集第67-68页
   ·实验数据分析第68-70页
第七章 总结与展望第70-72页
   ·总结第70页
   ·未来展望第70-72页
致谢第72-73页
参考文献第73-77页
攻硕期间取得的研究成果第77-78页

论文共78页,点击 下载论文
上一篇:基于DSP的印刷数字水印算法设计
下一篇:基于GIS系统的实时信息处理应用