首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

用于个性推荐系统的文本爬虫设计与实现

摘要第1-6页
Abstract第6-8页
目录第8-10页
第一章 绪论第10-20页
   ·研究背景与意义第10-12页
   ·本课题的研究进展第12-17页
     ·通用网络爬虫发展现状第12-14页
     ·主题网络爬虫发展现状第14-17页
   ·本文主要研究内容第17页
     ·研究目标第17页
     ·研究内容第17页
   ·论文的组织结构第17-20页
第二章 网络爬虫关键技术分析第20-34页
   ·体系结构第20-23页
     ·基本组成第20-21页
     ·网络爬虫的工作流程第21-23页
   ·相关工作概念第23-24页
   ·网页的分布特性第24-25页
     ·Hub/Authority特性第24页
     ·Linkage/Sibling Locality特性第24-25页
     ·隧道特性第25页
     ·站点主题特性第25页
   ·搜索策略第25-30页
     ·robots.txt文件和META标签第25-26页
     ·搜索策略概述第26-30页
   ·网页正文提取算法第30-32页
     ·基于DOM树的网页正文提取方法第30-31页
     ·基于文本及标签分布的网页正文提取技术第31-32页
   ·URL消重算法第32-33页
   ·小结第33-34页
第三章 个性推荐系统中文本爬虫的设计与实现第34-62页
   ·网络爬虫的概要设计第34-36页
   ·系统详细设计第36-47页
     ·系统运行流程与各模块功能第36-38页
     ·系统分步流程设计第38-43页
     ·数据库设计第43-44页
     ·用户界面的设计第44-47页
   ·系统主要模块的实现第47-59页
     ·URL相关度计算第48-51页
     ·网页编码转换第51-54页
     ·URL提取第54-56页
     ·URL消重第56-57页
     ·标签节点的过滤第57-58页
     ·网页正文提取第58-59页
   ·小结第59-62页
第四章 爬虫系统测试及效果分析第62-68页
   ·测试准备第62-63页
   ·结果与分析第63-67页
   ·小结第67-68页
第五章 结论与展望第68-70页
   ·结论第68-69页
   ·展望第69-70页
参考文献第70-74页
致谢第74-76页
个人简历、在学期间发表的论文与研究成果第76页

论文共76页,点击 下载论文
上一篇:军用长途话务管理系统设计与实现
下一篇:基于图像测量技术的装甲自制零件检测系统