首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向定题领域的事件驱动和协议驱动的主题爬虫应用研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-14页
   ·研究背景及意义第10页
   ·主题爬虫的国内外研究现状第10-12页
   ·本文的研究内容第12页
   ·本文结构第12-14页
第二章 主题爬虫相关理论知识第14-24页
   ·主题爬虫的原理和分类第14-18页
     ·主题爬虫的原理第14-15页
     ·主题爬虫的分类第15-18页
   ·当前网页应用热点技术及其发展趋势第18-19页
   ·深层网络主题爬虫第19-21页
     ·深层网络爬虫的研究现状第20-21页
     ·深层网络爬虫的发展趋势第21页
   ·事件驱动第21-22页
   ·DOM 树结构第22-23页
   ·本章小节第23-24页
第三章 主题爬虫相关算法分析第24-34页
   ·中文分词第24-26页
     ·采用字符串匹配法的分词第24-25页
     ·基于理解分词的方法第25页
     ·采用统计法的分词第25-26页
   ·相关性分析第26-31页
     ·主题相关性预测第26-28页
     ·主题相关性计算第28-31页
   ·过滤算法第31-32页
   ·本章小节第32-34页
第四章 基于定题领域及事件驱动的深层主题爬虫研究第34-50页
   ·基于定题领域及事件驱动的深层主题爬虫的相关定义与模型第34-37页
     ·事件驱动主题爬虫研究的相关定义第34-36页
     ·基于定题领域及事件驱动的深层主题爬虫研究面临的问题第36页
     ·基于定题领域及事件驱动的深层主题爬虫模型第36-37页
   ·EDDTC 的设计第37-45页
     ·事件驱动模拟模块第37-40页
     ·相关网页获取模块第40-42页
     ·JavaScript 解析模块第42-43页
     ·过滤模块第43-44页
     ·页面解析模块第44-45页
   ·EDDTC 的实现第45-46页
   ·测试结果与分析第46-49页
   ·本章小结第49-50页
第五章 基于定题领域及协议驱动的主题爬虫研究第50-62页
   ·系统概述第50-51页
   ·各模块的算法与实现第51-56页
     ·链接及页面抓取模块第51-52页
     ·过滤模块及算法第52页
     ·中文分词第52-54页
     ·网页相关性计算第54-55页
     ·存储和知识表示模块第55-56页
   ·实验与测试结果第56-60页
   ·本章小节第60-62页
第六章 总结与展望第62-64页
致谢第64-66页
参考文献第66-68页
附录 A 攻读硕士期间发表的论文目录第68-70页
附录 B 攻读硕士期间参加的研究项目第70页

论文共70页,点击 下载论文
上一篇:矿用救援指挥广播对讲系统的研究与设计
下一篇:基于机器视觉技术的经纬检测系统的研究