首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于聚焦爬虫的网上药品信息监测系统

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-15页
   ·课题背景与意义第10-11页
   ·聚焦爬虫的研究现状第11-13页
   ·本文主要研究的问题第13页
   ·本文内容与结构第13-15页
第2章 聚焦爬虫及相关技术第15-29页
   ·通用爬虫的简介第15-16页
     ·通用爬虫的原理与结构第15-16页
     ·通用爬虫的不足第16页
   ·聚焦爬虫模型第16-20页
     ·聚焦爬虫的原理第16-18页
     ·聚焦爬虫的结构第18-20页
   ·主题页面分布特性第20-21页
     ·Hub/Authority特性第20-21页
     ·Linkage/SiblingLocality特性第21页
     ·网站的主题聚集特性第21页
     ·隧道特性第21页
   ·其他相关技术第21-29页
     ·HTML简介第21-23页
     ·页面源文件采集第23-24页
     ·页面分析与处理第24-27页
     ·中文分词第27-29页
第3章 聚焦爬虫算法研究设计第29-45页
   ·搜索策略研究的基本方法第29页
   ·两类站点搜索策略研究第29-36页
     ·论坛社区类站点第29-33页
     ·其他类型站点的搜索策略第33-36页
   ·页面相关度分析算法的研究第36-45页
     ·向量空间模型分类算法及改进第36-40页
     ·文本分类概念简介第40页
     ·朴素贝叶斯分类算法及改进第40-43页
     ·k最近邻算法第43-45页
第4章 爬虫系统的实现第45-62页
   ·系统设计第45-50页
     ·系统总体设计第45-47页
     ·功能模块结构设计第47-50页
   ·系统实现第50-58页
     ·类结构实现第50-53页
     ·数据库ER图第53-54页
     ·界面设计第54-58页
   ·实验研究第58-62页
     ·系统测试环境第58页
     ·评价指标第58-59页
     ·测试站点信息及参数设定第59页
     ·测试和结果分析第59-62页
第5章 总结与展望第62-63页
   ·论文工作总结第62页
   ·不足与展望第62-63页
参考文献第63-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:基于J2EE多层架构技术的Web应用研究
下一篇:基于指纹识别和PKI的网上银行身份认证系统设计