首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向政府的网络信息自动抓取的系统设计与实现

摘要第1-5页
ABSTRACT第5-7页
第一章 绪论第7-11页
   ·研究背景与选题意义第7-9页
   ·研究的内容和目的第9页
   ·本文所做工作第9-10页
   ·论文组织第10-11页
第二章 相关技术第11-26页
   ·搜索引擎的原理第11-12页
   ·网页评价算法第12-19页
   ·URL评价算法第19-20页
   ·更新间隔估算法第20-21页
   ·内容更新判断第21-24页
   ·页面去重判断第24-26页
     ·重复URL判断第24页
     ·页面相似度判断第24-26页
第三章 系统设计第26-48页
   ·体系结构第26-29页
   ·数据结构第29-31页
   ·数据存储第31-34页
   ·几个关键问题第34-46页
     ·线程管理第34-36页
     ·网络爬虫以及Ajax处理第36-44页
     ·网页清洗第44-46页
   ·系统配置第46-48页
第四章 系统实现第48-57页
   ·网页下载第48-51页
   ·内容解析第51-52页
   ·锚文本第52页
   ·链接分析器第52-53页
   ·异常处理策略第53页
   ·对象动态注入第53-54页
   ·事件记录第54-55页
   ·在实际系统中的应用第55-57页
第五章 结束语第57-59页
   ·本文总结第57-58页
   ·改进方向第58-59页
参考文献第59-61页
致谢第61-62页

论文共62页,点击 下载论文
上一篇:基于人工标注技术的网页内容抽取系统开发
下一篇:面向网上银行信息系统的风险评估方法与实现