首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

教育新闻采集系统的设计与实现

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-16页
   ·研究背景和意义第10-11页
   ·国内外研究现状第11-14页
     ·主题爬虫第11-12页
     ·网页更新策略第12-13页
     ·网页信息抽取第13-14页
   ·主要研究工作和内容第14页
   ·论文组织结构第14-16页
第二章 相关理论知识第16-28页
   ·信息采集系统工作原理第16-20页
     ·网页下载第16-17页
     ·网页解析第17-18页
     ·URL 去重第18页
     ·URL 调度第18-19页
     ·工作流程第19-20页
   ·主题采集相关技术第20-22页
     ·基于文字内容的方法第20-21页
     ·基于分类器的方法第21页
     ·基于链接分析的方法第21-22页
   ·动态信息采集关键技术第22-24页
     ·网页更新周期规律第23页
     ·动态采集策略第23-24页
   ·网页信息抽取技术第24-27页
     ·HTML第24-25页
     ·DOM第25-26页
     ·SAX第26页
     ·基于分块的信息抽取第26-27页
   ·本章小结第27-28页
第三章 教育新闻采集系统的总体设计第28-33页
   ·系统的设计目标第28页
   ·系统的模块组成第28-29页
   ·系统的工作流程第29-31页
   ·系统的体系结构第31-32页
   ·本章小结第32-33页
第四章 系统的详细设计与实现第33-57页
   ·普通采集模块第33-40页
     ·网页下载模块第33-34页
     ·网页编码检测模块第34-36页
     ·URL 过滤模块第36-37页
     ·URL 去重模块第37-38页
     ·URL 调度模块第38-40页
   ·主题过滤模块第40-46页
     ·链接块提取模块第42-44页
     ·文本分类模块第44-45页
     ·主题过滤的流程第45-46页
   ·URL 动态调度模块第46-50页
     ·调度方法第46-49页
     ·具体实现第49-50页
     ·种子页面第50页
   ·信息抽取模块第50-56页
     ·网页预处理第52-53页
     ·网页标题的抽取第53-54页
     ·网页正文的抽取第54-56页
   ·本章小结第56-57页
第五章 系统测试与结果分析第57-73页
   ·系统运行第57-59页
   ·主题过滤测试第59-61页
     ·评估方法第59-60页
     ·实验数据第60页
     ·结果分析第60-61页
   ·动态调度测试第61-65页
     ·评价指标第61-62页
     ·实验过程第62-64页
     ·结果分析第64-65页
   ·信息抽取测试第65-72页
     ·评价标准第65页
     ·实验数据第65-67页
     ·实验过程第67-68页
     ·结果分析第68-72页
   ·本章小结第72-73页
总结与展望第73-74页
参考文献第74-78页
攻读硕士学位期间取得的研究成果第78-79页
致谢第79页

论文共79页,点击 下载论文
上一篇:网络游戏虚拟物品安全保护体系的研究与应用
下一篇:基于改进鱼群算法的BP神经网络优化研究