摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
第1章 引言 | 第8-17页 |
·问题的提出 | 第8-11页 |
·国内外主要研究现状 | 第11-15页 |
·论文主要研究内容 | 第15-16页 |
·论文结构 | 第16-17页 |
第2章 理论基础 | 第17-28页 |
·自动文本分类技术 | 第17-24页 |
·文本的表达 | 第18页 |
·文本预处理 | 第18-19页 |
·索引 | 第19-20页 |
·统计与特征选取 | 第20-21页 |
·统计学习的文本分类方法 | 第21-23页 |
·分类性能评价 | 第23-24页 |
·强化学习基础 | 第24-27页 |
·强化学习简述 | 第24-26页 |
·强化学Q-learning算法简介 | 第26-27页 |
·强化学习应用 | 第27页 |
·本章小结 | 第27-28页 |
第3章 DEEP WEB网络爬虫系统 | 第28-42页 |
·网络爬虫技术 | 第28-33页 |
·网络爬虫的原理 | 第28-30页 |
·网络爬虫的搜索策略 | 第30-32页 |
·网络聚焦爬虫 | 第32-33页 |
·基于强化学习的Deep Web表单聚焦爬虫 | 第33-40页 |
·表单聚焦爬虫框架 | 第34-35页 |
·页面分类器 | 第35-37页 |
·链接分类器 | 第37-40页 |
·基于强化学习的Deep Web表单聚焦爬虫框架 | 第40页 |
·本章小结 | 第40-42页 |
第4章 DEEP WEB数据源的分类和判别框架 | 第42-52页 |
·Deep Web数据源分类和判别概述 | 第42-43页 |
·Deep Web数据源的分类和判别框架 | 第43-51页 |
·Deep Web数据源表单页面提取 | 第44-48页 |
·查询表单分类器 | 第48-49页 |
·领域表单分类 | 第49-51页 |
·本章小结 | 第51-52页 |
第5章 实验结果与分析 | 第52-57页 |
·实验数据来源与评价标准 | 第52-53页 |
·训练查询表单分类器 | 第53-55页 |
·训练表单领域分类器 | 第55页 |
·多分类器deep Web数据源判定与分类框架实验 | 第55-56页 |
·本章小结 | 第56-57页 |
第6章 总结与展望 | 第57-60页 |
·工作总结 | 第57-58页 |
·工作展望 | 第58-60页 |
参考文献 | 第60-65页 |
在攻读学位期间发表的学术论文和参加科研情况 | 第65-66页 |
致谢 | 第66-67页 |
详细摘要 | 第67-69页 |