面向金融信息的主题爬虫研究与应用
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-13页 |
| ·课题背景 | 第9页 |
| ·课题研究的目的和意义 | 第9-10页 |
| ·主题爬虫技术研究现状 | 第10-12页 |
| ·本文主要研究内容及组织 | 第12-13页 |
| 第2章 主题爬虫技术 | 第13-33页 |
| ·概述 | 第13-16页 |
| ·主题爬虫工作原理 | 第13-15页 |
| ·主题爬虫基本结构 | 第15-16页 |
| ·主题信息的描述与定义 | 第16-19页 |
| ·主题信息描述形式 | 第16-17页 |
| ·主题信息特征选择 | 第17-19页 |
| ·网页与链接的主题相关性评价算法 | 第19-29页 |
| ·基于链接结构的主题相关性评价算法 | 第20-25页 |
| ·基于网页内容的主题相关性评价算法 | 第25-29页 |
| ·主题爬虫搜索策略 | 第29-32页 |
| ·深度优先搜索策略 | 第29-30页 |
| ·广度优先搜索策略 | 第30页 |
| ·最佳优先搜索策略 | 第30-32页 |
| ·本章小结 | 第32-33页 |
| 第3章 主题相关性密度文本分类算法 | 第33-43页 |
| ·引言 | 第33页 |
| ·主题相关性密度的基本原理 | 第33-34页 |
| ·基于主题相关性密度的文本分类器 | 第34-36页 |
| ·类别特征的量化 | 第34-35页 |
| ·文本与类别关系的度量 | 第35-36页 |
| ·文本分类器评测实验 | 第36-42页 |
| ·基于网页内容文本的分类器测试实验 | 第37-39页 |
| ·基于链接块锚文本的分类器测试实验 | 第39-42页 |
| ·本章小结 | 第42-43页 |
| 第4章 金融主题爬虫的设计与实现 | 第43-53页 |
| ·引言 | 第43页 |
| ·金融主题爬虫的结构设计 | 第43-45页 |
| ·功能模块的实现 | 第45-52页 |
| ·金融信息的定义 | 第45-46页 |
| ·网页下载 | 第46-48页 |
| ·基于网页分块的网页信息提取 | 第48-50页 |
| ·网页及链接的主题相关性判断 | 第50页 |
| ·URL解析及管理 | 第50-52页 |
| ·本章小结 | 第52-53页 |
| 第5章 实验结果与分析 | 第53-61页 |
| ·引言 | 第53页 |
| ·实验环境 | 第53页 |
| ·网页分块提取实验 | 第53-55页 |
| ·文本分类算法在系统中的应用效果 | 第55-60页 |
| ·效率测试 | 第55-56页 |
| ·金融主题爬虫系统的主题精确度测试 | 第56-60页 |
| ·本章小结 | 第60-61页 |
| 结论 | 第61-63页 |
| 参考文献 | 第63-67页 |
| 攻读学位期间发表的学术论文 | 第67-69页 |
| 致谢 | 第69-70页 |
| 个人简历 | 第70页 |