面向金融信息的主题爬虫研究与应用
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-13页 |
·课题背景 | 第9页 |
·课题研究的目的和意义 | 第9-10页 |
·主题爬虫技术研究现状 | 第10-12页 |
·本文主要研究内容及组织 | 第12-13页 |
第2章 主题爬虫技术 | 第13-33页 |
·概述 | 第13-16页 |
·主题爬虫工作原理 | 第13-15页 |
·主题爬虫基本结构 | 第15-16页 |
·主题信息的描述与定义 | 第16-19页 |
·主题信息描述形式 | 第16-17页 |
·主题信息特征选择 | 第17-19页 |
·网页与链接的主题相关性评价算法 | 第19-29页 |
·基于链接结构的主题相关性评价算法 | 第20-25页 |
·基于网页内容的主题相关性评价算法 | 第25-29页 |
·主题爬虫搜索策略 | 第29-32页 |
·深度优先搜索策略 | 第29-30页 |
·广度优先搜索策略 | 第30页 |
·最佳优先搜索策略 | 第30-32页 |
·本章小结 | 第32-33页 |
第3章 主题相关性密度文本分类算法 | 第33-43页 |
·引言 | 第33页 |
·主题相关性密度的基本原理 | 第33-34页 |
·基于主题相关性密度的文本分类器 | 第34-36页 |
·类别特征的量化 | 第34-35页 |
·文本与类别关系的度量 | 第35-36页 |
·文本分类器评测实验 | 第36-42页 |
·基于网页内容文本的分类器测试实验 | 第37-39页 |
·基于链接块锚文本的分类器测试实验 | 第39-42页 |
·本章小结 | 第42-43页 |
第4章 金融主题爬虫的设计与实现 | 第43-53页 |
·引言 | 第43页 |
·金融主题爬虫的结构设计 | 第43-45页 |
·功能模块的实现 | 第45-52页 |
·金融信息的定义 | 第45-46页 |
·网页下载 | 第46-48页 |
·基于网页分块的网页信息提取 | 第48-50页 |
·网页及链接的主题相关性判断 | 第50页 |
·URL解析及管理 | 第50-52页 |
·本章小结 | 第52-53页 |
第5章 实验结果与分析 | 第53-61页 |
·引言 | 第53页 |
·实验环境 | 第53页 |
·网页分块提取实验 | 第53-55页 |
·文本分类算法在系统中的应用效果 | 第55-60页 |
·效率测试 | 第55-56页 |
·金融主题爬虫系统的主题精确度测试 | 第56-60页 |
·本章小结 | 第60-61页 |
结论 | 第61-63页 |
参考文献 | 第63-67页 |
攻读学位期间发表的学术论文 | 第67-69页 |
致谢 | 第69-70页 |
个人简历 | 第70页 |