首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向金融信息的主题爬虫研究与应用

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-13页
   ·课题背景第9页
   ·课题研究的目的和意义第9-10页
   ·主题爬虫技术研究现状第10-12页
   ·本文主要研究内容及组织第12-13页
第2章 主题爬虫技术第13-33页
   ·概述第13-16页
     ·主题爬虫工作原理第13-15页
     ·主题爬虫基本结构第15-16页
   ·主题信息的描述与定义第16-19页
     ·主题信息描述形式第16-17页
     ·主题信息特征选择第17-19页
   ·网页与链接的主题相关性评价算法第19-29页
     ·基于链接结构的主题相关性评价算法第20-25页
     ·基于网页内容的主题相关性评价算法第25-29页
   ·主题爬虫搜索策略第29-32页
     ·深度优先搜索策略第29-30页
     ·广度优先搜索策略第30页
     ·最佳优先搜索策略第30-32页
   ·本章小结第32-33页
第3章 主题相关性密度文本分类算法第33-43页
   ·引言第33页
   ·主题相关性密度的基本原理第33-34页
   ·基于主题相关性密度的文本分类器第34-36页
     ·类别特征的量化第34-35页
     ·文本与类别关系的度量第35-36页
   ·文本分类器评测实验第36-42页
     ·基于网页内容文本的分类器测试实验第37-39页
     ·基于链接块锚文本的分类器测试实验第39-42页
   ·本章小结第42-43页
第4章 金融主题爬虫的设计与实现第43-53页
   ·引言第43页
   ·金融主题爬虫的结构设计第43-45页
   ·功能模块的实现第45-52页
     ·金融信息的定义第45-46页
     ·网页下载第46-48页
     ·基于网页分块的网页信息提取第48-50页
     ·网页及链接的主题相关性判断第50页
     ·URL解析及管理第50-52页
   ·本章小结第52-53页
第5章 实验结果与分析第53-61页
   ·引言第53页
   ·实验环境第53页
   ·网页分块提取实验第53-55页
   ·文本分类算法在系统中的应用效果第55-60页
     ·效率测试第55-56页
     ·金融主题爬虫系统的主题精确度测试第56-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-67页
攻读学位期间发表的学术论文第67-69页
致谢第69-70页
个人简历第70页

论文共70页,点击 下载论文
上一篇:基于网络的分布式入侵检测及其通信协议研究
下一篇:基于ontology的Blog信息抽取技术研究