首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向刑侦网页的信息抽取与主题爬虫应用研究

摘要第1-5页
Abstract第5-8页
1 绪论第8-13页
   ·课题研究背景第8-9页
   ·国内外研究现状第9-11页
   ·本文的主要工作和组织第11-13页
2 网页主题信息抽取和主题爬虫概述第13-19页
   ·网页主题信息抽取第13-15页
     ·网页主题信息抽取概述第13页
     ·网页主题信息抽取目标第13-15页
   ·主题爬虫第15-19页
     ·主题爬虫概述第15-16页
     ·主题爬虫爬行目标第16页
     ·主题爬虫工作原理第16-19页
3 网页主题信息抽取算法研究与实现第19-35页
   ·基于分块的网页主题信息抽取流程第19-20页
   ·网页的表示第20-28页
     ·网页HTML标签文档清洗第20-21页
     ·基于容器标签的粗粒度划分第21-25页
     ·网页文本语义获取第25-28页
   ·刑侦网页特征分析第28-30页
   ·刑侦网页主题信息抽取算法的实现第30-35页
     ·语义块和网页类型判别方法第30-32页
     ·基于分块的网页主题信息抽取第32-33页
     ·刑侦网页主题信息抽取结果第33-35页
4 刑侦主题爬虫的设计与实现第35-48页
   ·刑侦主题爬虫的体系结构第35-36页
   ·刑侦网页主题表示及初始种子选取和排序第36-37页
   ·链接描述文档获取第37-41页
     ·链接锚文本与链接上下文简介第37-38页
     ·链接锚文本文档与链接上下文文档第38-39页
     ·链接上下文提取算法第39页
     ·基于语义块的链接上下文提取第39-41页
   ·链接重要度评价算法第41-45页
     ·链接主题相关度计算第42页
     ·链接结构重要度计算第42-44页
     ·自适应的链接重要度评价算法第44-45页
   ·刑侦主题爬虫实验及性能分析第45-48页
5 刑侦网页信息抽取系统实现第48-59页
   ·系统框架和主要功能第48-49页
   ·系统实现涉及的关键技术第49-55页
     ·与远程服务器建立连接第49-50页
     ·避免网页的重复搜集第50-53页
     ·数据库操作模块实现第53-55页
   ·系统运行结果第55-59页
结论第59-60页
参考文献第60-63页
攻读硕士学位期间发表学术论文情况第63-64页
致谢第64-65页

论文共65页,点击 下载论文
上一篇:支持细胞诱导骨髓干细胞向精原细胞分化的研究
下一篇:TNFα在小鼠卵母细胞体外减数分裂成熟中的作用及其机制的研究