首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于网页内容分析的Web信息抽取技术及其应用

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-12页
   ·选题背景第8-9页
   ·国内外研究现状分析第9-10页
   ·本论文的主要研究内容第10页
   ·本论文的全文安排第10-11页
   ·本章小结第11-12页
第2章 相关工作综述第12-29页
   ·搜索引擎第12-17页
     ·搜索引擎的发展第12-14页
     ·搜索引擎的现状第14-15页
     ·搜索引擎的分类第15-16页
     ·搜索引擎的工作原理第16-17页
   ·网络蜘蛛第17-20页
     ·网络蜘蛛概念第17-18页
     ·网络蜘蛛工作原理第18-20页
   ·信息抽取技术第20-27页
     ·信息抽取的概念第20页
     ·信息抽取与信息检索第20-21页
     ·信息抽取的类型第21页
     ·信息抽取的方法第21-22页
     ·信息抽取技术的研究对象及信息抽取过程第22-24页
     ·自由文本信息抽取系统的构建方法第24-26页
     ·半结构化文本信息抽取系统的构建方法第26-27页
   ·Web 页面信息抽取技术第27-28页
   ·本章小结第28-29页
第3章 基于规则的 Web 页面的信息分析与抽取第29-37页
   ·网页内容分析策略第29-32页
     ·网页分析功能需求第29页
     ·网页分析实现原理第29-30页
     ·网页分析系统结构第30-32页
   ·信息抽取策略第32-35页
   ·网页爬取策略第35-36页
   ·基于多线程机制的相关网页爬取第36页
   ·本章小结第36-37页
第4章 系统的实现第37-48页
   ·系统方案设计第37-39页
     ·系统的总体设计第37-38页
     ·数据库设计第38-39页
     ·系统运行的流程图第39页
   ·系统设计与实现第39-45页
     ·设置运行环境第40页
     ·设置注册表文件第40页
     ·系统实现第40-42页
     ·对爬取目标的描述和分类第42-43页
     ·不同网站的模板结构分析第43-45页
   ·运行结果分析第45-47页
   ·本章小结第47-48页
第5章 实验分析第48-53页
   ·实验环境第48页
   ·使用其他网络蜘蛛爬取网页第48-50页
   ·实验结果比较第50-52页
   ·本章小结第52-53页
结论第53-55页
参考文献第55-58页
攻读硕士学位期间所发表的论文第58-59页
致谢第59-60页
个人简历第60页

论文共60页,点击 下载论文
上一篇:核壳复合结构材料及空心结构材料的制备研究
下一篇:采矿迹地生态重建技术研究