基于网页内容分析的Web信息抽取技术及其应用

摘要	第1-5页
Abstract	第5-8页
第1章绪论	第8-12页
·选题背景	第8-9页
·国内外研究现状分析	第9-10页
·本论文的主要研究内容	第10页
·本论文的全文安排	第10-11页
·本章小结	第11-12页
第2章相关工作综述	第12-29页
·搜索引擎	第12-17页
·搜索引擎的发展	第12-14页
·搜索引擎的现状	第14-15页
·搜索引擎的分类	第15-16页
·搜索引擎的工作原理	第16-17页
·网络蜘蛛	第17-20页
·网络蜘蛛概念	第17-18页
·网络蜘蛛工作原理	第18-20页
·信息抽取技术	第20-27页
·信息抽取的概念	第20页
·信息抽取与信息检索	第20-21页
·信息抽取的类型	第21页
·信息抽取的方法	第21-22页
·信息抽取技术的研究对象及信息抽取过程	第22-24页
·自由文本信息抽取系统的构建方法	第24-26页
·半结构化文本信息抽取系统的构建方法	第26-27页
·Web 页面信息抽取技术	第27-28页
·本章小结	第28-29页
第3章基于规则的 Web 页面的信息分析与抽取	第29-37页
·网页内容分析策略	第29-32页
·网页分析功能需求	第29页
·网页分析实现原理	第29-30页
·网页分析系统结构	第30-32页
·信息抽取策略	第32-35页
·网页爬取策略	第35-36页
·基于多线程机制的相关网页爬取	第36页
·本章小结	第36-37页
第4章系统的实现	第37-48页
·系统方案设计	第37-39页
·系统的总体设计	第37-38页
·数据库设计	第38-39页
·系统运行的流程图	第39页
·系统设计与实现	第39-45页
·设置运行环境	第40页
·设置注册表文件	第40页
·系统实现	第40-42页
·对爬取目标的描述和分类	第42-43页
·不同网站的模板结构分析	第43-45页
·运行结果分析	第45-47页
·本章小结	第47-48页
第5章实验分析	第48-53页
·实验环境	第48页
·使用其他网络蜘蛛爬取网页	第48-50页
·实验结果比较	第50-52页
·本章小结	第52-53页
结论	第53-55页
参考文献	第55-58页
攻读硕士学位期间所发表的论文	第58-59页
致谢	第59-60页
个人简历	第60页