WEB信息整合平台设计与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 绪论 | 第10-14页 |
·研究背景 | 第10-11页 |
·国内外研究现状 | 第11-12页 |
·论文主要工作 | 第12-13页 |
·论文组织结构 | 第13-14页 |
第二章 WEB信息整合及相关技术基础 | 第14-28页 |
·WEB信息整合概述 | 第14-16页 |
·WEB信息整合关键技术 | 第16-17页 |
·典型WEB信息整合系统 | 第17-21页 |
·相关技术基础 | 第21-27页 |
·HTML基础 | 第21-23页 |
·XML和XHTML | 第23-25页 |
·DOM树 | 第25-26页 |
·Regex正则表达式 | 第26-27页 |
·本章小结 | 第27-28页 |
第三章 领域本体在WEB信息整合平台中的应用 | 第28-33页 |
·本体概述 | 第28-29页 |
·本体在WEB信息整合平台中的应用 | 第29-30页 |
·WEB信息整合平台领域本体的建立 | 第30-32页 |
·本章小结 | 第32-33页 |
第四章 WEB信息整合平台设计 | 第33-62页 |
·WEB信息整合平台目标 | 第33-34页 |
·系统结构模型设计 | 第34-35页 |
·数据采集模块设计 | 第35-45页 |
·网络爬虫概述 | 第36页 |
·爬虫网页搜索策略 | 第36-38页 |
·爬虫页面分析算法 | 第38页 |
·基于本体和搜索引擎的网络爬虫 | 第38-45页 |
·信息抽取模块设计 | 第45-56页 |
·信息抽取概述 | 第45页 |
·信息抽取方法 | 第45-48页 |
·信息抽取评价指标 | 第48页 |
·基于本体和DOM树路径信息抽取规则 | 第48-56页 |
·存储模块设计 | 第56-58页 |
·RDF简介 | 第56-58页 |
·RDF描述抽取结果 | 第58页 |
·结果呈现模块设计 | 第58-59页 |
·系统数据库设计 | 第59-61页 |
·本章小结 | 第61-62页 |
第五章 WEB信息整合平台实现 | 第62-76页 |
·系统开发环境 | 第62页 |
·数据采集模块实现 | 第62-70页 |
·系统配置 | 第62-64页 |
·搜索引擎接口 | 第64页 |
·页面下载及URL提取 | 第64-66页 |
·多线程支持 | 第66-67页 |
·爬虫更新 | 第67页 |
·核心部分实现 | 第67-70页 |
·数据抽取 | 第70-74页 |
·抽取规则示例 | 第70页 |
·DOM树接口 | 第70-71页 |
·ICTCLAS分词接口 | 第71-72页 |
·XPath接口 | 第72页 |
·核心算法实现 | 第72-74页 |
·整合系统前后台 | 第74-75页 |
·本章小结 | 第75-76页 |
第六章 系统测试与分析 | 第76-81页 |
·测试目标与用例 | 第76页 |
·详细测试与分析 | 第76-79页 |
·爬虫模块测试 | 第76-77页 |
·信息抽取模块测试 | 第77-79页 |
·RDF存储模块测试 | 第79页 |
·前台呈现模块测试 | 第79页 |
·测试结论 | 第79-80页 |
·本章小结 | 第80-81页 |
第七章 总结与展望 | 第81-83页 |
·总结 | 第81-82页 |
·展望 | 第82-83页 |
致谢 | 第83-84页 |
参考文献 | 第84-87页 |
攻硕期间取得的研究成果 | 第87页 |