WEB信息整合平台设计与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 绪论 | 第10-14页 |
| ·研究背景 | 第10-11页 |
| ·国内外研究现状 | 第11-12页 |
| ·论文主要工作 | 第12-13页 |
| ·论文组织结构 | 第13-14页 |
| 第二章 WEB信息整合及相关技术基础 | 第14-28页 |
| ·WEB信息整合概述 | 第14-16页 |
| ·WEB信息整合关键技术 | 第16-17页 |
| ·典型WEB信息整合系统 | 第17-21页 |
| ·相关技术基础 | 第21-27页 |
| ·HTML基础 | 第21-23页 |
| ·XML和XHTML | 第23-25页 |
| ·DOM树 | 第25-26页 |
| ·Regex正则表达式 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 第三章 领域本体在WEB信息整合平台中的应用 | 第28-33页 |
| ·本体概述 | 第28-29页 |
| ·本体在WEB信息整合平台中的应用 | 第29-30页 |
| ·WEB信息整合平台领域本体的建立 | 第30-32页 |
| ·本章小结 | 第32-33页 |
| 第四章 WEB信息整合平台设计 | 第33-62页 |
| ·WEB信息整合平台目标 | 第33-34页 |
| ·系统结构模型设计 | 第34-35页 |
| ·数据采集模块设计 | 第35-45页 |
| ·网络爬虫概述 | 第36页 |
| ·爬虫网页搜索策略 | 第36-38页 |
| ·爬虫页面分析算法 | 第38页 |
| ·基于本体和搜索引擎的网络爬虫 | 第38-45页 |
| ·信息抽取模块设计 | 第45-56页 |
| ·信息抽取概述 | 第45页 |
| ·信息抽取方法 | 第45-48页 |
| ·信息抽取评价指标 | 第48页 |
| ·基于本体和DOM树路径信息抽取规则 | 第48-56页 |
| ·存储模块设计 | 第56-58页 |
| ·RDF简介 | 第56-58页 |
| ·RDF描述抽取结果 | 第58页 |
| ·结果呈现模块设计 | 第58-59页 |
| ·系统数据库设计 | 第59-61页 |
| ·本章小结 | 第61-62页 |
| 第五章 WEB信息整合平台实现 | 第62-76页 |
| ·系统开发环境 | 第62页 |
| ·数据采集模块实现 | 第62-70页 |
| ·系统配置 | 第62-64页 |
| ·搜索引擎接口 | 第64页 |
| ·页面下载及URL提取 | 第64-66页 |
| ·多线程支持 | 第66-67页 |
| ·爬虫更新 | 第67页 |
| ·核心部分实现 | 第67-70页 |
| ·数据抽取 | 第70-74页 |
| ·抽取规则示例 | 第70页 |
| ·DOM树接口 | 第70-71页 |
| ·ICTCLAS分词接口 | 第71-72页 |
| ·XPath接口 | 第72页 |
| ·核心算法实现 | 第72-74页 |
| ·整合系统前后台 | 第74-75页 |
| ·本章小结 | 第75-76页 |
| 第六章 系统测试与分析 | 第76-81页 |
| ·测试目标与用例 | 第76页 |
| ·详细测试与分析 | 第76-79页 |
| ·爬虫模块测试 | 第76-77页 |
| ·信息抽取模块测试 | 第77-79页 |
| ·RDF存储模块测试 | 第79页 |
| ·前台呈现模块测试 | 第79页 |
| ·测试结论 | 第79-80页 |
| ·本章小结 | 第80-81页 |
| 第七章 总结与展望 | 第81-83页 |
| ·总结 | 第81-82页 |
| ·展望 | 第82-83页 |
| 致谢 | 第83-84页 |
| 参考文献 | 第84-87页 |
| 攻硕期间取得的研究成果 | 第87页 |