| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-15页 |
| ·研究目的与意义 | 第10-11页 |
| ·国内外研究现状 | 第11-12页 |
| ·化学资源数据库系统建设现状 | 第11页 |
| ·Web 挖掘技术的研究现状 | 第11-12页 |
| ·研究的主要内容及方法 | 第12-13页 |
| ·研究主要内容 | 第12-13页 |
| ·研究方法 | 第13页 |
| ·论文的组织结构 | 第13-15页 |
| 第二章 Web 数据挖掘 | 第15-30页 |
| ·Web 数据挖掘的含义 | 第15页 |
| ·Web 数据挖掘的分类 | 第15-16页 |
| ·Web 内容挖掘 | 第15-16页 |
| ·Web 结构挖掘 | 第16页 |
| ·Web 使用记录挖掘 | 第16页 |
| ·Web 信息抽取 | 第16-22页 |
| ·Web 信息抽取技术的分类 | 第17-21页 |
| ·Web 信息抽取系统的评价指标 | 第21-22页 |
| ·Web 数据的特征 | 第22页 |
| ·聚焦爬虫技术 | 第22-29页 |
| ·聚焦爬虫的基本原理 | 第23-24页 |
| ·聚焦爬虫的搜索策略 | 第24-29页 |
| ·本章小结 | 第29-30页 |
| 第三章 化学物质网上信息动态获取的研究 | 第30-45页 |
| ·网页获取 | 第30-33页 |
| ·基于聚焦爬虫的化学物质网站中静态网页的获取 | 第30-32页 |
| ·基于模拟人工浏览方法的化学物质网站中动态网页的获取 | 第32-33页 |
| ·信息抽取 | 第33-39页 |
| ·基于包装器的化学物质网页中结构化信息抽取 | 第33-35页 |
| ·化学物质网页中非结构化信息抽取 | 第35-39页 |
| ·提高信息抽取稳定性的方法 | 第39-42页 |
| ·大任务分割 | 第39-40页 |
| ·失败重试机制 | 第40-41页 |
| ·动态更新检查 | 第41-42页 |
| ·任务调度 | 第42页 |
| ·测试与结果分析 | 第42-44页 |
| ·本章小结 | 第44-45页 |
| 第四章 化学物质数据集成方法研究 | 第45-53页 |
| ·化学物质异构数据分析 | 第45页 |
| ·局部模式 | 第45-47页 |
| ·全局模式 | 第47-51页 |
| ·数据集成的基本思想 | 第47-48页 |
| ·化学物质环境安全数据库系统框架结构和指标体系 | 第48-50页 |
| ·模式集成 | 第50-51页 |
| ·测试与结果分析 | 第51-52页 |
| ·本章小结 | 第52-53页 |
| 第五章 系统的设计与实现 | 第53-58页 |
| ·系统开发分析与结构 | 第53-54页 |
| ·系统功能与实现 | 第54-56页 |
| ·主要功能模型 | 第54-55页 |
| ·化学物质环境安全数据库系统的实现 | 第55-56页 |
| ·网页数据格式转换的实现 | 第56页 |
| ·系统的测试与评价 | 第56-57页 |
| ·本章小结 | 第57-58页 |
| 第六章 总结与展望 | 第58-60页 |
| ·总结 | 第58-59页 |
| ·展望 | 第59-60页 |
| 参考文献 | 第60-64页 |
| 致谢 | 第64-65页 |
| 作者简介 | 第65页 |