Web信息资源获取技术的研究与实现
中文摘要 | 第1页 |
英文摘要 | 第2-3页 |
目 录 | 第3-5页 |
第一章 绪 论 | 第5-9页 |
1.1 引言 | 第5-6页 |
1.2 WEB信息资源获取技术的研究现状 | 第6-9页 |
1.2.1 目前国内外的研究进展 | 第6-7页 |
1.2.2 Web信息资源获取技术的发展方向 | 第7-9页 |
第二章 WEB信息资源特点及获取技术 | 第9-13页 |
2.1 WEB信息系统的特点 | 第9页 |
2.2 WEB的数据特征 | 第9-11页 |
2.3 WEB信息资源的搜索技术 | 第11-12页 |
2.4 WEB信息资源的获取方法 | 第12-13页 |
第三章 ROBOT工作原理 | 第13-19页 |
3.1 ROBOT的概念 | 第13-14页 |
3.2 ROBOT的用途及分类 | 第14-15页 |
3.3 基于信息挖掘的ROBOT组成 | 第15-16页 |
3.4 设计ROBOT应考虑的问题 | 第16-19页 |
3.4.1 Robot操作所引起的问题 | 第16-17页 |
3.4.2 Robot道德规范 | 第17-19页 |
第四章 文档资源的分析与获取 | 第19-26页 |
4.1 WEB文本资源的数据模型 | 第19-20页 |
4.2 文本超链接中信息资源的提取 | 第20-22页 |
4.3 WEB文档发现策略 | 第22-23页 |
4.3.1 索引建立模式文文件发现策略 | 第22-23页 |
4.3.2 实时检索模式文文件发现策略 | 第23页 |
4.4 基于文本内容的三种检索模型 | 第23-26页 |
4.4.1 布尔逻辑模型 | 第24页 |
4.4.2 概率统计模型 | 第24-25页 |
4.4.3 向量空间模型 | 第25-26页 |
第五章 WRAS资源获取系统的设计与实现 | 第26-41页 |
5.1 WRAS系统结构及特点 | 第26-28页 |
5.2 WRAS系统的数据结构 | 第28-30页 |
5.2.1 文本目标的空间模型 | 第28-29页 |
5.2.2 文档特征向量 | 第29页 |
5.2.3 文本信息资源库数据结构 | 第29-30页 |
5.3 WRAS系统模块功能及实现 | 第30-41页 |
5.3.1 基于改进搜索策略的Robot | 第31-36页 |
5.3.2 数据采集、预处理及文本的模式匹配 | 第36-38页 |
5.3.3 基于RDB的文本信息资源库 | 第38-40页 |
5.3.4 系统的用户接口 | 第40-41页 |
第六章 结束语 | 第41-42页 |
参考文献 | 第42-44页 |
致谢 | 第44-45页 |
附录 | 第45页 |
附录A: 部分系统实现界面 | 第45-49页 |