网络商品信息搜索与抽取技术应用研究
摘要 | 第1-5页 |
ABSTRACT | 第5-8页 |
第一章 绪论 | 第8-13页 |
§1-1 课题背景 | 第8-9页 |
§1-2 国内外研究现状 | 第9-11页 |
1-2-1 网络商品信息搜索技术 | 第9-10页 |
1-2-2 网络商品信息抽取技术 | 第10-11页 |
§1-3 论文研究内容 | 第11页 |
§1-4 论文结构 | 第11-13页 |
第二章 网络商品信息搜索与抽取相关技术分析 | 第13-23页 |
§2-1 WEB 网页分析 | 第13-18页 |
2-1-1 超文本标记语言 H T ML | 第13-15页 |
2-1-2 统一资源定位符 U RL | 第15-16页 |
2-1-3 正则表达式 | 第16-18页 |
§2-2 搜索引擎与元搜索 | 第18-20页 |
2-2-1 网页搜索技术 | 第18页 |
2-2-2 传统搜索技术 | 第18-19页 |
2-2-3 元搜索技术 | 第19-20页 |
§2-3 网页信息抽取技术 | 第20-22页 |
2-3-1 网页信息抽取技术 | 第20-21页 |
2-3-2 网页信息抽取技术分类 | 第21-22页 |
2-3-3 网页信息抽取的难点 | 第22页 |
§2-4 本章小结 | 第22-23页 |
第三章 基于元搜索技术网络商品引擎设计 | 第23-39页 |
§3-1 基本设计思想 | 第23-24页 |
3-1-1 网络商品信息的特点 | 第23页 |
3-1-2 核心思想 | 第23页 |
3-1-3 总体设计 | 第23-24页 |
§3-2 元搜索模块 | 第24-27页 |
3-2-1 元搜索技术分析 | 第24页 |
3-2-2 元搜索模块设计 | 第24-27页 |
§3-3 抓取范围限定模块 | 第27-30页 |
3-3-1 抓取范围的限定模块的基本思想 | 第27页 |
3-3-2 抓取范围的限定模块的设计 | 第27-30页 |
§3-4 网页分析模块 | 第30-38页 |
3-4-1 购物网站页面结构分析 | 第30-32页 |
3-4-2 F indDR 算法 | 第32-35页 |
3-4-3 F indDR 改进算法 | 第35-38页 |
§3-5 本章小结 | 第38-39页 |
第四章 基于元搜索技术网络商品引擎实现 | 第39-44页 |
§4-1 工具与平台 | 第39页 |
4-1-1 Java 语言 | 第39页 |
4-1-2 开发环境 | 第39页 |
§4-2 系统实现 | 第39-42页 |
4-2-1 包结构和核心类 | 第39-40页 |
4-2-2 系统实现 | 第40-42页 |
§4-3 实验结果分析 | 第42-43页 |
4-3-1 抓取范围限定 | 第42-43页 |
4-3-2 网页分析 | 第43页 |
§4-4 本章小结 | 第43-44页 |
第五章 总结与展望 | 第44-46页 |
§5-1 总结 | 第44-45页 |
§5-2 展望 | 第45-46页 |
参考文献 | 第46-48页 |
致谢 | 第48-49页 |
攻读学位期间所取得的相关科研成 | 第49页 |