摘要 | 第1-5页 |
Abstract | 第5-10页 |
第1章 引言 | 第10-16页 |
·课题来源、目的意义 | 第10-11页 |
·国内外的研究水平及发展状况 | 第11-14页 |
·本文的研究内容 | 第14页 |
·论文的体系安排 | 第14-16页 |
第2章 Web信息抽取和数据融合技术 | 第16-27页 |
·Web信息抽取技术 | 第16-21页 |
·Web信息特点 | 第16-17页 |
·信息抽取的定义和意义 | 第17-19页 |
·自由式、结构化和半结构化文本 | 第19-20页 |
·信息抽取系统设计的方法及评价指标 | 第20-21页 |
·数据融合 | 第21-26页 |
·数据融合的基本概念 | 第21-22页 |
·数据融合的基本原理 | 第22-23页 |
·数据融合的级别 | 第23-24页 |
·数据融合的方法 | 第24-26页 |
·本章小结 | 第26-27页 |
第3章 课题相关主要技术介绍 | 第27-39页 |
·Google SOAP Search API介绍 | 第27-31页 |
·Google提供的Web服务 | 第28-29页 |
·GoogleWebAPI的主要方法 | 第29-30页 |
·GoogleAPI的使用限制 | 第30-31页 |
·HtmlParser技术 | 第31-34页 |
·HtmlParser功能 | 第31-32页 |
·HtmlParser主要内容 | 第32-34页 |
·正则表达式介绍 | 第34-36页 |
·正则表达式定义 | 第34页 |
·正则表达式语法简介 | 第34-35页 |
·Java中支持正则表达式的API | 第35-36页 |
·权重系数的确定方法 | 第36-38页 |
·本章小结 | 第38-39页 |
第4章 基于Web的商品信息抽取与融合系统的设计 | 第39-63页 |
·设计目标 | 第39页 |
·系统模型设计 | 第39-41页 |
·数据库的设计 | 第41-44页 |
·网页自动获取 | 第44-48页 |
·获取相关网页初集 | 第44页 |
·提取相关链接 | 第44-48页 |
·商品信息抽取 | 第48-54页 |
·商品信息的抽取特点 | 第48-51页 |
·Web信息抽取流程 | 第51-54页 |
·商品信息融合 | 第54-62页 |
·多源信息的特点 | 第54-55页 |
·文本信息融合策略 | 第55-56页 |
·数据信息融合策略 | 第56-62页 |
·本章小结 | 第62-63页 |
第5章 基于Web的商品信息抽取与融合系统的实现 | 第63-75页 |
·开发平台及工具 | 第63页 |
·系统的实现 | 第63-68页 |
·参数库的建立 | 第63-64页 |
·相关网页的获取 | 第64-65页 |
·Web信息抽取的实现 | 第65-67页 |
·数据融合的实现 | 第67-68页 |
·系统运行结果及有效性评价 | 第68-74页 |
·实验的过程及分析 | 第68-72页 |
·有效性评价 | 第72-74页 |
·本章小结 | 第74-75页 |
第6章 结束语 | 第75-77页 |
·论文研究工作总结 | 第75-76页 |
·进一步的工作 | 第76-77页 |
参考文献 | 第77-80页 |
致谢 | 第80-81页 |
攻读硕士研究生期间所发表的论文 | 第81页 |