首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向Web数据集成的数据抽取问题研究

摘要第1-16页
ABSTRACT第16-19页
第1章 绪论第19-28页
   ·研究背景及意义第19-20页
   ·Web数据抽取面临的问题第20-21页
   ·研究内容及贡献第21-26页
     ·研究环境第21-23页
     ·研究内容第23-24页
     ·本文贡献第24-26页
   ·论文组织结构第26-28页
第2章 Web数据抽取相关研究第28-40页
   ·引言第28页
   ·Web数据抽取方法分类第28-35页
     ·手工构造的Web数据抽取方法第29-30页
     ·半自动的Web数据抽取方法第30-33页
     ·全自动的Web数据抽取方法第33-35页
   ·数据模型的相关研究第35-38页
   ·面临的问题第38-39页
   ·小结第39-40页
第3章 Web实体模式的动态构建方法第40-54页
   ·引言第40-41页
   ·问题定义第41-42页
   ·构建Web实体模式第42-47页
     ·新建Web实体模式第43页
     ·丰富Web实体模式第43-47页
       ·主要思想第44页
       ·CRF模型第44-45页
       ·模式丰富第45-47页
   ·实验第47-52页
     ·数据集第47页
     ·评价标准第47-48页
     ·实验结果及分析第48-52页
       ·重要属性标签的识别第48-49页
       ·模式信息的整体准确率第49-51页
       ·训练集大小对实体模式丰富准确率的影响第51-52页
   ·相关工作第52-53页
   ·小结第53-54页
第4章 基于集成学习的Web数据抽取方法第54-69页
   ·引言第54-55页
   ·问题定义第55页
   ·Web数据抽取第55-62页
     ·识别数据区域第56-58页
     ·生成训练样例第58-62页
       ·构建分类器第58-60页
       ·分类结果合并第60-62页
     ·构造包装器第62页
   ·实验第62-67页
     ·数据集第62页
     ·评价标准第62-63页
     ·实验结果及分析第63-67页
       ·对于普通结构页面的数据抽取比较第63-64页
       ·对于特殊结构页面的数据抽取比较第64-65页
       ·不同分类器间的比较第65-66页
       ·不同类型特征对识别数据区域的影响第66-67页
   ·相关工作第67-68页
   ·小结第68-69页
第5章 基于二维关联边条件随机场的Web数据语义标注方法第69-86页
   ·引言第69-70页
   ·问题定义第70-71页
   ·二维关联边条件随机场第71-72页
   ·Web数据语义标注第72-76页
     ·关联边第73-74页
     ·参数估计第74-75页
     ·推理第75-76页
   ·实验第76-83页
     ·数据集第76页
     ·评价标准第76-77页
     ·2DCC-CRFs与传统条件随机场模型的比较第77-80页
     ·数据库参与与否对2DCC-CRFs模型性能的影响第80-82页
     ·手工标注样本数量对模型性能的影响第82-83页
     ·数据库规模对2DCC-CRFs模型性能的影响第83页
   ·相关工作第83-85页
   ·小结第85-86页
第6章 基于多策略的Web实体间联系发现方法第86-98页
   ·引言第86页
   ·问题定义第86-87页
   ·Web实体间联系发现第87-93页
     ·产生候选联系第87-88页
     ·评价候选联系第88-92页
       ·建立一阶逻辑知识库第89-91页
       ·参数学习第91页
       ·推理第91-92页
     ·建立Web实体间的联系第92-93页
   ·实验第93-95页
     ·实验设计第93页
     ·评价标准第93页
     ·实验结果及分析第93-95页
       ·不同策略的比较第93-94页
       ·不同推理方法的比较第94-95页
   ·相关工作第95-97页
   ·小结第97-98页
第7章 Web数据抽取原型系统第98-104页
   ·整体架构第98-101页
     ·基础数据层第99页
     ·支撑服务层第99-100页
     ·功能服务层第100-101页
   ·Web数据抽取系统工作过程第101-102页
   ·小结第102-104页
第8章 总结与展望第104-106页
   ·总结第104页
   ·展望第104-106页
参考文献第106-121页
致谢第121-122页
攻读学位期间发表的学术论文目录第122-124页
攻读学位期间参与科研项目情况第124-125页
攻读学位期间获奖情况第125-127页
学位论文评阅及答辩情况表第127-129页
外文论文第129-155页

论文共155页,点击 下载论文
上一篇:奇异系统鲁棒故障检测方法研究
下一篇:基于蚁群优化的组播路由算法研究