首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web论坛数据抽取

摘要第1-8页
ABSTRACT第8-15页
第一章 引言第15-25页
   ·研究背景第15-21页
     ·Web数据广泛存在且蕴涵丰富信息第15-16页
     ·Web数据与传统数据库数据的鸿沟第16-17页
     ·Web论坛重要性第17-19页
     ·论坛数据抽取的应用场景第19-20页
     ·论坛数据抽取的挑战第20-21页
   ·主要贡献第21-23页
   ·本文的章节安排第23-25页
第二章 背景知识与相关领域研究现状第25-41页
   ·基本概念第25-29页
     ·Web页面构建第25-26页
     ·文档对象模型第26-28页
     ·Web数据抽取定义第28-29页
   ·Web论坛概念与特征第29-30页
   ·Web数据抽取相关研究工作第30-39页
     ·基于文法规则和文法推演的抽取技术第32-34页
     ·HTML敏感的自动抽取技术第34-36页
     ·大规模的自动抽取技术第36-39页
     ·论坛数据抽取第39页
   ·本章总结第39-41页
第三章 基于归纳逻辑和XPath模式学习的论坛数据抽取第41-61页
   ·归纳逻辑程序设计第41-43页
     ·逻辑程序基本概念第41-42页
     ·归纳逻辑程序设计第42-43页
   ·问题描述第43-45页
   ·抽取系统框架第45页
   ·XPath模式第45-50页
     ·生成训练集第46页
     ·XPath模式第46-48页
     ·XPath模式映射第48-50页
   ·XPath模式学习和映射规则生成第50-55页
     ·XPath模式学习第51-53页
     ·生成XPath模式映射规则第53-55页
   ·试验结果与分析第55-59页
     ·试验数据与设置第55-58页
     ·结果与分析第58-59页
   ·本章小结第59-61页
第四章 基于路径依赖关系的非监督论坛数据抽取第61-77页
   ·帖子页面特征分析第62-64页
   ·非监督的论坛数据抽取问题定义第64-66页
   ·模板区域侦测第66-69页
     ·识别模板分割点第66-67页
     ·模板级过滤第67-69页
   ·抽取用户生成内容第69-71页
   ·实验结果与分析第71-75页
     ·实验数据与设置第71-73页
     ·结果与分析第73-75页
   ·本章小结第75-77页
第五章 基于子结构最大化和内容依赖的论坛数据抽取规则构建第77-99页
   ·论坛数据抽取示例第77-78页
   ·问题分析第78-81页
   ·生成抽取规则算法概览第81页
   ·生成正则树规则第81-87页
     ·发现用户区域第83页
     ·正则树归纳第83-84页
     ·静态子结构最大化第84-87页
   ·抽取用户生成内容第87-88页
   ·试验结果与分析第88-95页
     ·试验数据与设置第89-92页
     ·结果与分析第92-95页
   ·本章小结第95-99页
第六章 总结与展望第99-103页
   ·总结第99-100页
   ·未来工作展望第100-103页
参考文献第103-116页
攻读博士学位期间发表论文第116-117页
致谢第117页

论文共117页,点击 下载论文
上一篇:在线论坛用户兴趣图谱发现与个性化信息推荐
下一篇:炼油装置循环水系统技术改进研究