首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于结构与视觉一致性的网页新闻提取研究及应用

摘要第1-4页
Abstract第4-9页
第1章 绪论第9-13页
   ·研究背景第9-10页
   ·面临的挑战第10-11页
   ·本文工作第11-12页
   ·本文组织第12页
   ·本章小结第12-13页
第2章 相关工作第13-32页
   ·信息提取第13-18页
     ·早期重要研究第13-14页
     ·基于规则的信息提取第14-15页
     ·基于结构一致性的信息提取第15-17页
     ·基于机器学习的信息提取第17-18页
   ·树结构最佳匹配算法第18-23页
     ·树结构相似性衡量第18-19页
     ·自顶向下保序匹配算法RTDM第19-22页
     ·自顶向下保序简单匹配算法STM第22-23页
   ·支持向量机模型第23-31页
     ·结构风险最小化原则第23-25页
     ·分类超平面第25-26页
     ·最大硬间隔分类超平面第26-29页
     ·最大软间隔分类超平面第29-31页
     ·后验概率近似第31页
   ·本章小结第31-32页
第3章 基于结构一致性的网页新闻提取算法第32-40页
   ·算法设计第32-33页
   ·网页预处理第33页
   ·网页新闻聚类第33-34页
   ·封装器生成第34-36页
   ·封装器标注第36-37页
   ·网页新闻提取第37-39页
   ·本章小结第39-40页
第4章 基于视觉一致性的网页新闻提取算法第40-54页
   ·算法设计第40-43页
     ·网页新闻正文识别第41页
     ·网页新闻标题识别第41-43页
     ·DOM树重构第43页
   ·网页新闻正文识别第43-48页
     ·新闻正文的内容特征表示第43-45页
     ·新闻正文的空间特征表示第45-46页
     ·新闻正文识别算法第46-48页
   ·网页新闻标题识别第48-53页
     ·新闻标题的空间特征表示第48-50页
     ·新闻标题的内容特征表示第50页
     ·新闻标题识别算法第50-53页
   ·本章小结第53-54页
第5章 基于结构与视觉一致性提取系统实现与评估第54-64页
   ·系统主要结构第54-56页
   ·实验设置第56页
   ·数据集和评估方法第56-57页
   ·基于结构一致性的网页新闻提取模块评估第57-58页
     ·网页新闻大规模提取实验第57-58页
   ·基于视觉一致性的网页新闻提取模块评估第58-62页
     ·训练数据选取实验第58-59页
     ·特征效果衡量实验第59-61页
     ·网页新闻大规模提取实验第61-62页
   ·基于结构和视觉一致性的网页新闻系统整体评估第62-63页
     ·网页新闻大规模提取实验第62-63页
   ·本章小结第63-64页
第6章 总结与展望第64-66页
   ·总结第64页
   ·展望第64-66页
参考文献第66-69页
攻读硕士学位期间主要研究成果第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:垃圾图像过滤系统的实现
下一篇:深度网络信息爬取关键技术研究与实现