首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于SVM的Web信息抽取技术研究

摘要第1-8页
Abstract第8-9页
第一章 绪论第9-15页
   ·研究背景第9-11页
     ·信息抽取与Web信息抽取第10页
     ·与其他相关技术比较第10-11页
   ·国内外研究现状第11-13页
     ·国外研究现状第12-13页
     ·国内研究现状第13页
   ·本文所要完成的主要工作和结构安排第13-15页
第二章 Web信息抽取与支持向量机第15-32页
   ·Web信息抽取技术第15-24页
     ·IE发展历史和任务以及过程第15-18页
     ·Web信息抽取技术分类第18-22页
     ·Web信息抽取存在的问题和难点第22-23页
     ·规则的生成与学习方法第23-24页
     ·评价指标第24页
   ·支持向量机基本原理第24-31页
     ·统计学理论第25-26页
     ·最优分类超平面第26-29页
     ·支持向量机原理第29-31页
   ·本章小结第31-32页
第三章 基于增量学习的直推式支持向量机第32-44页
   ·监督学习与半监督学习第32-34页
     ·监督学习第32-33页
     ·半监督学习第33-34页
   ·直推式支持向量机第34-37页
     ·直推式学习第34页
     ·直推式支持向量机原理第34-36页
     ·已改进的直推式支持向量机算法第36-37页
   ·基于增量学习的直推式支持向量机算法第37-40页
     ·支持向量集变化第37-38页
     ·增量学习思想第38页
     ·改进后的直推式支持向量机算法第38-40页
   ·实验结果第40-43页
     ·模拟数据的试验结果第40-41页
     ·真实文本数据的试验结果第41-43页
     ·试验结果讨论第43页
   ·本章小结第43-44页
第四章 基于DOM树的网页噪音过滤算法第44-56页
   ·HTML预处理的意义及相关工作第44-46页
     ·HTML预处理意义第44页
     ·相关工作第44-46页
   ·基于DOM树的噪音过滤算法第46-55页
     ·HTML文档规范化解析第46-47页
     ·噪音过滤流程第47-48页
     ·算法思想第48页
     ·第一阶段噪音去除第48-49页
     ·第二阶段噪音去除第49-54页
     ·算法性能分析第54页
     ·噪音信息记录第54-55页
   ·本章小结第55-56页
第五章 基于SVM的Web信息抽取系统设计及实现第56-76页
   ·系统总体设计第56-59页
     ·设计目标第56页
     ·信息表示模型的选取第56-57页
     ·设计思想第57-58页
     ·系统整体框架第58-59页
   ·各功能模块详细设计第59-68页
     ·数据准备阶段第59页
     ·特征提取模块第59-64页
     ·数据分类抽取模块第64-66页
     ·数据交换阶段第66-68页
   ·Web信息抽取系统的实现第68-75页
     ·系统模块之间关系第69页
     ·网页规范化解析第69-71页
     ·数据分类学习和抽取第71-73页
     ·实验结果与分析第73-75页
   ·本章小结第75-76页
第六章 结束语第76-78页
   ·本文总结第76-77页
   ·对下一步工作的展望第77-78页
参考文献第78-81页
作者简历 攻读硕士学位期间完成的主要工作第81-82页
致谢第82页

论文共82页,点击 下载论文
上一篇:自动信任协商中协商策略研究
下一篇:Web服务安全代理的研究与设计