首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

模板独立的网页信息抽取研究

目录第1-5页
摘要第5-6页
Abstract第6-7页
第一章 引言第7-10页
   ·本文研究的背景第7-8页
   ·本文研究内容和意义第8页
   ·本文工作第8-9页
   ·本文的组织结构第9-10页
第二章 研究现状及相关工作第10-23页
   ·网页信息抽取技术的概述第10-14页
     ·信息抽取技术的发展第10-11页
     ·网贞信息抽取研究现状第11-12页
     ·网页信息抽取系统分类第12-14页
   ·网页信息抽取与相关技术的差异第14-15页
     ·网页信息抽取与文本信息抽取的区别第14页
     ·网页信息抽取与信息检索的区别第14-15页
     ·网页信息抽取与自动文摘的区别第15页
     ·网页信息抽取与文本挖掘的区别第15页
   ·模板独立信息抽取的关键技术第15-22页
     ·中心向量分类器第16页
     ·K近邻算法第16-17页
     ·朴素贝叶斯分类器第17-18页
     ·AdaBoost方法第18-19页
     ·SVM支持向量机第19-21页
     ·CRF条件随机场第21-22页
   ·本章小结第22-23页
第三章 模板独立的网页信息抽取第23-37页
   ·抽取模型框架第23-25页
     ·网页收集模块第24页
     ·网络过滤模块第24-25页
     ·分类判别模块第25页
     ·包装器提取模块第25页
   ·新闻类页面信息抽取模型第25-31页
     ·模型定义第25-28页
     ·分类器及特征第28-29页
     ·语义包装器第29-31页
   ·论坛类页面信息抽取模型第31-36页
     ·模型定义第31-32页
     ·Dom-Tree提取第32页
     ·信息块抽取算法第32-34页
     ·分类器及特征第34-35页
     ·边缘检测包装器第35-36页
   ·本章小结第36-37页
第四章 实验及结果第37-46页
   ·评价标准第37页
   ·HTML Parser第37-39页
     ·采集与标注工具第38页
     ·网页过滤功能第38-39页
   ·新闻类页面信息抽取第39-41页
     ·数据集第39页
     ·新闻分类判别模块效率验证第39-40页
     ·S-Wrapper性能验证第40-41页
   ·论坛类页面信息抽取第41-44页
     ·数据集第41页
     ·信息块抽取算法验证第41-42页
     ·论坛分类判别模块效率验证第42-43页
     ·BD-Wrapper性能验证第43-44页
   ·本章小结第44-46页
第五章 总结与展望第46-48页
参考文献第48-52页
攻读硕士学位期间参加的科研项目和发表的论文第52-53页
致谢第53-54页

论文共54页,点击 下载论文
上一篇:地下管道检测机器人控制技术研究与开发
下一篇:面向流媒体直播的CDN和P2P动态交互传输架构的设计