首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网页属性抽取的方法研究

摘要第1-6页
ABSTRACT第6-10页
1. 绪论第10-18页
   ·国内外研究现状第10-16页
     ·Web 信息抽取第11-14页
     ·中文姓名识别第14-15页
     ·Wrapper 失效检测第15-16页
   ·研究内容及意义第16-17页
   ·论文的组织结构第17-18页
2. 新闻网页的中文作者识别机制第18-34页
   ·新闻网页中中文作者的特征场景第18-24页
     ·中文姓名特征场景第18-21页
     ·文本特征场景第21-22页
     ·网页结构特征场景第22-24页
   ·新闻网页的中文作者识别机制第24-31页
     ·关键问题分析第25-30页
     ·算法描述第30-31页
   ·实验第31-33页
     ·实验内容第31-32页
     ·评价方法第32页
     ·实验结果与分析第32-33页
   ·小结第33-34页
3.Wrapper 失效检测机制第34-59页
   ·相关工作第34-37页
     ·RAPTURE 算法第34-35页
     ·基于机器学习技术的模式集合验证算法第35-37页
   ·Wrapper 失效检测机制第37-43页
     ·检测机制概述第37页
     ·关键问题分析第37-41页
     ·Wrapper 验证算法第41-42页
     ·检测机制流程第42-43页
   ·论坛帖子索引页面的Wrapper 失效检测机制第43-57页
     ·Wrapper 验证算法第44-51页
     ·检测样例的选取第51页
     ·实验第51-57页
   ·小结第57-59页
4. 新闻网页的作者来源抽取HtmlSAE 组件第59-68页
   ·组件的需求分析第59页
   ·组件的处理流程第59-61页
   ·组件的标准化第61-64页
     ·组件标准化的目的第61页
     ·Cmake第61-64页
   ·组件的实现第64-65页
   ·结果展示与分析第65-67页
   ·小结第67-68页
5. 总结与展望第68-71页
   ·本文工作总结第68-69页
   ·进一步研究方向第69-71页
参考文献第71-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:基于OpenCV的人脸检测方法研究
下一篇:基于web的高校教学管理系统设计与实现