首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web信息智能抽取技术的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-15页
   ·研究背景及意义第10-12页
   ·作者工作及论文章节安排第12-15页
     ·作者所做工作第12-13页
     ·论文章节安排第13-15页
第二章 Web 信息抽取技术概述第15-29页
   ·Web 网页的基本结构和特点第15-19页
     ·Web 信息特点第15-17页
     ·网站的组织结构第17-18页
     ·网页的组织结构第18页
     ·网页的噪声数据第18-19页
   ·信息抽取与信息检索的比较第19-20页
   ·Web 信息抽取技术第20-27页
     ·基于正则表达式的信息抽取技术第20-22页
     ·基于统计的网页信息抽取技术第22页
     ·基于归纳学习的信息抽取技术第22-23页
     ·基于HTML 结构的信息抽取技术第23-24页
     ·基于隐马尔科夫模型的信息抽取技术第24-25页
     ·基于模式匹配的信息抽取技术第25页
     ·基于本体论的Web 信息抽取技术第25-26页
     ·基于竞争分类的Web 信息抽取技术第26-27页
     ·基于Web 查询的信息抽取技术第27页
     ·基于NLP 的信息抽取技术第27页
   ·本章小结第27-29页
第三章 系统设计原理及整体框架第29-38页
   ·系统设计原理第29页
   ·系统相关术语定义第29-31页
   ·系统总体框架第31-35页
     ·逻辑架构模型概览第31-34页
     ·逻辑架构设计使用的模式第34-35页
   ·数据库设计与实现第35-37页
   ·本章小结第37-38页
第四章 启发式规则生成器的设计第38-49页
   ·规则生成器的原理第38页
   ·DOM 树的原理第38-39页
   ·HTMLParser 解析器第39-41页
   ·规则集的生成实现第41-48页
     ·最小信息富余子树的生成第41-42页
     ·分隔符自动识别算法第42-48页
   ·本章小结第48-49页
第五章 模板生成器的设计第49-55页
   ·基本原理第49页
   ·模板结构定义及实现第49-53页
     ·模板的定义语言第49-50页
     ·模板的定义第50-52页
     ·模板的生成及配置第52-53页
   ·本章小结第53-55页
第六章 信息抽取器的设计与实现第55-63页
   ·信息抽取器原理第55页
   ·信息抽取基本流程及关键技术第55-62页
     ·信息抽取基本流程第55-58页
     ·话题有效性判断第58页
     ·增量/多页处理第58-60页
     ·发帖者等级处理第60-61页
     ·帖子额外属性权值处理第61-62页
     ·话题线索权重处理第62页
   ·本章小结第62-63页
第七章 测试与分析第63-68页
   ·测试环境第63页
   ·测试结果及分析第63-68页
第八章 总结与展望第68-71页
   ·总结第68-70页
   ·展望第70-71页
致谢第71-72页
参考文献第72-76页
攻读硕士期间研究成果第76-77页

论文共77页,点击 下载论文
上一篇:UHF频段RFID标签芯片时钟电路设计
下一篇:基于有源RFID的电子路标技术的研究