首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中网页信息抽取技术的研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景和意义第7-8页
   ·研究现状第8-10页
     ·搜索引擎发展现状第8-9页
     ·Web 信息抽取技术研究现状第9-10页
   ·论文的研究内容及结构安排第10-13页
     ·研究内容第10页
     ·结构安排第10-13页
第二章 网页信息抽取关键技术第13-17页
   ·网页信息抽取的概念第13页
   ·网页信息抽取技术的分类第13-15页
     ·基于HTML 结构的信息抽取第13-14页
     ·基于自然语言处理的信息抽取第14页
     ·基于包装器的信息抽取第14页
     ·基于Ontology 的信息抽取第14-15页
     ·基于统计模型的信息抽取第15页
   ·网页信息抽取的难点第15-16页
   ·信息抽取系统性能评估第16页
   ·本章小结第16-17页
第三章 基于视觉特征的页面分析技术第17-23页
   ·基于视觉的Web 页面内容结构描述第17-19页
   ·VIPS 算法描述第19-20页
   ·VIPS 算法实现与演示第20-21页
   ·本章小结第21-23页
第四章 基于分块重要度和2D CRFs 的Web 对象信息抽取第23-39页
   ·Web 对象信息抽取第23-24页
     ·问题的提出第23-24页
     ·解决方案第24页
   ·网页分块重要度模型第24-30页
     ·网页块特征第26-27页
     ·分块重要度标注第27-28页
     ·分块重要度学习第28-30页
   ·2DCRFs 模型第30-34页
     ·CRFs 模型第31页
     ·2D CRFs 模型第31-32页
     ·参数估计第32-33页
     ·属性标注第33-34页
   ·实验与性能分析第34-36页
     ·BIM 实验第34-35页
     ·2D CRFs 实验第35-36页
   ·本章小结第36-39页
第五章 基于改进的HCRFs 的Web 对象信息抽取第39-47页
   ·Web 对象信息抽取第39-41页
     ·数据表示第39-40页
     ·问题定义第40-41页
   ·HCRFs 模型第41页
   ·改进的HCRFs 模型第41-43页
     ·LL-HCRFs第41-42页
     ·参数训练估计第42-43页
     ·属性标注第43页
   ·实验与性能分析第43-46页
   ·本章小结第46-47页
第六章 “搜食计”垂直搜索引擎系统第47-55页
   ·“搜食计”项目介绍第47页
   ·“搜食计”垂直搜索引擎特点第47-50页
   ·开发环境与系统框架第50-51页
     ·开发环境第50页
     ·系统框架第50-51页
   ·系统实现第51-53页
     ·主题爬虫第51-52页
     ·网页分析模块第52-53页
   ·本章小结第53-55页
第七章 总结与展望第55-57页
   ·本文总结第55页
   ·展望第55-57页
致谢第57-59页
参考文献第59-63页
附录:作者在攻读硕士学位期间发表的论文第63页

论文共63页,点击 下载论文
上一篇:碰撞检测算法研究及其在引擎软件中的应用
下一篇:目标跟踪算法研究