首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于CRF的Web机构实体信息抽取系统

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-14页
   ·搜索引擎与抽取技术第10-11页
   ·研究现状第11-12页
   ·本文研究内容及组织架构第12-14页
第2章 关键技术第14-17页
   ·网页分类第14-15页
   ·条件随机场第15-17页
第3章 机构实体信息抽取系统的需求和框架设计第17-21页
   ·系统需求分析第17-19页
     ·元数据抽取第17-18页
     ·机构实体信息抽取系统的目标第18-19页
   ·系统的框架结构第19-21页
第4章 官方机构实体信息网页分类模块第21-37页
   ·特征的选择和表示第22-26页
     ·网页特征的选择第22-24页
     ·特征及其表示方法第24-26页
   ·分类过程的实现方法第26-29页
     ·建立模型第26-27页
     ·分类过程第27-29页
   ·实验结果第29-37页
     ·数据的准备第29-30页
     ·分类器的准确率第30-32页
     ·置信度阈值的选取第32-33页
     ·地址特征的分析第33-35页
     ·锚特征的效果验证第35页
     ·与基于规则的分类器进行对比第35-37页
第5章 基于层叠条件随机场的网页抽取模块第37-47页
   ·网页抽取面临的困难第37-38页
   ·层叠条件随机场模型第38-46页
     ·高层基于树形的条件随机场模型第40-44页
     ·低层属性标注条件随机场模型第44-46页
   ·实验结果第46-47页
第6章 总结与展望第47-49页
   ·本文总结第47-48页
   ·展望第48-49页
参考文献第49-51页
作者简介及在学期间所取得的科研成果第51-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:一种面向Web应用系统的自动化测试框架
下一篇:交互式R语言开发工具的设计与实现