首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Internet的信息抽取技术研究

摘要第1-5页
Abstract第5-9页
引言第9-11页
1 绪论第11-18页
 1.1 信息抽取研究的发展历史第11-13页
 1.2 信息抽取技术与其他相关技术的区别第13页
  1.2.1 信息抽取与信息检索的区别第13页
  1.2.2 信息抽取与自动文摘的区别第13页
  1.2.3 信息抽取与文本挖掘的区别第13页
 1.3 信息抽取的关键技术第13-14页
  1.3.1 命名实体识别第13-14页
  1.3.2 句法分析第14页
  1.3.3 篇章分析与推理第14页
  1.3.4 知识获取第14页
 1.4 信息抽取系统设计方法第14-15页
 1.5 信息抽取系统的评价指标第15页
 1.6 国内外信息抽取技术研究现状第15-18页
2 信息抽取的模型设计第18-20页
 2.1 信息采集第18-19页
 2.2 文本预处理第19页
 2.3 信息抽取第19页
 2.4 信息库标注第19页
 2.5 数据挖掘第19-20页
3 信息抽取的主要原理及方法第20-42页
 3.1 Wrapper归纳算法第20-25页
  3.1.1 Wrapper第20页
  3.1.2 wrapper归纳生成第20-25页
 3.2 基于最大熵模型的语句组块分析第25-33页
  3.2.1 组块及其类型的定义第26页
  3.2.2 组块标注第26-27页
  3.2.3 最大熵基本原理第27-29页
  3.2.4 最大熵模型的特征表示第29-32页
  3.2.5 参数估计第32-33页
 3.3 抽取模式生成第33-39页
  3.3.1 相关概念第33-35页
  3.3.2 模式实例的创建与聚类第35-39页
 3.4 XML及其相关技术第39-42页
  3.4.1 XML定义及原理第39-40页
  3.4.2 XML包含的要素第40页
  3.4.3 XML数据存储技术第40页
  3.4.4 文档对象模型第40-42页
4 SBIES系统设计和实现第42-55页
 4.1 SBIES系统的体系结构第42页
  4.1.1 设计目标及原则第42页
  4.1.2 体系结构图第42页
 4.2 信息获取模块第42-45页
  4.2.1 Wrapper的自动归纳生成第42页
  4.2.2 网页信息的获取第42-45页
 4.3 文本预处理模块第45页
  4.3.1 文本分词与词性标注第45页
  4.3.2 句法分析第45页
 4.4 信息抽取模块第45-48页
  4.4.1 模式匹配第45-48页
  4.4.2 信息融合第48页
 4.5 信息库的组织第48-52页
  4.5.1 XML文档第48-49页
  4.5.2 XML与数据库第49-52页
 4.6 Web表示与用户查询第52-53页
  4.6.1 信息的Web表示第52页
  4.6.2 用户查询第52-53页
 4.7 系统评估第53-55页
结论第55-57页
参考文献第57-60页
攻读硕士学位期间发表学术论文情况第60-61页
致谢第61-62页
大连理工大学学位论文版权使用授权书第62页

论文共62页,点击 下载论文
上一篇:预负荷空心圆柱滚动体轴承的有限元分析及优化设计
下一篇:基于USB接口的CAN总线通信适配器的研究和应用