基于Internet的信息抽取技术研究

摘要	第1-5页
Abstract	第5-9页
引言	第9-11页
1 绪论	第11-18页
1．1 信息抽取研究的发展历史	第11-13页
1．2 信息抽取技术与其他相关技术的区别	第13页
1．2．1 信息抽取与信息检索的区别	第13页
1．2．2 信息抽取与自动文摘的区别	第13页
1．2．3 信息抽取与文本挖掘的区别	第13页
1．3 信息抽取的关键技术	第13-14页
1．3．1 命名实体识别	第13-14页
1．3．2 句法分析	第14页
1．3．3 篇章分析与推理	第14页
1．3．4 知识获取	第14页
1．4 信息抽取系统设计方法	第14-15页
1．5 信息抽取系统的评价指标	第15页
1．6 国内外信息抽取技术研究现状	第15-18页
2 信息抽取的模型设计	第18-20页
2．1 信息采集	第18-19页
2．2 文本预处理	第19页
2．3 信息抽取	第19页
2．4 信息库标注	第19页
2．5 数据挖掘	第19-20页
3 信息抽取的主要原理及方法	第20-42页
3．1 Wrapper归纳算法	第20-25页
3．1．1 Wrapper	第20页
3．1．2 wrapper归纳生成	第20-25页
3．2 基于最大熵模型的语句组块分析	第25-33页
3．2．1 组块及其类型的定义	第26页
3．2．2 组块标注	第26-27页
3．2．3 最大熵基本原理	第27-29页
3．2．4 最大熵模型的特征表示	第29-32页
3．2．5 参数估计	第32-33页
3．3 抽取模式生成	第33-39页
3．3．1 相关概念	第33-35页
3．3．2 模式实例的创建与聚类	第35-39页
3．4 XML及其相关技术	第39-42页
3．4．1 XML定义及原理	第39-40页
3．4．2 XML包含的要素	第40页
3．4．3 XML数据存储技术	第40页
3．4．4 文档对象模型	第40-42页
4 SBIES系统设计和实现	第42-55页
4．1 SBIES系统的体系结构	第42页
4．1．1 设计目标及原则	第42页
4．1．2 体系结构图	第42页
4．2 信息获取模块	第42-45页
4．2．1 Wrapper的自动归纳生成	第42页
4．2．2 网页信息的获取	第42-45页
4．3 文本预处理模块	第45页
4．3．1 文本分词与词性标注	第45页
4．3．2 句法分析	第45页
4．4 信息抽取模块	第45-48页
4．4．1 模式匹配	第45-48页
4．4．2 信息融合	第48页
4．5 信息库的组织	第48-52页
4．5．1 XML文档	第48-49页
4．5．2 XML与数据库	第49-52页
4．6 Web表示与用户查询	第52-53页
4．6．1 信息的Web表示	第52页
4．6．2 用户查询	第52-53页
4．7 系统评估	第53-55页
结论	第55-57页
参考文献	第57-60页
攻读硕士学位期间发表学术论文情况	第60-61页
致谢	第61-62页
大连理工大学学位论文版权使用授权书	第62页