基于领域本体的Web信息抽取技术研究

中文摘要	第1-7页
英文摘要	第7-9页
1 绪论	第9-14页
·Web 信息抽取技术的研究背景和基本概念	第9-11页
·研究背景	第9-10页
·信息抽取技术概念及研究意义	第10-11页
·论文的研究内容及主要问题究	第11-12页
·现有信息抽取技术	第11页
·Web 信息抽取方法	第11-12页
·本文提出的主要技术	第12-13页
·论文结构	第13-14页
2 相关概念	第14-34页
·本体及领域本体的相关理论	第14-24页
·本体的相关概念	第14-15页
·本体的分类及领域本体的相关理论	第15-16页
·领域本体构建的方法及关键技术	第16-21页
·本体描述的方法简介	第21-24页
·自然语言处理技术	第24-28页
·自然语言处理技术概述	第24-25页
·自然语言处理技术的理论与方法	第25-28页
·自然语言处理的发展趋势	第28页
·语义网	第28-33页
·语义网的概念和特征	第29-30页
·语义网关键技术简介	第30-31页
·XML	第31-32页
·RDF	第32-33页
·Ontology	第33页
·本章小结	第33-34页
3 领域本体的属性约简及文本相似度计算	第34-47页
·粗糙集属性约简算法	第34-37页
·粗糙集基本知识	第34-35页
·信息系统	第34页
·等价类、约简、核	第34-35页
·属性约简的经典算法	第35-36页
·基于属性重要性的约简算法	第36-37页
·属性重要性	第36-37页
·约简算法	第37页
·基于分词的中文文本相似度计算	第37-46页
·相似度	第38-39页
·相似算法	第39页
·中文文本相似度计算的主要方法	第39-46页
·基于向量空间模型的 TF-IDF 方法	第39-41页
·基于汉明距离的文本相似度计算方法	第41-43页
·基于属性论的文本相似度计算方法	第43-45页
·基于语义理解的相似度计算方法	第45-46页
·文本相似度计算的新方法	第46页
·本章小结	第46-47页
4 领域本体指导的 Web 商品表格信息抽取	第47-57页
·系统的总体设计	第47-48页
·领域本体指导的商品信息抽取系统框架模型	第48-55页
·领域本体架构和抽取模式的建立	第48-50页
·网页分块技术	第50-54页
·网页的结构化特征	第50-52页
·网页分块算法	第52-54页
·网页中的表格信息的抽取与处理	第54-55页
·实验与讨论	第55-56页
·评价标准	第55页
·实验与分析	第55-56页
·本章小结	第56-57页
5 领域本体指导的 Web 商品文本信息抽取	第57-64页
·系统总体设计	第57-58页
·网页文本的分块	第58-61页
·基于视觉的网页分块算法	第58-59页
·网页整体的语义块分割	第59-60页
·对段落内容的文本分割	第60-61页
·分块信息属性和属性值的抽取	第61-62页
·对框架的可行性测试及存在的问题	第62-63页
·测试的主要内容、方式及结果	第62页
·存在的问题	第62-63页
·本章小结	第63-64页
6 展望及结束语	第64-66页
·本文工作总结	第64页
·未来工作展望	第64-66页
参考文献	第66-74页
参与项目	第74-75页
攻读硕士学位期间发表的学术论文目录	第75-76页
致谢	第76-77页