首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域本体的Web信息抽取技术研究

中文摘要第1-7页
英文摘要第7-9页
1 绪论第9-14页
   ·Web 信息抽取技术的研究背景和基本概念第9-11页
     ·研究背景第9-10页
     ·信息抽取技术概念及研究意义第10-11页
   ·论文的研究内容及主要问题究第11-12页
     ·现有信息抽取技术第11页
     ·Web 信息抽取方法第11-12页
   ·本文提出的主要技术第12-13页
   ·论文结构第13-14页
2 相关概念第14-34页
   ·本体及领域本体的相关理论第14-24页
     ·本体的相关概念第14-15页
     ·本体的分类及领域本体的相关理论第15-16页
     ·领域本体构建的方法及关键技术第16-21页
     ·本体描述的方法简介第21-24页
   ·自然语言处理技术第24-28页
     ·自然语言处理技术概述第24-25页
     ·自然语言处理技术的理论与方法第25-28页
     ·自然语言处理的发展趋势第28页
   ·语义网第28-33页
     ·语义网的概念和特征第29-30页
     ·语义网关键技术简介第30-31页
     ·XML第31-32页
     ·RDF第32-33页
     ·Ontology第33页
   ·本章小结第33-34页
3 领域本体的属性约简及文本相似度计算第34-47页
   ·粗糙集属性约简算法第34-37页
     ·粗糙集基本知识第34-35页
       ·信息系统第34页
       ·等价类、约简、核第34-35页
     ·属性约简的经典算法第35-36页
     ·基于属性重要性的约简算法第36-37页
       ·属性重要性第36-37页
       ·约简算法第37页
   ·基于分词的中文文本相似度计算第37-46页
     ·相似度第38-39页
     ·相似算法第39页
     ·中文文本相似度计算的主要方法第39-46页
       ·基于向量空间模型的 TF-IDF 方法第39-41页
       ·基于汉明距离的文本相似度计算方法第41-43页
       ·基于属性论的文本相似度计算方法第43-45页
       ·基于语义理解的相似度计算方法第45-46页
   ·文本相似度计算的新方法第46页
   ·本章小结第46-47页
4 领域本体指导的 Web 商品表格信息抽取第47-57页
   ·系统的总体设计第47-48页
   ·领域本体指导的商品信息抽取系统框架模型第48-55页
     ·领域本体架构和抽取模式的建立第48-50页
     ·网页分块技术第50-54页
       ·网页的结构化特征第50-52页
       ·网页分块算法第52-54页
     ·网页中的表格信息的抽取与处理第54-55页
   ·实验与讨论第55-56页
     ·评价标准第55页
     ·实验与分析第55-56页
   ·本章小结第56-57页
5 领域本体指导的 Web 商品文本信息抽取第57-64页
   ·系统总体设计第57-58页
   ·网页文本的分块第58-61页
     ·基于视觉的网页分块算法第58-59页
     ·网页整体的语义块分割第59-60页
     ·对段落内容的文本分割第60-61页
   ·分块信息属性和属性值的抽取第61-62页
   ·对框架的可行性测试及存在的问题第62-63页
     ·测试的主要内容、方式及结果第62页
     ·存在的问题第62-63页
   ·本章小结第63-64页
6 展望及结束语第64-66页
   ·本文工作总结第64页
   ·未来工作展望第64-66页
参考文献第66-74页
参与项目第74-75页
攻读硕士学位期间发表的学术论文目录第75-76页
致谢第76-77页

论文共77页,点击 下载论文
上一篇:基于建构主义理论的初中数学“过程化”教学研究
下一篇:中尺度集合预报的偏差订正与多模式集成研究