首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于本体的Web非规范知识处理中采集技术研究

摘要第1-4页
Abatract第4-10页
第一章 绪言第10-15页
 1.1 基于本体的 Web非规范知识采集研究的产生背景第10页
 1.2 基于本体的 Web非规范知识采集研究的发展第10-12页
  1.2.1 基于本体的 Web非规范知识采集的相关方法第10-11页
   1.2.1.1 直接解析 HTML文档的方法第11页
   1.2.1.2 基于概念建模的方法(Conceptual-Model-Based Approach)第11页
  1.2.2 基于本体的Web非规范知识采集中规则的表示第11-12页
  1.2.3 基于本体的web非规范知识采集具有的特点第12页
   1.2.3.1 语义分析第12页
   1.2.3.2 针对性强,精度高第12页
 1.3 本课题主要解决的问题第12-13页
 1.4 本课题的主要研究内容第13页
 1.5 论文的结构第13-15页
第二章 相关标准第15-34页
 2.1 HTML (Hyper Text Markup Language)第15-16页
 2.2 XML第16-34页
  2.2.1 XML的产生第16页
  2.2.2 XML语法第16-18页
   2.2.2.1 XML文档第17-18页
  2.2.3 元素(Element)与标记(Tag)第18页
  2.2.4 属性(Attribute)第18页
  2.2.5 XML验证(Validation)第18-19页
   2.2.5.1 DTD第18-19页
   2.2.5.2 模式第19页
  2.2.6 样式单第19-20页
   2.2.6.1 XSLT(XSL Transformation)第20页
  2.2.7 XML包括一套相关的标准第20页
  2.3 XHTML第20-21页
  2.4 DOM(Document Object Model)第21页
  2.5 XPath第21-26页
   2.5.1 查询第22-23页
   2.5.2 定位路径(Location Path)第23-25页
    2.5.2.1 轴第23页
    2.5.2.2 节点测试第23-24页
    2.5.2.3 谓词第24页
    2.5.2.4 复合定位路径第24页
    2.5.2.5 绝对定位路径第24页
    2.5.2.6 缩写定位路径第24-25页
   2.5.3 表达式第25-26页
    2.5.3.1 常量第25页
    2.5.3.2 运算符第25-26页
    2.5.3.3 函数第26页
  2.6 XSLT第26-34页
   2.6.1 模板第27页
   2.6.2 取得节点值第27-28页
   2.6.3 应用模板第28页
   2.6.4 默认模板规则第28-29页
   2.6.5 循环第29页
   2.6.6 选择第29-30页
   2.6.7 变量第30-31页
   2.6.8 按名称调用模板第31-32页
   2.6.9 用 Java扩展XSLT第32页
   2.6.10 EXSLT(Extensions to XSLT)第32-34页
第三章 相关技术综述第34-58页
 3.1 Bot技术第34-38页
  3.1.1 网络机器人的结构分析第34-35页
   3.1.1.1 如何解析 HTML第34-35页
  3.1.2 Spider程序结构第35-36页
  3.1.3 如何构造 Spider程序第36-38页
  3.1.4 小节第38页
 3.2 Lucene技术第38-41页
  3.2.1 Lucene的原理分析第38-40页
   3.2.1.1 全文检索的实现机制第38-39页
   3.2.1.2 Lucene的索引效率第39-40页
   3.2.1.3 中文切分词机制第40页
  3.2.2 小节第40-41页
 3.3 本体第41-47页
  3.3.1 本体的概念第41-42页
  3.3.2 本体的建立过程第42-43页
  3.3.3 Ontology的知识表示第43页
  3.3.4 Ontology的构建规范第43页
  3.3.5 本体建设工具第43-47页
   3.3.5.1 基于Al的本体描述语言的一类工具第43-45页
   3.3.5.2 基于Web的本体描述语言的一类工具第45-47页
  3.3.6 本课题使用的技术第47页
 3.4 DOM模板第47-52页
  3.4.1 DOM 的定义第47-48页
  3.4.2 DOM 模板的简介和发展第48-50页
  3.4.3 DOM 的主要特点第50-51页
  3.4.5 DOM 和HTML 树型逻辑结构第51-52页
  3.4.6 两个常用的编程接口: Node和 HTML Collection第52页
 3.5 HTML转换 XML的技术第52-54页
  3.5.1 问题的提出第52-53页
  3.5.2 实现HTML到XML转换的必要性第53页
  3.5.3 HTML-XML转换相关的技术第53-54页
  3.5.4 本课题使用的技术第54页
 3.6 XML的存储技术第54-58页
  3.6.1 XML数据存储技术研究现状第55-57页
  3.6.2 本课题采用的技术第57-58页
第四章 基于领域本体的资源管理平台第58-67页
 4.1 总体框架第58-60页
 4.2 各部分的功能第60-62页
 4.3 平台管理的资源第62页
 4.4 基于本体的领域资源管理系统框架的设计原则第62-64页
 4.5 本体开发语言 RDF/RDFS第64页
 4.6 资源存储第64-67页
第五章 基于本体的Web非规范知识采集系统第67-89页
 5.1 Web页面信息抽取系统的一般实现第67-68页
  5.1.1 Web信息抽取系统的工作过程第67页
  5.1.2 Web信息抽取系统工作原理示意图第67-68页
 5.2 基于本体的 Web非规范知识采集系统第68-89页
  5.2.1 HTML-XML转换包装器的系统设计思想第69-70页
  5.2.2 HTML-ML包装器的软件结构第70-74页
   5.2.2.1 HTML句法规范器第71页
   5.2.2.2 HTML解析器第71页
   5.2.2.3 XSLT信息抽取器第71-73页
   5.2.2.4 结构列表生成器第73页
   5.2.2.5 XML模板映射器第73-74页
   5.2.2.6 XML信元生成器第74页
  5.2.3 HTML-XML包装器的实现流程第74-89页
   5.2.3.1 HTML句法规范器的具体实现第74页
   5.2.3.2 HTML解析器的具体实现第74-76页
   5.2.3.3 XSLT信息抽取器的具体实现第76-83页
   5.2.3.4 结构列表生成器的具体实现第83-84页
   5.2.3.5 XML模板映射器的具体实现第84-87页
   5.2.3.6 XML信元生成器的具体实现第87-89页
第六章 总结与展望第89-91页
致谢第91-92页
参考文献第92-96页
附录:攻读学位期间发表论文情况第96页

论文共96页,点击 下载论文
上一篇:武术系点穴之我见
下一篇:解反应-扩散方程组的新数值方法