首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Deep Web数据库的自动分类的研究

提要第1-7页
第1章 绪论第7-11页
   ·Deep Web 简介第7-8页
     ·Deep Web 的概念第7页
     ·Deep Web 资源现状及研究现状第7-8页
   ·选题方向及该方向已有研究成果第8-9页
   ·本文的主要工作及结构安排第9-11页
第2章 背景知识第11-20页
   ·文本表示第11页
   ·文本分类算法第11-14页
     ·决策树分类算法第12页
     ·朴素贝叶斯分类算法第12-13页
     ·支持向量机分类算法第13页
     ·K 近邻分类算法第13-14页
   ·HTML 表单介绍第14-15页
   ·文档对象模型(DOM)第15-18页
     ·DOM 眼中的HTML 文档第15页
     ·HTML 文档节点第15-17页
     ·使用DOM 操作HTML 文档第17-18页
     ·HTML 文档解析器—NekoHTML第18页
   ·WordNet 介绍第18-20页
第3章 基于质心及WordNet的Web数据库分类研究第20-32页
   ·本文提出的分类框架图第20-21页
   ·表单文本提取算法第21-22页
   ·表单文本特征向量的构建第22-25页
     ·普通文本特征向量的构建第23页
     ·有语义的文本特征向量构建第23-25页
   ·利用质心来加强特征向量第25-27页
     ·质心特征向量的计算第25-26页
     ·特征向量的加强第26-27页
   ·系统实现第27-32页
     ·文本预处理模块第27-29页
     ·质心生成模块第29-30页
     ·分类算法第30-32页
第4章 实验与结果分析第32-41页
   ·训练样例的收集第32-33页
   ·实验部分第33-39页
     ·实验一:单纯利用表单文本进行分类第33-35页
     ·实验二:利用质心及表单文本进行分类第35-36页
     ·实验三:利用语义特征向量进行分类第36-38页
     ·实验四:利用质心及语义特征向量进行分类第38-39页
   ·实验结果比较第39-41页
第5章 Deep Web数据库分类的应用第41-46页
   ·新的HIFI 架构第41-42页
   ·表单结构分类器第42-45页
     ·表单结构分析第42-43页
     ·表单结构分类器构建第43-45页
   ·合并分类器识别特定领域表单第45-46页
第6章 结论及未来工作第46-48页
   ·本文总结第46-47页
   ·未来工作第47-48页
参考文献第48-51页
致谢第51-52页
摘要第52-55页
Abstract第55-57页

论文共57页,点击 下载论文
上一篇:基于Java的IoC容器的设计与实现
下一篇:综合人工平台系统技术架构的研究及实现