首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

使用表单分类器识别特定领域的深度网入口

提要第1-7页
第一章 绪论第7-13页
   ·深度网的概念及资源介绍第7-8页
   ·访问深度网站点的描述第8-9页
   ·主题爬行技术的需求第9-10页
   ·相关工作第10-11页
   ·本文的主要工作第11-13页
第二章 DOM模型及分类算法介绍第13-26页
   ·HTML语言第13-17页
   ·DOM模型的定义第17-19页
   ·DOM表示结构化文档的方式第19-21页
   ·分类算法的介绍第21-26页
     ·支持向量机第21-22页
     ·决策树第22-23页
     ·朴素贝叶斯第23-24页
     ·k-近邻算法第24-26页
第三章 表单分类器第26-44页
   ·识别深度网入口第26-35页
     ·表单的类型第26-28页
     ·提取表单特征第28-29页
     ·分类第29-30页
     ·实验部分第30-35页
   ·识别特定领域的深度网入口第35-42页
     ·深度网入口的类型第36页
     ·提取文本特征第36-38页
     ·文档向量的建立第38-39页
     ·分类第39页
     ·实验部分第39-42页
   ·表单分类器总结第42-44页
     ·表单分类器的分类流程第42-43页
     ·检验表单分类器的准确率第43页
     ·表单分类器的局限性第43-44页
第四章 表单分类器在网络中的应用第44-50页
   ·主题爬行框架的介绍第44-45页
   ·深度网入口的爬行框架第45-48页
   ·实验部分第48-50页
     ·系统实现第48页
     ·实验结果第48-50页
第五章 结论和未来工作第50-52页
   ·结论第50-51页
   ·未来工作第51-52页
参考文献第52-54页
摘要第54-57页
Abstract第57-61页
致谢第61-62页
导师及作者简介第62页

论文共62页,点击 下载论文
上一篇:自尊需要的结构研究
下一篇:中文信息抽取中的若干问题研究