首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

特定领域的深度网入口识别技术研究

提要第1-7页
第一章 绪论第7-11页
   ·深度网简介第7-9页
     ·深度网的概念第7-8页
     ·深度网领域分类及入口识别第8-9页
   ·主题爬行技术简介第9页
   ·本文主要工作和结构安排第9-11页
第二章 相关知识简介第11-22页
   ·HTML 语言第11-12页
   ·HTML 表单第12-16页
     ·表单标记第12-14页
     ·表单控件第14-16页
   ·文档对象模型第16-20页
     ·HTML 文档的D OM 表示第16-17页
     ·HTML 文档节点的DO M 表示第17-18页
     ·HTML 文档的D OM 操作第18-20页
   ·NekoHTML 和Weka第20-22页
     ·NekoHTML 简介第20-21页
     ·Weka 简介第21-22页
第三章 特定领域深度网入口识别第22-43页
   ·深度网入口表单判断第24-26页
     ·表单的类型第24-25页
     ·启发式规则第25-26页
   ·表单填充与结果页获得第26-36页
     ·表单提取与建模第26-32页
     ·表单填充第32-36页
   ·网页分类器第36-39页
     ·提取文本特征第37-38页
     ·文档向量的建立第38-39页
     ·分类第39页
   ·实验与结果分析第39-43页
     ·实验数据的收集和处理第39-40页
     ·系统实现所使用的技术第40-41页
     ·实验结果及分析第41-43页
第四章 识别器在深度网主题爬行过程中的应用第43-47页
   ·主题爬行框架简介第43-44页
   ·深度网入口的主题爬行框架第44-47页
第五章 结论和未来工作第47-49页
   ·结论第47-48页
   ·未来工作第48-49页
参考文献第49-51页
摘要第51-54页
Abstract第54-57页
致谢第57-58页
导师及作者简介第58页

论文共58页,点击 下载论文
上一篇:建筑工程材料质量检测管理系统数据采集及实时曲线的绘制
下一篇:视觉测量系统标定技术研究