首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于HTML的WEB就业信息抽取技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-15页
   ·研究背景及意义第9-12页
     ·研究背景第9-10页
     ·国内外研究现状第10-11页
     ·研究意义第11-12页
   ·本文研究的目的和内容第12-14页
     ·研究目的第12-13页
     ·研究内容第13页
     ·论文结构安排第13-14页
   ·本章小结第14-15页
第二章 相关技术介绍第15-30页
   ·WEB 信息抽取技术第15-23页
     ·信息抽取第15-16页
     ·Web 信息抽取第16页
     ·信息抽取方法第16-23页
       ·根据信息抽取对象分类第16-17页
       ·根据抽取原理和抽取方式分类第17-23页
   ·标记语言第23-27页
     ·SGML(标准通用标记语言)第23-24页
     ·HTML第24-26页
     ·XML第26-27页
   ·文档对象模型(DOM)第27-29页
   ·本章小结第29-30页
第三章 就业信息网页特征分析与抽取模型第30-43页
   ·就业信息网页的特征分析第30-33页
   ·HTML 结构分析第33-36页
   ·HTML 中的表格(TABLE)分析第36-41页
     ·HTML 中表格的定义与使用第36-39页
     ·Web 表格的特点第39页
     ·真表格与假表格的分类第39-40页
     ·表格信息的抽取方法第40-41页
   ·WEB 表格信息抽取模型的设计第41-42页
   ·本章小结第42-43页
第四章 WEB 就业信息抽取的实现第43-68页
   ·网页的获取第43-44页
   ·WEB 页清洗第44-48页
   ·DOM 树的生成第48-50页
   ·表格中信息的抽取第50-65页
     ·WEB 表格定位技术研究第51-56页
       ·基本定义第51-53页
       ·算法设计第53-56页
     ·表格的规范化处理第56-60页
     ·数据存储模型设计第60-61页
     ·表格内容存储第61-63页
     ·表头位置识别第63-65页
   ·实验结果第65-67页
     ·信息抽取结果的衡量标准第65页
     ·实验结果分析第65-67页
   ·本章小结第67-68页
第五章 总结与展望第68-69页
   ·总结第68页
   ·展望第68-69页
参考文献第69-72页
攻读学位期间主要成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:手机产品信息垂直搜索引擎的研究
下一篇:可移植的Android驱动程序框架研究