基于HTML的WEB就业信息抽取技术研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·研究背景及意义	第9-12页
·研究背景	第9-10页
·国内外研究现状	第10-11页
·研究意义	第11-12页
·本文研究的目的和内容	第12-14页
·研究目的	第12-13页
·研究内容	第13页
·论文结构安排	第13-14页
·本章小结	第14-15页
第二章相关技术介绍	第15-30页
·WEB 信息抽取技术	第15-23页
·信息抽取	第15-16页
·Web 信息抽取	第16页
·信息抽取方法	第16-23页
·根据信息抽取对象分类	第16-17页
·根据抽取原理和抽取方式分类	第17-23页
·标记语言	第23-27页
·SGML（标准通用标记语言）	第23-24页
·HTML	第24-26页
·XML	第26-27页
·文档对象模型(DOM)	第27-29页
·本章小结	第29-30页
第三章就业信息网页特征分析与抽取模型	第30-43页
·就业信息网页的特征分析	第30-33页
·HTML 结构分析	第33-36页
·HTML 中的表格(TABLE)分析	第36-41页
·HTML 中表格的定义与使用	第36-39页
·Web 表格的特点	第39页
·真表格与假表格的分类	第39-40页
·表格信息的抽取方法	第40-41页
·WEB 表格信息抽取模型的设计	第41-42页
·本章小结	第42-43页
第四章 WEB 就业信息抽取的实现	第43-68页
·网页的获取	第43-44页
·WEB 页清洗	第44-48页
·DOM 树的生成	第48-50页
·表格中信息的抽取	第50-65页
·WEB 表格定位技术研究	第51-56页
·基本定义	第51-53页
·算法设计	第53-56页
·表格的规范化处理	第56-60页
·数据存储模型设计	第60-61页
·表格内容存储	第61-63页
·表头位置识别	第63-65页
·实验结果	第65-67页
·信息抽取结果的衡量标准	第65页
·实验结果分析	第65-67页
·本章小结	第67-68页
第五章总结与展望	第68-69页
·总结	第68页
·展望	第68-69页
参考文献	第69-72页
攻读学位期间主要成果	第72-73页
致谢	第73页