Deep Web数据抽取及语义标注研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-16页
·研究背景	第10页
·研究现状	第10-14页
·Deep Web	第10-12页
·数据抽取技术	第12-13页
·语义标注技术	第13-14页
·研究目标	第14页
·论文组织	第14-15页
·本章小结	第15-16页
第2章相关知识介绍	第16-32页
·HTML	第16-19页
·HTML简介	第16页
·HTML标签	第16-17页
·HTML特点	第17页
·DHTML	第17-18页
·javascript	第18-19页
·XML	第19-22页
·XML简介	第19-20页
·XML语法规则	第20-21页
·DTD	第21页
·XPath	第21-22页
·XHTML	第22页
·DOM	第22-25页
·DOM简介	第22-23页
·XML DOM	第23-25页
·XPathResult对象	第25页
·Deep Web数据集成	第25-27页
·查询接口生成模块	第26-27页
·查询处理模块	第27页
·查询结果处理模块	第27页
·数据抽取	第27-28页
·数据抽取的概念	第27-28页
·数据抽取性能的衡量标准	第28页
·NekoHTML	第28页
·语义标注	第28-29页
·语义标注的概念	第28页
·语义标注结果的衡量标准	第28-29页
·中文分词	第29-31页
·中文分词简介	第29-30页
·中文分词工具ICTCLAS	第30页
·中科院计算所汉语词性标记集	第30-31页
·本章小结	第31-32页
第3章基于Xpath的数据抽取	第32-39页
·查询结果页面规范化	第32页
·规范化XML文档结构分析	第32-33页
·待抽取数据路径表达式	第33-35页
·数据抽取与数据预处理	第35-36页
·数据抽取实现过程	第36-38页
·本章小结	第38-39页
第4章基于中文词性和领域知识的语义标注	第39-44页
·结果模式分析	第39页
·词性分析	第39-40页
·语义标注集	第40页
·数据语义标注	第40-41页
·语义型数据标注	第40页
·内容型数据标注	第40-41页
·语义标注实现过程	第41-43页
·本章小结	第43-44页
第5章实验与分析	第44-46页
·数据抽取实验及分析	第44页
·语义标注实验及分析	第44-45页
·本章小结	第45-46页
第6章总结与展望	第46-47页
参考文献	第47-49页
攻读硕士学位期间科研工作情况	第49-50页
致谢	第50页