Deep Web环境下实体的信息抽取与识别研究

摘要	第1-5页
ABSTRACT	第5-10页
第1章引言	第10-18页
·课题背景	第10-11页
·研究现状	第11-13页
·研究目的与意义	第13-14页
·研究目的	第13-14页
·研究意义	第14页
·问题的提出与解决思路	第14-17页
·问题的提出	第14-15页
·解决思路	第15-17页
·论文组织结构	第17-18页
第2章相关知识技术综述	第18-27页
·HTML 和 XML	第18-20页
·HTML 概念及标签	第18页
·XML	第18-20页
·模板化 Web 文档结构分析	第20-21页
·本体论	第21-24页
·本体的概念与分类	第21页
·本体的构建	第21-22页
·本体的概念模型	第22-24页
·BP 神经网络	第24-26页
·BP 神经网络概述	第24页
·BP 神经网络模型	第24-25页
·BP 神经网络学习原理	第25-26页
·本章小结	第26-27页
第3章基于模板的 Deep Web 实体信息抽取	第27-39页
·实体信息抽取模型	第27-28页
·加工准备阶段	第28-30页
·网页自动获取	第28-29页
·HTML 网页信息清洗	第29-30页
·模板训练阶段	第30-36页
·结构分析	第31-33页
·语义分析	第33-36页
·实体信息抽取阶段	第36-38页
·寻找匹配数据源信息路径	第36-37页
·实体信息抽取	第37-38页
·本章小结	第38-39页
第4章基于 BP 神经网络的 Deep Web 实体识别	第39-48页
·实体识别概述	第39-40页
·实体信息分块	第40-41页
·语义块相似度计算	第41-43页
·非字符串的相似度计算	第41-42页
·字符文本的相似度计算	第42-43页
·基于 BP 神经网络的实体识别模型训练	第43-47页
·BP 算法	第43-45页
·实体识别模型	第45-47页
·本章小结	第47-48页
第5章实验与分析	第48-59页
·准备工作	第48-49页
·实验环境和开发工具介绍	第48页
·数据源	第48-49页
·性能指标	第49页
·实验内容与结果分析	第49-58页
·实体信息抽取阶段	第49-52页
·实体识别阶段	第52-58页
·本章小结	第58-59页
第6章结论与展望	第59-61页
·结论	第59页
·后期工作展望	第59-61页
致谢	第61-62页
参考文献	第62-65页
攻读学位期间发表的学术论文及参加科研情况	第65-66页