Web环境下文献信息的提取与匹配研究

摘要	第1-5页
Abstract	第5-9页
1 绪论	第9-17页
·研究背景	第9-10页
·研究意义	第10页
·研究现状	第10-15页
·Web信息抽取研究现状	第10-13页
·文献信息检索现状	第13-15页
·本文的主要工作	第15-16页
·本文的组织结构	第16-17页
2 基于DOM节点长度的网页信息提取方法	第17-28页
·Web信息提取概念	第17-20页
·Web信息抽取的常用技术	第17-20页
·Web信息抽取的评价指标	第20页
·基于结点内容长度的网页正文信息提取方法	第20-26页
·网页结构树的构建	第20-23页
·网页正文文本的识别	第23-24页
·网页正文文本结构特征	第24-25页
·网页正文文本提取步骤	第25-26页
·实验设计与结果分析	第26页
·本章小结	第26-28页
3 基于HTML树和模板的文献信息提取方法	第28-39页
·页面信息提取模板的构造	第28-30页
·模板的自动生成方法	第29页
·目标内容位置坐标的识别	第29-30页
·网页结构相似度度量	第30-36页
·树的编辑距离	第30-32页
·简单树匹配算法	第32-34页
·文献信息页面相似性度量	第34-36页
·基于模板的文献信息抽取方法	第36-37页
·文献信息抽取实验	第37-38页
·本章小结	第38-39页
4 科研管理系统的开发	第39-48页
·系统开发背景	第39页
·系统简介	第39-41页
·系统功能构成	第39-40页
·系统设计思想	第40-41页
·系统功能介绍	第41-47页
·系统用户权限管理	第41页
·系统用户管理	第41-42页
·科研成果管理	第42-46页
·科研成果自动搜集	第46-47页
·本章小结	第47-48页
结论	第48-50页
参考文献	第50-53页
攻读硕士学位期间发表学术论文情况	第53-54页
致谢	第54-56页