首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web环境下文献信息的提取与匹配研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-17页
   ·研究背景第9-10页
   ·研究意义第10页
   ·研究现状第10-15页
     ·Web信息抽取研究现状第10-13页
     ·文献信息检索现状第13-15页
   ·本文的主要工作第15-16页
   ·本文的组织结构第16-17页
2 基于DOM节点长度的网页信息提取方法第17-28页
   ·Web信息提取概念第17-20页
     ·Web信息抽取的常用技术第17-20页
     ·Web信息抽取的评价指标第20页
   ·基于结点内容长度的网页正文信息提取方法第20-26页
     ·网页结构树的构建第20-23页
     ·网页正文文本的识别第23-24页
     ·网页正文文本结构特征第24-25页
     ·网页正文文本提取步骤第25-26页
     ·实验设计与结果分析第26页
   ·本章小结第26-28页
3 基于HTML树和模板的文献信息提取方法第28-39页
   ·页面信息提取模板的构造第28-30页
     ·模板的自动生成方法第29页
     ·目标内容位置坐标的识别第29-30页
   ·网页结构相似度度量第30-36页
     ·树的编辑距离第30-32页
     ·简单树匹配算法第32-34页
     ·文献信息页面相似性度量第34-36页
   ·基于模板的文献信息抽取方法第36-37页
   ·文献信息抽取实验第37-38页
   ·本章小结第38-39页
4 科研管理系统的开发第39-48页
   ·系统开发背景第39页
   ·系统简介第39-41页
     ·系统功能构成第39-40页
     ·系统设计思想第40-41页
   ·系统功能介绍第41-47页
     ·系统用户权限管理第41页
     ·系统用户管理第41-42页
     ·科研成果管理第42-46页
     ·科研成果自动搜集第46-47页
   ·本章小结第47-48页
结论第48-50页
参考文献第50-53页
攻读硕士学位期间发表学术论文情况第53-54页
致谢第54-56页

论文共56页,点击 下载论文
上一篇:Web环境下的Simulink仿真系统研究与开发
下一篇:Windows内核级木马架构模型的改进与实现