基于WEB的书目信息自动搜集与服务

摘要	第1-6页
ABSTRACT	第6-7页
第一章绪论	第7-12页
·引言	第7页
·研究背景及意义	第7页
·研究现状	第7-10页
·信息搜集与服务的现状	第8页
·信息抽取的发展现状	第8-10页
·本文的研究思路和主要工作	第10页
·本文的研究成果	第10页
·本文的组织结构	第10-12页
第二章数字图书馆中的元数据	第12-17页
·数字图书馆	第12页
·数字化资源的建设	第12页
·网络信息资源的搜集和整理	第12页
·元数据	第12-14页
·元数据的概念	第13页
·元数据的发展	第13-14页
·元数据的作用	第14页
·MARC元数据	第14-17页
·MARC元数据的产生与发展	第14-15页
·我国机读目录的建设及使用现状	第15页
·MARC元数据的地位、作用	第15页
·MARC的格式结构	第15-16页
·MARC格式的优点	第16-17页
第三章 WEB书目信息自动搜集的关键技术	第17-30页
·主题爬虫	第17-20页
·主题爬虫概述	第17页
·主题确定模块	第17-18页
·种子初始化模块	第18页
·主题相关度分析模块	第18-20页
·网页净化	第20-23页
·网页噪音分类	第20-21页
·DOM(文档对象模型)	第21页
·网页噪音净化方法	第21-22页
·净化算法描述	第22-23页
·Web信息抽取	第23-28页
·信息抽取的定义、任务和研究对象	第23-24页
·现有的Web信息抽取技术	第24-27页
·基于主题知识库的Web信息抽取技术	第27-28页
·提高书目信息准确性、完整性的策略	第28-29页
·本章小结	第29-30页
第四章书目信息自动搜集原型系统的设计	第30-35页
·系统的框架	第30-31页
·系统设计	第31-32页
·系统界面	第32-34页
·本章小结	第34-35页
第五章基于Web的书目信息服务的相关实现	第35-44页
·MARC自动生成服务	第35-37页
·设计实体类模型	第35页
·技术要点与实现	第35页
·定义MARC类、Field类和Subfield类	第35-37页
·MARC的生成	第37页
·基于Solr的全文检索服务	第37-42页
·Solr引擎的简介	第37页
·Solr引擎的构建	第37-42页
·Web端的应用架构	第42页
·本章小结	第42-44页
第六章总结和展望	第44-45页
·本文的工作总结	第44页
·后续工作和研究展望	第44-45页
参考文献	第45-47页
致谢	第47页