Web信息精确获取技术研究

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-18页
·引言	第10-11页
·Web信息获取技术的研究现状	第11-12页
·Web信息资源特点	第12-14页
·Web信息系统的特点	第12-13页
·Web的数据特征	第13-14页
·Web信息资源的获取技术	第14-16页
·搜索引擎技术	第14页
·智能代理技术	第14-15页
·装配器(Wrapper)及信息抽取技术	第15页
·Web信息资源的获取方法及存在的问题	第15-16页
·Web信息资源获取技术的发展方向	第16页
·本文的内容和结构	第16-18页
第二章 Web信息精确获取技术的综述	第18-41页
·基于检索内容的四种检索模型	第18-20页
·布尔逻辑模型	第18-19页
·模糊逻辑模型	第19页
·概率统计模型	第19页
·向量空间模型	第19-20页
·搜索引擎技术	第20-24页
·搜索引擎的工作原理及基本组成	第21-24页
·搜索引擎的评价标准	第24页
·网络信息的分析与获取	第24-28页
·Web文本资源的数据模型	第24-25页
·文本超链接中信息资源的提取	第25-26页
·Web文档发现策略	第26-28页
·Web信息的内容、结构与装配器	第28页
·网页自动分类技术	第28-33页
·文档的目标表示	第29-30页
·文档评判	第30-32页
·分类的实现	第32-33页
·正例集与反例集	第33页
·Web超链的分析算法	第33-41页
·链接分析算法	第34-36页
·Google和PageRank算法	第36-37页
·HITS算法	第37-39页
·贝叶斯算法	第39-41页
第三章 Web信息精确获取技术解决方案	第41-54页
·MAS的系统结构	第42-45页
·系统模块的主要功能	第45-50页
·搜索引擎模块功能	第45-46页
·信息抽取及预处理模块功能	第46-47页
·自动分类引擎的功能	第47页
·模式匹配模块	第47-49页
·文本信息资源库及接口	第49-50页
·系统的用户接口	第50页
·系统主要的数据结构	第50-54页
·文本信息资源库数据结构	第50-51页
·知识库数据结构	第51-52页
·分类引擎程序界面	第52-54页
第四章信息精确获取算法的实现	第54-75页
·用户样本获取及知识库的形成与表示	第54-58页
·规则的直观表示	第55-57页
·信息抽取	第57-58页
·Robot搜索算法及设计	第58-61页
·改进的Robot搜索策略	第60-61页
·多线程Robot的实现	第61页
·网页自动分类的算法	第61-75页
·学习模块	第62-67页
·自动分类模块	第67-68页
·人工干预的机器学习分类法	第68-69页
·分类引擎的数据格式	第69-73页
·文本分类实验结果	第73-75页
第五章总结及进一步工作	第75-77页
·全文总结	第75-76页
·进一步的工作	第76-77页
致谢	第77-78页
附录1 攻读硕士期间发表的论文	第78-79页
参考文献	第79-81页