面向互联网的构件获取技术研究

摘要	第1-6页
ABSTRACT	第6-10页
第1章绪论	第10-14页
·课题背景	第10-11页
·构件获取技术研究现状	第11-12页
·本文的主要研究内容	第12-14页
第2章构件描述模型	第14-20页
·构件模型概述	第14-15页
·XML概述	第15-16页
·构件描述模型	第16-18页
·本章小结	第18-20页
第3章主题网页的爬行策略	第20-28页
·问题描述	第20页
·爬行策略研究现状	第20-23页
·基于内容的页面相关度算法	第20-22页
·基于超链接的爬行策略	第22-23页
·基于page rank和shark search的综合爬行策略	第23-25页
·综合爬行策略思想	第23-24页
·综合爬行算法	第24-25页
·实验与分析	第25-26页
·本章小结	第26-28页
第4章主题网页识别	第28-40页
·构件资源概述	第28-29页
·问题描述	第29-30页
·主题网页识别的研究现状	第30-33页
·文本分类算法	第30-32页
·基于网页文本的主题网页识别算法	第32-33页
·主题网页识别算法	第33-36页
·网页预处理	第33-34页
·网页文本分类器	第34页
·virtual-text、title和keyword分类器	第34-35页
·加权协调各分类器	第35-36页
·实验及分析	第36-38页
·网页分类算法的评价指标	第36-37页
·实验数据	第37-38页
·实验结果	第38页
·本章小结	第38-40页
第5章 Web页面结构分析	第40-49页
·问题描述	第40页
·HTML简介	第40-41页
·DOM简介	第41-42页
·Web页面结构常用分析方法	第42-43页
·基于相关度和视觉特征的页面分块算法	第43-46页
·实验与分析	第46-48页
·本章小结	第48-49页
第6章构件信息抽取	第49-61页
·问题描述	第49-50页
·网页信息抽取研究现状	第50-51页
·基于约束和模糊聚类的构件信息抽取算法	第51-57页
·页面块的约束关系	第52-53页
·改进传递闭包法	第53-55页
·传递闭包法模糊聚类算法	第55-56页
·实体与构件属性项的匹配算法	第56页
·信息抽取的评价指标	第56-57页
·实验与分析	第57-60页
·本章小结	第60-61页
第7章总结与展望	第61-64页
·工作总结	第61-62页
·工作展望	第62-64页
参考文献	第64-69页
攻读学位期间公开发表论文	第69-70页
致谢	第70-71页