面向教育的多媒体主题搜索器设计与实现

摘要	第1-8页
ABSTRACT	第8-10页
第一章绪论	第10-19页
·面向教育的多媒体主题搜索器的研究背景	第10-15页
·主题搜索器的研究现状	第15-17页
·CORA	第15-16页
·Context Graphs Focused Crawler	第16页
·IBM Focused Crawler	第16页
·InfoSpider	第16-17页
·本文的主要工作	第17页
·研究思路	第17页
·主要研究内容和创新点	第17页
·本文的组织结构	第17-19页
第二章主题搜索器的体系结构设计	第19-28页
·主题搜索器在主题搜索引擎中的位置	第19-22页
·主题页面的分布特征	第22-24页
·中心页面（Hub）特征	第22页
·主题关联（Linkage/Sibling Locality）特征	第22-23页
·主题聚集（Cluster）特征	第23页
·隧道（Tunnel）特征	第23-24页
·主题搜索器的体系结构	第24-27页
·控制模块	第25页
·爬行模块	第25-26页
·存储模块	第26-27页
·本章小结	第27-28页
第三章页面信息预处理	第28-42页
·超文本传输协议（HTTP）	第28-31页
·URL 介绍	第28-29页
·HTTP 协议与多线程	第29-31页
·页面解析器的设计与实现	第31-37页
·解析器提取的页面信息	第31-33页
·超链接的分析与处理	第33-34页
·Swing 包中使用的核心类	第34-35页
·页面解析器的实现	第35-37页
·中英文分词	第37-40页
·中文分词	第37-40页
·英文分词及中英文翻译	第40页
·本章小结	第40-42页
第四章主题搜索器的搜索算法	第42-53页
·主题搜索算法的研究现状	第42-46页
·基于内容的搜索算法	第42-43页
·基于链接结构的搜索算法	第43-45页
·基于先验知识的搜索算法	第45-46页
·具有增量学习的搜索算法	第46-48页
·改进的基于增量学习的搜索算法	第48-52页
·标准Fish-Search 算法	第48-49页
·改进的Fish-Search 算法	第49-52页
·本章小结	第52-53页
第五章主题搜索器的系统实现	第53-64页
·主题搜索器搜集的多媒体文件格式	第53页
·数据库设计	第53-57页
·主题搜索器的运行流程	第57-59页
·实验结果及分析	第59-63页
·实验环境	第59页
·参数选择和评价指标	第59页
·实验结果分析	第59-63页
·本章小结	第63-64页
第六章总结与展望	第64-66页
·本文的工作总结	第64页
·下一步的研究工作	第64-66页
参考文献	第66-71页
附录一主题搜索器各模块的核心类	第71-74页
附录二 HTML 解析器能够识别标签清单	第74-76页
附录三 HTML 解析器能够识别的属性清单	第76-78页
致谢	第78-79页
攻读学位期间发表的学术论文及参加项目	第79页