自动主题搜索的应用研究
摘要 | 第1-6页 |
ABSTRACT | 第6-8页 |
目录 | 第8-12页 |
图目录 | 第12-14页 |
表目录 | 第14-15页 |
1 绪论 | 第15-23页 |
·WEB信息资源 | 第15-16页 |
·研究背景 | 第16-20页 |
·Web资源的飞速发展 | 第16-18页 |
·数字图书馆开始关注Web资源 | 第18-19页 |
·主题网站建设的出现 | 第19页 |
·Web数字资源建设的现状 | 第19-20页 |
·研究的目的与意义 | 第20页 |
·研究方法 | 第20-21页 |
·本论文的组织结构 | 第21-23页 |
2 主题搜索的研究进展 | 第23-42页 |
·主题搜索的相关概念 | 第23-28页 |
·搜索引擎 | 第23-26页 |
·Web数据挖掘与Web信息检索 | 第26-27页 |
·搜索引擎与Web信息检索 | 第27页 |
·主题搜索与主题爬行器 | 第27页 |
·主题搜索与主题搜索引擎 | 第27-28页 |
·主题搜索引擎与通用搜索引擎 | 第28页 |
·搜索引擎技术 | 第28-35页 |
·爬行器 | 第29-30页 |
·索引技术 | 第30-31页 |
·存储技术 | 第31-32页 |
·检索技术 | 第32页 |
·数据压缩技术 | 第32-33页 |
·爬行陷阱 | 第33页 |
·典型搜索引擎分析 | 第33-35页 |
·国外研究进展 | 第35-39页 |
·Collection Building | 第35-36页 |
·Focus Project | 第36-37页 |
·CiteSeer & eBusiSearch | 第37页 |
·CORA | 第37-38页 |
·Harvest & Greenstone | 第38页 |
·OASIS | 第38-39页 |
·国内研究进展 | 第39-41页 |
·STIP | 第39页 |
·网络智能服务系统I-KNOW | 第39-40页 |
·南京大学的IDGS | 第40页 |
·北大天网 | 第40-41页 |
·小结 | 第41-42页 |
3 主题搜索理论与WEB主题资源建设 | 第42-64页 |
·主题搜索的几种实现方式 | 第42-45页 |
·专家参与方式 | 第42-44页 |
·自动搜索方式 | 第44-45页 |
·WEB主题资源建设模式 | 第45-50页 |
·手工建设模式 | 第47-48页 |
·自动建设模式 | 第48-49页 |
·两种方式的比较 | 第49-50页 |
·自动主题搜索系统的实现方法 | 第50-51页 |
·自动主题搜索的相关技术 | 第51-58页 |
·自动主题识别技术 | 第51页 |
·主题资源的发现技术 | 第51-53页 |
·主题爬行器 | 第53-54页 |
·Web资源自动分类 | 第54-56页 |
·Web主题资源的浏览和检索 | 第56-58页 |
·WEB主题资源自动建设框架 | 第58-63页 |
·自动建设的数据库层 | 第58-60页 |
·自动建设框架系统层 | 第60-63页 |
·其它相关问题 | 第63页 |
·小结 | 第63-64页 |
4 新型的多模式字符串匹配算法研究 | 第64-80页 |
·字符串匹配技术概述 | 第64-65页 |
·多模式字符串匹配算法 | 第65-70页 |
·按单模式字符串匹配算法解决多模式的问题 | 第65-66页 |
·基于平衡二叉树的匹配算法 | 第66-67页 |
·基于DFSA的多模式字符串匹配 | 第67-70页 |
·基于DFSA的多模式字符串匹配的实现 | 第70-79页 |
·Quick Search算法 | 第71页 |
·字符串匹配 | 第71页 |
·算法描述 | 第71-74页 |
·算法的具体实现 | 第74-77页 |
·实验及评价 | 第77-79页 |
·小结 | 第79-80页 |
5 基于超链分析的WEB资源自动发现 | 第80-104页 |
·WEB超链分析的基本理论 | 第80-89页 |
·文献计量学与引文分析 | 第80-82页 |
·Web图及其表示 | 第82-87页 |
·Web超链分析 | 第87-88页 |
·Web超链分析的应用实例 | 第88-89页 |
·WEB超链分析的关键算法 | 第89-92页 |
·PageRank | 第90-91页 |
·HITS | 第91-92页 |
·基于超链分析的WEB资源自动发现技术 | 第92-98页 |
·Web超链的获取与存储 | 第93-94页 |
·M-HITS算法 | 第94-95页 |
·结果净化算法 | 第95-96页 |
·网页唯一标志符ID的生成 | 第96页 |
·实验及结果评价 | 第96-98页 |
·查找相关网页 | 第98-102页 |
·查找相关网页算法 | 第99-100页 |
·实验及结果评价 | 第100-102页 |
·小结 | 第102-104页 |
6 主题爬行器分析与设计 | 第104-130页 |
·通用爬行器模型 | 第104-106页 |
·主题爬行器模型 | 第106页 |
·主题爬行器的启发策略 | 第106-114页 |
·基于文字内容的启发策略 | 第107-111页 |
·基于Web图的启发策略 | 第111-112页 |
·结合网页文字和Web图的启发策略 | 第112-113页 |
·其它启发式策略 | 第113-114页 |
·合作式主题爬行器的设计与实现 | 第114-128页 |
·数据结构与对象设计 | 第116-120页 |
·搜索启发策略的选择 | 第120-123页 |
·数据存储与数据压缩 | 第123-125页 |
·网络陷阱的侦测与预防 | 第125-126页 |
·隧道技术的应用 | 第126页 |
·合作式主题爬行器的系统设计 | 第126-128页 |
·合作式主题爬行器的评价指标 | 第128页 |
·小结 | 第128-130页 |
7 结束语 | 第130-133页 |
·本论文的主要工作与创新点 | 第130-131页 |
·进一步的研究工作 | 第131-132页 |
·对自动主题搜索系统建设的建议 | 第132-133页 |
8 主题索引 | 第133-136页 |
9 参考文献 | 第136-144页 |
发表文章目录 | 第144-145页 |
参与的科研项目 | 第145-146页 |
致谢 | 第146页 |