具有自动分类功能的主题搜索引擎的研究
摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
第一章 引言 | 第7-11页 |
·INTERNET发展现状 | 第7-8页 |
·Internet的发展历程 | 第7页 |
·World Wide Web(WWW) | 第7-8页 |
·Internet的信息分布 | 第8页 |
·搜索引擎简介 | 第8-9页 |
·面向主题的搜索引擎 | 第9-10页 |
·小结 | 第10-11页 |
第二章 搜索引擎的构架及其分类技术的应用 | 第11-21页 |
·概述 | 第11页 |
·搜索引擎的构架 | 第11-16页 |
·三种类型的搜索引擎 | 第11-12页 |
·基于Robot的WWW搜索引擎的一般结构 | 第12-14页 |
·WWW搜索引擎的Robot技术 | 第14-16页 |
·自动分类在搜索引擎中的应用 | 第16-21页 |
·自动分类的种类 | 第16页 |
·自动分类的作用 | 第16-17页 |
·自动分类的实现方法 | 第17-19页 |
·当今研究应用现状 | 第19-21页 |
第三章 主题搜索方法 | 第21-27页 |
·导向词 | 第21-22页 |
·导向词及权值的配置 | 第21-22页 |
·根据导向词及权值改变搜索顺序 | 第22页 |
·网页评分 | 第22-23页 |
·引用计数(Hit Number) | 第22页 |
·网页评分 | 第22-23页 |
·权威网页和中心网页 | 第23-26页 |
·什么是权威网页和中心网页 | 第23-24页 |
·发掘权威网页的困难 | 第24-25页 |
·权威网页和中心网页的计算公式 | 第25页 |
·计算权威网页和中心网页的算法 | 第25-26页 |
·超链描述文本分析 | 第26-27页 |
第四章 自动分类实验及实验结果评价 | 第27-35页 |
·实验任务 | 第27页 |
·评估方法 | 第27-28页 |
·关键技术 | 第28-32页 |
·文本的表示 | 第28页 |
·特征项的抽取 | 第28-29页 |
·训练方法与分类算法 | 第29-31页 |
·阈值的确定 | 第31-32页 |
·系统的结构框架 | 第32-33页 |
·测试数据 | 第33页 |
·实验结果及分析 | 第33-35页 |
第五章 系统的设计和实现 | 第35-45页 |
·系统开发环境 | 第35页 |
·系统功能 | 第35-36页 |
·系统结构概述 | 第36-37页 |
·数据库结构的设计 | 第37-38页 |
·Robot的设计 | 第38-41页 |
·结构描述 | 第38-39页 |
·Robot主要的数据结构描述 | 第39-41页 |
·导向词的处理 | 第41-42页 |
·导向词的存贮 | 第41页 |
·导向词的加载分析 | 第41-42页 |
·用户查询接口界面的实现 | 第42-45页 |
第六章 总结展望 | 第45-47页 |
致谢 | 第47-50页 |