一个基于WEB的信息组织与检索模型（WIORS）研究

中文摘要	第1-5页
英文摘要	第5-9页
0 引言	第9-13页
0．1 选题的原因和意义	第9-10页
0．2 研究现状	第10-11页
0．3 论文的研究内容、研究方法和创新之处	第11-13页
0．3．1 研究内容	第11页
0．3．2 研究方法	第11-12页
0．3．3 本文的创新	第12-13页
1 网络信息组织与检索概述	第13-20页
1．1 中国网络资源概况	第13-16页
1．2 信息组织的功能	第16-17页
1．3 网络环境下的信息组织与检索	第17-20页
1．3．1 网络信息资源的特点	第17-18页
1．3．2 网络信息组织与检索方法的现状分析	第18-20页
2 网络环境下信息检索的模式研究	第20-28页
2．1 引言	第20页
2．2 网络信息资源的组织模式	第20-21页
2．3 主题和索引:两种不同模式的信息组织结构	第21-23页
2．4 搜索引擎技术	第23-26页
2．4．1 搜索引擎的分类	第23-24页
2．4．2 搜索引擎原理	第24-26页
2．5 搜索引擎模式在信息资源组织中的作用	第26-28页
3 搜索引擎的缺陷和看不见的网站	第28-33页
3．1 搜索引擎出现的问题	第28-31页
3．1．1 搜索引擎的覆盖率问题	第28-29页
3．1．2 搜索引擎的更新率问题	第29-30页
3．1．3 搜索引擎的排序和网页垃圾问题	第30-31页
3．2 看不见的网站	第31-33页
3．2．1 什么是“看不见”的网站	第31页
3．2．2 看不见的网站的形成	第31-33页
4 解决问题的尝试—WIORS系统模型	第33-41页
4．1 建立 WIORS模型的理论基础	第33-35页
4．1．1 网络信息资源的本质属性	第33-34页
4．1．2 模型的理论和数据依据	第34-35页
4．2 WIORS模型总体概述	第35-36页
4．2．1 WIORS模型的目标	第35页
4．2．2 WIORS模型的主要功能	第35-36页
4．3 WIORS模型的系统架构和主要模块	第36-41页
4．3．1 信息抓取子系统	第37-39页
4．3．2 全文检索子系统	第39-40页
4．3．3 信息表示子系统	第40-41页
5 WIORS模型中的关键技术实现	第41-56页
5．1 信息源的过滤技术	第41-44页
5．1．1 划分信息源	第41页
5．1．2 分析信息源	第41-43页
5．1．3 Web信息抽取	第43-44页
5．2 利用 Lucene实现的全文检索	第44-49页
5．2．1 Lucene简介	第44-45页
5．2．2 Lucene的组成结构	第45-46页
5．2．3 Lueene倒排索引原理	第46-49页
5．3 基于语料统计实现中文自动分词算法	第49-53页
5．3．1 分词的必要性	第49-50页
5．3．2 ICTCLAS系统与Java调用	第50-51页
5．3．3 在 Lucene中调用 ICTCLAS	第51-53页
5．4 基于 RSS的推的技术	第53-56页
5．4．1 RSS简介	第53-54页
5．4．2 将信息推给客户端	第54-56页
6 模型应用:对校园招聘信息资源进行组织	第56-67页
6．1 引言	第56页
6．2 应用系统的环境配置	第56-57页
6．2．1 硬件环境	第56-57页
6．2．2 软件环境	第57页
6．3 信息源的选择	第57-59页
6．4 信息源的处理	第59-65页
6．4．1 信息源的配置	第59-62页
6．4．2 对信息进行抓取和建立索引	第62-63页
6．4．3 对信息源的过滤	第63-65页
6．5 构建校园招聘信息门户	第65-66页
6．6 应用结论	第66-67页
7 总结	第67-68页
参考文献	第68-71页
后记	第71页