数据挖掘在Internet信息检索中的应用

摘要	第1-4页
Abstract	第4-9页
第一章绪论	第9-24页
·INTERNET 信息检索	第9-10页
·搜索引擎研究现状	第10-16页
·搜索引擎工作原理	第10-12页
·目前搜索引擎所使用的关键技术	第12-15页
·目前中文搜索引擎的一些不足	第15-16页
·WEB 挖掘技术	第16-22页
·自动分词	第17-18页
·自动文摘	第18页
·信息过滤	第18-19页
·自动网页分类	第19页
·网页聚类	第19-22页
·本文的工作	第22-24页
第二章全二分快速分词算法	第24-34页
·分词词典	第24-27页
·汉字编码体系	第24页
·汉语词的特点	第24-25页
·分词词典	第25-27页
·分词词典维护	第27-29页
·构造首字Hash 表	第27-28页
·构造词索引表	第28-29页
·全二分快速分词算法	第29-32页
·算法分析	第32-34页
第三章特定领域的WWW 信息采集	第34-43页
·WEB 结构概述	第34-36页
·物理结构	第34-35页
·逻辑结构	第35-36页
·用户兴趣模型	第36-40页
·用户兴趣模型	第36-38页
·网页相似度	第38-40页
·特定领域的网页采集	第40-43页
·网页相似度预测	第40-41页
·采集控制策略	第41-43页
第四章基于结构信息的自动网页分类	第43-51页
·网页结构信息	第43-44页
·网页分类器	第44-48页
·网页分类树	第45页
·构造网页分类器	第45-48页
·自动网页分类	第48-51页
·网页相似度阈值	第48-49页
·自动网页分类	第49-51页
第五章网页聚类	第51-59页
·网页N-词重合度	第51-53页
·网页聚类表	第53-55页
·快速网页聚类	第55-59页
·一次聚类	第56-57页
·二次聚类	第57-59页
第六章系统实现	第59-67页
·系统概述	第59-62页
·WIISS 系统的特点	第59-60页
·WIISS 系统的体系结构	第60-62页
·系统实现	第62-67页
·“机器人”采集子系统	第62-63页
·网页处理子系统	第63-64页
·用户查询子系统	第64-65页
·难点处理	第65-67页
第七章总结与展望	第67-69页
·总结	第67-68页
·展望	第68-69页
参考文献	第69-73页
发表文章目录	第73页
作者简历	第73页
攻读研究生期间主要的研究开发工作	第73-74页
致谢	第74页