维、哈、柯文搜索引擎中的自动分类技术研究

摘要	第1-4页
Abstract	第4-8页
第一章引言	第8-14页
·搜索引擎简介	第8页
·搜索引擎技术概况	第8-12页
·搜索引擎的分类	第8-9页
·搜索引擎的发展方向	第9-12页
·维、哈、柯搜索引擎的研究背景及现状	第12页
·课题来源及内容	第12-13页
·本文的工作	第13页
·论文组织	第13-14页
第二章网页自动分类技术研究	第14-27页
·自动分类技术概述	第14-15页
·向量空间模型	第15-16页
·自动分类算法的类型	第16-17页
·网页分类的一般过程	第17-19页
·训练过程	第18-19页
·分类过程	第19页
·特征选择	第19-21页
·特征选择的任务	第19-20页
·常见特征选择方法	第20-21页
·常用分类算法	第21-25页
·K-近邻(KNN)	第21-23页
·朴素贝叶斯Naive Bayes 算法	第23-24页
·支持向量机SVM	第24-25页
·文本分类的评价指标	第25-27页
第三章维文网页自动分类系统实验	第27-43页
·训练及测试网页搜集	第27-28页
·网页预处理	第28-32页
·网页净化	第28-29页
·代码转换（标准化）	第29-31页
·分词	第31-32页
·词干切分	第32页
·特征词权重算法	第32-36页
·传统TF*IDF 公式的不足	第33页
·改进后的权重算法TFIDF-DI	第33-35页
·权重计算的算法流程	第35-36页
·训练过程	第36-37页
·分类过程	第37-39页
·分类算法描述	第37-39页
·分类测试	第39页
·分类结果评测	第39-41页
·实验结果分析	第41-43页
第四章具有自动分类功能的维哈柯文搜索引擎	第43-55页
·自动分类的应用情况	第43-44页
·维、哈、柯多文种搜索引擎简介	第44-45页
·本文中搜索引擎的总体设计	第45-47页
·多文种搜索引擎的关键技术	第47-55页
·网页搜集	第47-48页
·网页分析	第48-50页
·对网页进行分类	第50页
·建立倒排索引	第50-53页
·查询服务	第53-55页
第五章总结与展望	第55-56页
参考文献	第56-59页
在读期间发表论文	第59-60页
致谢	第60页