首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

维、哈、柯文搜索引擎中的自动分类技术研究

摘要第1-4页
Abstract第4-8页
第一章 引言第8-14页
   ·搜索引擎简介第8页
   ·搜索引擎技术概况第8-12页
     ·搜索引擎的分类第8-9页
     ·搜索引擎的发展方向第9-12页
   ·维、哈、柯搜索引擎的研究背景及现状第12页
   ·课题来源及内容第12-13页
   ·本文的工作第13页
   ·论文组织第13-14页
第二章 网页自动分类技术研究第14-27页
   ·自动分类技术概述第14-15页
   ·向量空间模型第15-16页
   ·自动分类算法的类型第16-17页
   ·网页分类的一般过程第17-19页
     ·训练过程第18-19页
     ·分类过程第19页
   ·特征选择第19-21页
     ·特征选择的任务第19-20页
     ·常见特征选择方法第20-21页
   ·常用分类算法第21-25页
     ·K-近邻(KNN)第21-23页
     ·朴素贝叶斯Naive Bayes 算法第23-24页
     ·支持向量机SVM第24-25页
   ·文本分类的评价指标第25-27页
第三章 维文网页自动分类系统实验第27-43页
   ·训练及测试网页搜集第27-28页
   ·网页预处理第28-32页
     ·网页净化第28-29页
     ·代码转换(标准化)第29-31页
     ·分词第31-32页
     ·词干切分第32页
   ·特征词权重算法第32-36页
     ·传统TF*IDF 公式的不足第33页
     ·改进后的权重算法TFIDF-DI第33-35页
     ·权重计算的算法流程第35-36页
   ·训练过程第36-37页
   ·分类过程第37-39页
     ·分类算法描述第37-39页
     ·分类测试第39页
   ·分类结果评测第39-41页
   ·实验结果分析第41-43页
第四章 具有自动分类功能的维哈柯文搜索引擎第43-55页
   ·自动分类的应用情况第43-44页
   ·维、哈、柯多文种搜索引擎简介第44-45页
   ·本文中搜索引擎的总体设计第45-47页
   ·多文种搜索引擎的关键技术第47-55页
     ·网页搜集第47-48页
     ·网页分析第48-50页
     ·对网页进行分类第50页
     ·建立倒排索引第50-53页
     ·查询服务第53-55页
第五章 总结与展望第55-56页
参考文献第56-59页
在读期间发表论文第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:维吾尔语的N-gram语言模型及其平滑算法研究
下一篇:面向中亚的多文种Linux操作系统本地化技术研究