首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

智能搜索中中文网页分类和聚类的初步研究

摘要第1-7页
Abstract第7-12页
第1章 引言第12-20页
   ·研究目的、意义及研究背景第12-15页
   ·网页自动分类第15-16页
   ·搜索引擎第16-18页
   ·本论文的主要工作第18页
   ·论文的结构第18-20页
第2章 数码相机专题网页的统计分析第20-26页
   ·数码相机Web网页的特点第20-21页
     ·分布的时间特性第20页
     ·分布的空间特性第20-21页
   ·数码相机Web网页的特点第21-22页
   ·数码相机Web网页用字、用词统计第22-24页
   ·关键词在数码相机网页两个分类阶段的作用及词表的建立第24-25页
   ·本章小结第25-26页
第3章 网页自动分类技术概述第26-43页
   ·中文网页的预处理第26-28页
   ·分类模型第28-31页
     ·布尔模型(Boolean Model)第28-29页
     ·向量空间模型(Vector Space Model)第29-30页
     ·概率模型(Probabilistic Model)第30页
     ·语言模型(Language Model)第30-31页
   ·特征选择及权值计算第31-35页
     ·文档频率(Document Frequency,DF)第31-32页
     ·信息增益(Information Gain,IG)第32页
     ·交叉熵(Cross Entropy,CE)第32页
     ·互信息(Mutual Information,MI)第32-33页
     ·χ~2统计量(CHI)第33-34页
     ·文本证据权(Weight of Evidence Text,WET)第34页
     ·几率比(Odds Ratio,OR)第34-35页
     ·特征强度(Term Strength,TS)第35页
   ·分类器的设计第35-41页
     ·基于类中心的最小距离分类器第36页
     ·K近邻分类器(K-Nearest)第36-37页
     ·贝叶斯分类器(Bayes)第37-39页
     ·支持向量机分类器(SVM)第39-41页
   ·评价方法第41-42页
   ·本章小结第42-43页
第4章 中文数码相机网页的过滤及实验分析第43-61页
   ·实验的总体介绍第43-45页
     ·实验数据的采集第43-44页
     ·面向数码相机Web网页过滤系统的构成第44-45页
   ·实验数据的预处理第45-46页
   ·最小距离分类器与各种特征选择方法结合的网页过滤比较第46-54页
     ·直接使用TF第47-48页
     ·文档频率(DF)第48页
     ·信息增益(IG)第48-49页
     ·交叉熵(CE)第49-50页
     ·互信息(MI)第50-51页
     ·χ~2统计量(CHI)第51页
     ·文本证据权(WET)第51-52页
     ·几率比(OR)第52页
     ·各种特征选择方法的比较第52-53页
     ·对几率比和互信息两种特征选择方法的改进第53-54页
   ·贝叶斯分类器和支持向量机的分类实验第54-59页
     ·朴素贝叶斯(Naive Bayes)分类器第55-58页
     ·支持向量机(Support Vector Machine)分类器第58-59页
     ·三种分类器的性能比较第59页
   ·本章小结第59-61页
第5章 中文网页的自适应分类第61-73页
   ·自适应分类模型第61-64页
     ·检索字扩展模型——Rocchio算法第61-62页
     ·自适应分类模型——Improved Rocchio算法第62-64页
   ·自适应分类的实现第64-66页
   ·分类实验及结果第66-71页
     ·实验数据及预处理第66-67页
     ·分类器及评价方法第67页
     ·实验结果第67-71页
   ·本章小结第71-73页
第6章 基于密度的中文网页聚类第73-82页
   ·网页聚类所面临的问题第73-76页
     ·聚类算法第73-76页
     ·特征的选择与提取第76页
   ·Web文档聚类的实现方法第76-78页
   ·Web文档聚类的实验结果第78-81页
   ·本章小结第81-82页
结论及工作展望第82-85页
 1.本论文主要工作包括以下几个方面第82-83页
 2.对未来工作的展望第83-85页
参考文献第85-88页
攻读硕士学位期间发表的论文和取得的科研成果第88-89页
致谢第89页

论文共89页,点击 下载论文
上一篇:基于时态约束的关联规则挖掘方法研究
下一篇:利用赖氨酸和赖氨酸肽修饰和组装金纳米粒子