首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于启发式规则和文本分类的信息过滤技术

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-12页
1 引言第12-17页
   ·研究背景与意义第12-13页
   ·文本信息过滤研究的现状第13-15页
   ·本文研究的内容第15-16页
   ·论文组织第16-17页
2 文本信息过滤概述第17-28页
   ·信息过滤的概念第17-18页
   ·信息过滤系统的分类第18-20页
   ·信息过滤和其他信息处理技术第20-22页
     ·信息过滤与信息检索第20-21页
     ·信息过滤与分类、聚类第21页
     ·信息过滤和信息提取第21-22页
   ·文本信息过滤模型第22-26页
     ·布尔模型第22-23页
     ·概率模型第23页
     ·向量空间模型(Vector Space Model,VSM)第23-25页
     ·潜在语义索引模型第25-26页
   ·信息过滤模型的评价指标第26页
   ·文本信息过滤技术的应用第26-28页
3 信息过滤相关技术第28-45页
   ·信息过滤预处理过程第28页
   ·中文分词技术第28-32页
     ·基于字符串匹配的分词技术第29-30页
     ·基于理解的分词技术第30页
     ·基于统计的分词技术第30-31页
     ·去除停用词第31页
     ·分词中的技术难题第31-32页
   ·特征选择技术第32-37页
     ·特征频度(TermFrequency,TF)第33页
     ·文档频度(Document Frequency,DF)第33-34页
     ·反比文档频数权重评价方法(TermFrequencyInverse Document Frequency,TFIDF)第34页
     ·互信息(Mutual Information,MI)第34-35页
     ·χ~2统计量(Chi—square,CHI)第35页
     ·期望交叉熵(Expected Cross Entropy,CE)第35-36页
     ·信息增益(Information Gain,IG)第36页
     ·文本证据权(Weight of Evidence for Zext,WET)第36-37页
     ·几率比(Odds Ratio,OR)第37页
   ·文本的表示第37-39页
     ·向量空间模型(Vector Space Model,VSM)第38-39页
   ·文本分类方法第39-45页
     ·Naive Bayes方法第41-42页
     ·K—近邻算法(KNN)第42-43页
     ·支持向量机(SVM)第43-44页
     ·神经网络第44页
     ·决策树(Decision Tree)第44-45页
4 基于判别式Naive Bayes的文本分类方法第45-53页
   ·贝叶斯文本分类方法第45-46页
   ·贝叶斯文本分类算法的两种模型第46-48页
     ·多变量贝努里事件模型第46-47页
     ·多项式事件模型第47-48页
   ·二分类NaiveBayes文本分类算法第48-49页
   ·判别式Na(?)ve Bayes分类算法第49-51页
   ·二分类判别式Na(?)ve Bayes文本分类算法第51-53页
5 基于启发式规则与文本分类的多级信息过滤模型第53-63页
   ·基于启发式规则的过滤方法的现状第53-54页
   ·基于统计和基于规则的自动文本分类方法的分析第54-55页
   ·基于启发式规则与文本分类相结合的多级信息过滤模型第55-59页
     ·规则库的设计第55-56页
     ·规则的设定第56页
     ·规则表达式第56-57页
     ·基于启发式规则与判别式NB文本分类相结合的信息过滤系统第57-59页
   ·实验结果第59-63页
6 结束语第63-64页
参考文献第64-67页
作者简历第67-69页
学位论文数据集第69页

论文共69页,点击 下载论文
上一篇:添加剂(DTBP)改善均质充量压燃(HCCI)着火的数值模拟与试验研究
下一篇:适足住房权研究