摘要 | 第1-6页 |
Abstract | 第6-12页 |
第一章 前言 | 第12-23页 |
·数据库中知识发现(KDD)和数据挖掘 | 第12-14页 |
·KDD | 第12-13页 |
·数据挖掘 | 第13-14页 |
·文本分类 | 第14-18页 |
·文本分类产生背景和研究意义 | 第14-15页 |
·文本分类问题描述 | 第15-16页 |
·国内外研究状况 | 第16-18页 |
·信息过滤 | 第18-21页 |
·信息过滤产生背景和研究现状 | 第18-19页 |
·信息检索与信息过滤 | 第19-20页 |
·信息过滤研究意义 | 第20-21页 |
·本文的研究工作和内容安排 | 第21-23页 |
第二章 信息过滤中关键技术和模型 | 第23-37页 |
·文本分类技术 | 第23-29页 |
·文本分类模块 | 第23-25页 |
·分类模型 | 第25-28页 |
·性能指标 | 第28-29页 |
·基于内容信息过滤系统构成 | 第29页 |
·信息过滤模型 | 第29-31页 |
·布尔模型(Boolean Model) | 第29页 |
·向量空间模型(Vector Space Model) | 第29-30页 |
·潜在语义索引模型(Latent Semantic Indexing Model) | 第30页 |
·神经网络模型(Neural Network Model) | 第30-31页 |
·信息过滤的主要方法 | 第31-35页 |
·统计方法 | 第31-34页 |
·逻辑方法 | 第34-35页 |
·拟物方法 | 第35页 |
·本章小结 | 第35-37页 |
第三章 文本特征提取和选择 | 第37-47页 |
·特征提取应用背景 | 第37页 |
·特征提取 | 第37-40页 |
·文本特征描述 | 第38页 |
·特征提取粒度的分析 | 第38-40页 |
·传统的特征选择方法 | 第40-42页 |
·词频方法 | 第40页 |
·文档频词方法 | 第40-41页 |
·期望交叉熵方法 | 第41页 |
·互信息方法 | 第41页 |
·信息增益方法 | 第41-42页 |
·x~2统计量方法 | 第42页 |
·文本证据权方法 | 第42页 |
·特征选择方法性能分析 | 第42-44页 |
·评价标准 | 第42页 |
·语料 | 第42-43页 |
·实验环境 | 第43页 |
·实验与分析 | 第43-44页 |
·多特征选择(Multiple Feature Selection) | 第44-46页 |
·多特征选择算法 | 第44-45页 |
·实验结果和分析 | 第45-46页 |
·本章小结 | 第46-47页 |
第四章 信息过滤系统模型设计 | 第47-55页 |
·应用背景 | 第47页 |
·基于向量空间模型信息过滤系统设计 | 第47-48页 |
·训练算法 | 第48-51页 |
·特征项的提取 | 第48-49页 |
·训练算法流程 | 第49页 |
·初始模板的建立 | 第49-50页 |
·初始阈值的设定 | 第50-51页 |
·信息过滤的自适应算法 | 第51-52页 |
·自适应算法 | 第51页 |
·阈值的调整 | 第51页 |
·模板的修改 | 第51-52页 |
·信息过滤评价标准 | 第52-53页 |
·实验结果与分析 | 第53-54页 |
·本章小结 | 第54-55页 |
第五章 结束语 | 第55-57页 |
·总结 | 第55-56页 |
·下一步工作 | 第56-57页 |
参考文献 | 第57-61页 |
在校期间发表的论文 | 第61页 |