| 摘要 | 第1-6页 |
| Abstract | 第6-12页 |
| 第一章 前言 | 第12-23页 |
| ·数据库中知识发现(KDD)和数据挖掘 | 第12-14页 |
| ·KDD | 第12-13页 |
| ·数据挖掘 | 第13-14页 |
| ·文本分类 | 第14-18页 |
| ·文本分类产生背景和研究意义 | 第14-15页 |
| ·文本分类问题描述 | 第15-16页 |
| ·国内外研究状况 | 第16-18页 |
| ·信息过滤 | 第18-21页 |
| ·信息过滤产生背景和研究现状 | 第18-19页 |
| ·信息检索与信息过滤 | 第19-20页 |
| ·信息过滤研究意义 | 第20-21页 |
| ·本文的研究工作和内容安排 | 第21-23页 |
| 第二章 信息过滤中关键技术和模型 | 第23-37页 |
| ·文本分类技术 | 第23-29页 |
| ·文本分类模块 | 第23-25页 |
| ·分类模型 | 第25-28页 |
| ·性能指标 | 第28-29页 |
| ·基于内容信息过滤系统构成 | 第29页 |
| ·信息过滤模型 | 第29-31页 |
| ·布尔模型(Boolean Model) | 第29页 |
| ·向量空间模型(Vector Space Model) | 第29-30页 |
| ·潜在语义索引模型(Latent Semantic Indexing Model) | 第30页 |
| ·神经网络模型(Neural Network Model) | 第30-31页 |
| ·信息过滤的主要方法 | 第31-35页 |
| ·统计方法 | 第31-34页 |
| ·逻辑方法 | 第34-35页 |
| ·拟物方法 | 第35页 |
| ·本章小结 | 第35-37页 |
| 第三章 文本特征提取和选择 | 第37-47页 |
| ·特征提取应用背景 | 第37页 |
| ·特征提取 | 第37-40页 |
| ·文本特征描述 | 第38页 |
| ·特征提取粒度的分析 | 第38-40页 |
| ·传统的特征选择方法 | 第40-42页 |
| ·词频方法 | 第40页 |
| ·文档频词方法 | 第40-41页 |
| ·期望交叉熵方法 | 第41页 |
| ·互信息方法 | 第41页 |
| ·信息增益方法 | 第41-42页 |
| ·x~2统计量方法 | 第42页 |
| ·文本证据权方法 | 第42页 |
| ·特征选择方法性能分析 | 第42-44页 |
| ·评价标准 | 第42页 |
| ·语料 | 第42-43页 |
| ·实验环境 | 第43页 |
| ·实验与分析 | 第43-44页 |
| ·多特征选择(Multiple Feature Selection) | 第44-46页 |
| ·多特征选择算法 | 第44-45页 |
| ·实验结果和分析 | 第45-46页 |
| ·本章小结 | 第46-47页 |
| 第四章 信息过滤系统模型设计 | 第47-55页 |
| ·应用背景 | 第47页 |
| ·基于向量空间模型信息过滤系统设计 | 第47-48页 |
| ·训练算法 | 第48-51页 |
| ·特征项的提取 | 第48-49页 |
| ·训练算法流程 | 第49页 |
| ·初始模板的建立 | 第49-50页 |
| ·初始阈值的设定 | 第50-51页 |
| ·信息过滤的自适应算法 | 第51-52页 |
| ·自适应算法 | 第51页 |
| ·阈值的调整 | 第51页 |
| ·模板的修改 | 第51-52页 |
| ·信息过滤评价标准 | 第52-53页 |
| ·实验结果与分析 | 第53-54页 |
| ·本章小结 | 第54-55页 |
| 第五章 结束语 | 第55-57页 |
| ·总结 | 第55-56页 |
| ·下一步工作 | 第56-57页 |
| 参考文献 | 第57-61页 |
| 在校期间发表的论文 | 第61页 |