文本过滤关键技术研究
第一章 文本过滤介绍 | 第1-22页 |
·文本过滤的背景 | 第7-8页 |
·文本过滤的研究现状 | 第8-11页 |
·文本过滤发展概述 | 第8-9页 |
·文本过滤的任务描述 | 第9-10页 |
·文本过滤系统的评价 | 第10-11页 |
·文本过滤与文本分类及文本检索的关系 | 第11页 |
·文本过滤的主要方法 | 第11-20页 |
·扩展的检索模型 | 第12-13页 |
·改造的分类模型 | 第13-16页 |
·典型的自适应过滤系统结构 | 第16-17页 |
·基于向量空间模型的自适应过滤系统结构 | 第17-20页 |
·本文的组织结构 | 第20-22页 |
第二章 文本过滤中的文本表示 | 第22-44页 |
·文本表示中的特征抽取 | 第22-28页 |
·特征项的抽取 | 第22-24页 |
·特征项的权重计算 | 第24-28页 |
·WordNet在英文过滤系统中的应用 | 第28-37页 |
·WordNet简介 | 第29页 |
·基于WordNet的语义消歧 | 第29-35页 |
·实验结果及分析 | 第35-37页 |
·HowNet在中文过滤系统中应用 | 第37-42页 |
·基于知网的概念特征项的抽取方法 | 第37-41页 |
·实验语料及实验结果 | 第41-42页 |
·本章小结 | 第42-44页 |
第三章 自适应文本过滤中的机器学习 | 第44-60页 |
·自适应文本过滤的机器学习方法综述 | 第44页 |
·文本过滤的模板学习 | 第44-47页 |
·Rocchio方法 | 第44-45页 |
·AdaBoost方法 | 第45-46页 |
·WH和EG方法 | 第46-47页 |
·文本过滤的阈值学习 | 第47-53页 |
·Direct Utility方法 | 第48页 |
·Beta-Gamma方法 | 第48-50页 |
·Logistic Regression方法 | 第50-51页 |
·Score Distribution方法 | 第51-53页 |
·一种启发式的阈值调整算法 | 第53-59页 |
·本章小结 | 第59-60页 |
第四章 winnow分类器在文本过滤中的应用 | 第60-68页 |
·文本过滤中的主题描述 | 第60-61页 |
·使用winnow处理主题描述 | 第61-63页 |
·实验结果及分析 | 第63-66页 |
·本章小结 | 第66-68页 |
第五章 文本过滤系统介绍 | 第68-89页 |
·英文文本过滤系统 | 第68-73页 |
·系统描述 | 第68页 |
·系统的训练过程 | 第68-71页 |
·系统过滤过程 | 第71-73页 |
·中文文本过滤系统 | 第73-78页 |
·系统模块介绍 | 第73-77页 |
·系统功能介绍 | 第77-78页 |
·因特网热门话题检索系统 | 第78-87页 |
·任务分析 | 第78-80页 |
·系统框架和实现 | 第80-83页 |
·实验结果和分析 | 第83-87页 |
·本章小结 | 第87-89页 |
第六章 总结和展望 | 第89-91页 |
·工作总结 | 第89-90页 |
·未来展望 | 第90-91页 |
参考文献 | 第91-101页 |
攻读博士学位期间发表的学术论文 | 第101-102页 |
致谢 | 第102-103页 |