摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第9-14页 |
·研究背景 | 第9-10页 |
·研究内容及现状 | 第10-12页 |
·信息过滤的发展历程 | 第10-11页 |
·信息过滤的研究内容及现状 | 第11-12页 |
·本文的内容及主要工作 | 第12-14页 |
第二章 信息过滤模型及关键技术 | 第14-27页 |
·传统信息过滤模型 | 第14-15页 |
·文本预处理 | 第15页 |
·常用的文本表示模型 | 第15-20页 |
·布尔逻辑模型 | 第16页 |
·向量空间模型 | 第16-18页 |
·潜在语义索引模型 | 第18-19页 |
·概率模型 | 第19页 |
·小结 | 第19-20页 |
·特征提取 | 第20-22页 |
·空间降维 | 第20页 |
·特征提取 | 第20-22页 |
·文本分类 | 第22-25页 |
·文本分类过程 | 第22-23页 |
·文本分类算法 | 第23-25页 |
·传统的信息过滤模型存在的问题 | 第25-26页 |
·小结 | 第26-27页 |
第三章 基于自学习机制的信息过滤模型 | 第27-46页 |
·相关反馈(RF,Relevence Feedback) | 第27页 |
·机器学习 | 第27-30页 |
·机器学习理论简介 | 第27-29页 |
·机器学习在信息过滤中的应用 | 第29-30页 |
·基本思想 | 第29页 |
·信息过滤中应用机器学习的优势 | 第29页 |
·本文中机器学习在信息过滤中的应用 | 第29-30页 |
·基于机器学习的信息过滤 | 第30-44页 |
·样本的组织 | 第32页 |
·分词的实施 | 第32-35页 |
·停用词表的特征 | 第33-34页 |
·基于统计的停用词表生成算法 | 第34-35页 |
·特征提取 | 第35-38页 |
·现有特征提取方法存在的问题 | 第35页 |
·基于遗传算法的特征提取优化算法 | 第35-38页 |
·基于机器学习的非法文档模板的建立和更新 | 第38-39页 |
·非法文档模板的建立 | 第38-39页 |
·非法文档模板的更新 | 第39页 |
·基于BP 神经网络的非法文本过滤 | 第39-44页 |
·神经网络概述 | 第39-40页 |
·在信息过滤技术中应用BP 神经网络 | 第40-41页 |
·输入数据的取得 | 第41-42页 |
·BP 神经网络拓扑结构 | 第42页 |
·BP 人工神经网络训练过程 | 第42-44页 |
·训练调整与结果存储 | 第44页 |
·基于自学习机制的信息过滤模型 | 第44-45页 |
·小结 | 第45-46页 |
第四章 分层、分级、分策略的信息过滤系统 | 第46-59页 |
·分层、分级、分策略的信息过滤 | 第46-48页 |
·设计思想 | 第46-47页 |
·主要内容 | 第47-48页 |
·系统实现 | 第48-56页 |
·主要系统模块 | 第48-50页 |
·系统流程 | 第50-51页 |
·系统实现 | 第51-54页 |
·主要界面 | 第54-56页 |
·评价指标 | 第56页 |
·测试过程与结果 | 第56-58页 |
·小结 | 第58-59页 |
第五章 结束语 | 第59-61页 |
·本文所做的主要工作 | 第59-60页 |
·进一步的工作 | 第60-61页 |
参考文献 | 第61-64页 |
致谢 | 第64-65页 |
发表及录用的论文 | 第65页 |
研究生期间参与的科研项目 | 第65页 |