基于向量空间模型的自适应文本过滤研究
摘要 | 第1-4页 |
Abstract | 第4-8页 |
第1章 绪论 | 第8-16页 |
·课题背景与意义 | 第8-9页 |
·信息过滤与自适应信息过滤 | 第9-11页 |
·信息过滤 | 第9页 |
·自适应信息过滤 | 第9-10页 |
·信息过滤与信息检索等的关系 | 第10-11页 |
·文本过滤系统的评价 | 第11-12页 |
·研究现状及主要研究成果 | 第12-15页 |
·国内外研究的现状 | 第12-13页 |
·当前研究的主要成果 | 第13-15页 |
·本文的主要研究内容 | 第15-16页 |
第2章 文本表示及自适应过滤系统体系结构 | 第16-24页 |
·向量空间模型 | 第16-17页 |
·VSM基本概念 | 第16-17页 |
·文本表示 | 第17-22页 |
·特征项抽取 | 第17-18页 |
·特征项权重的计算 | 第18-21页 |
·相关实验及结果分析 | 第21-22页 |
·系统结构 | 第22-23页 |
·实验语料来源 | 第23页 |
·本章小结 | 第23-24页 |
第3章 基于查询扩展技术的用户模板构造 | 第24-37页 |
·查询扩展技术简介 | 第24页 |
·查询扩展技术在本系统中的应用 | 第24-25页 |
·基于《同义词词林(扩展版)》的查询扩展 | 第25-26页 |
·《同义词词林(扩展版)》简介 | 第25-26页 |
·基于《词林》的扩展技术 | 第26页 |
·基于互联网挖掘的查询扩展 | 第26-32页 |
·方法概述 | 第27页 |
·候选扩展词抽取 | 第27-30页 |
·扩展词确认 | 第30-32页 |
·实验分析 | 第32-36页 |
·实验语料 | 第32-33页 |
·实验结果及分析 | 第33-36页 |
·本章小结 | 第36-37页 |
第4章 用户模板的自学习 | 第37-49页 |
·文本过滤的模板学习 | 第37-39页 |
·Rocchio方法 | 第37-38页 |
·AdaBoost方法 | 第38-39页 |
·WH和EG方法 | 第39页 |
·基于伪相关反馈的用户模板学习算法 | 第39-42页 |
·相关反馈及伪相关反馈 | 第39-40页 |
·伪相关反馈在自适应文本过滤中的应用 | 第40-41页 |
·用户模板学习策略 | 第41-42页 |
·实验结果 | 第42页 |
·基于层次聚类的用户模板学习算法 | 第42-48页 |
·层次聚类算法 | 第42-43页 |
·结合层次聚类的Rocchio学习机制 | 第43-45页 |
·Rocchio参数训练 | 第45-46页 |
·层次聚类的阈值训练 | 第46页 |
·实验结果及分析 | 第46-48页 |
·本章小节 | 第48-49页 |
第5章 相关性判定 | 第49-58页 |
·相似度计算策略 | 第49-54页 |
·相似度(Similarity) | 第49-54页 |
·过滤阈值的确定 | 第54-57页 |
·本章小节 | 第57-58页 |
结论 | 第58-59页 |
参考文献 | 第59-63页 |
哈尔滨工业大学硕士学位论文原创性声明 | 第63页 |
哈尔滨工业大学硕士学位论文使用授权书 | 第63页 |
哈尔滨工业大学硕士学位涉密论文管理 | 第63-64页 |
致谢 | 第64页 |