基于内容的中文文本过滤关键技术研究
摘要 | 第1-5页 |
ABSTRACT | 第5-8页 |
第一章 引言 | 第8-12页 |
·信息过滤的研究背景及意义 | 第8页 |
·发展历史 | 第8-9页 |
·相关研究进展 | 第9-10页 |
·本文的主要研究内容及论文结构 | 第10-12页 |
第二章 文本过滤相关知识 | 第12-19页 |
·信息过滤概述 | 第12-15页 |
·信息过滤的分类方法 | 第12-13页 |
·文本信息过滤任务描述 | 第13-14页 |
·信息过滤一般处理流程 | 第14-15页 |
·信息过滤与信息检索 | 第15页 |
·相关信息检索模型 | 第15-17页 |
·布尔模型 | 第15-16页 |
·向量空间模型 | 第16页 |
·潜在语义索引模型 | 第16-17页 |
·神经网络模型 | 第17页 |
·性能评价指标 | 第17-19页 |
第三章 文本过滤关键技术研究 | 第19-29页 |
·中文自动分词 | 第19-22页 |
·中文自动分词技术面临的主要困难 | 第19-20页 |
·主要的中文自动分词方法 | 第20-21页 |
·中文自动分词主要困难的解决方法 | 第21-22页 |
·文本特征向量降维 | 第22-23页 |
·建立知识库 | 第22页 |
·利用Zipf 定律 | 第22-23页 |
·特征提取 | 第23-25页 |
·常用权重计算函数 | 第25-26页 |
·机器学习 | 第26-29页 |
·用户模板学习 | 第27-28页 |
·过滤阈值的学习 | 第28-29页 |
第四章 基于内容的中文文本过滤系统总体设计及实现 | 第29-41页 |
·预处理模块 | 第30-33页 |
·分词子模块 | 第30-31页 |
·文本特征向量降维子模块 | 第31-32页 |
·特征提取子模块 | 第32-33页 |
·权值计算子模块 | 第33页 |
·用户需求分析模块 | 第33-35页 |
·概念扩充数学模型 | 第34-35页 |
·用户兴趣模型 | 第35页 |
·过滤匹配模块 | 第35页 |
·自适应学习模块 | 第35-37页 |
·系统实现及结果分析 | 第37-41页 |
结束语 | 第41-42页 |
参考文献 | 第42-44页 |
致谢 | 第44-45页 |
在学期间公开发表论文及著作情况 | 第45页 |