基于特征选择的文本分类方法研究
提要 | 第4-5页 |
摘要 | 第5-8页 |
abstract | 第8-10页 |
第1章 绪论 | 第14-32页 |
1.1 研究背景及意义 | 第14-17页 |
1.1.1 研究背景 | 第14-15页 |
1.1.2 研究意义 | 第15-17页 |
1.2 国内外研究现状 | 第17-27页 |
1.2.1 现存的主要处理方法 | 第17-26页 |
1.2.2 现存的主要问题 | 第26-27页 |
1.3 本文主要工作 | 第27-28页 |
1.4 本文组织结构 | 第28-32页 |
第2章 文本分类基础理论 | 第32-44页 |
2.1 文本分类流程概述 | 第32页 |
2.2 预处理 | 第32-33页 |
2.3 文本表示 | 第33-35页 |
2.4 特征选择方法 | 第35-37页 |
2.5 文本分类常用技术 | 第37-40页 |
2.6 文本情感分类 | 第40-41页 |
2.7 评估标准 | 第41-43页 |
2.8 本章小结 | 第43-44页 |
第3章 基于关键特征选择的海量文本噪音消除算法 | 第44-62页 |
3.1 引言 | 第44-45页 |
3.2 相关工作 | 第45-47页 |
3.3 PNE算法 | 第47-51页 |
3.3.1 噪音数据的类型分析 | 第48页 |
3.3.2 RNE算法 | 第48-50页 |
3.3.3 PED算法 | 第50-51页 |
3.4 实验与分析 | 第51-61页 |
3.4.1 实验设置及参照方法 | 第51-52页 |
3.4.2 文本语料集 | 第52页 |
3.4.3 评价标准 | 第52-53页 |
3.4.4 PNE算法有效性验证 | 第53-57页 |
3.4.5 PNE算法并行化特点的验证 | 第57-59页 |
3.4.6 噪音比例对PNE算法的影响 | 第59-61页 |
3.5 本章小结 | 第61-62页 |
第4章 基于主动否定学习的邮件分类算法 | 第62-78页 |
4.1 引言 | 第62-63页 |
4.2 相关工作 | 第63-64页 |
4.3 ALNSTC算法 | 第64-69页 |
4.3.1 准备工作 | 第64页 |
4.3.2 建立用户兴趣集 | 第64-66页 |
4.3.3 主动否定学习算法 | 第66-69页 |
4.4 实验与分析 | 第69-77页 |
4.4.1 数据集 | 第69页 |
4.4.2 评价标准 | 第69-70页 |
4.4.3 准确率和召回率分析 | 第70-72页 |
4.4.4 AUC分析 | 第72-73页 |
4.4.5 分类耗时分析 | 第73-76页 |
4.4.6 用户标注负担分析 | 第76-77页 |
4.5 本章小结 | 第77-78页 |
第5章 基于特征选择和用户兴趣集的新闻推荐算法 | 第78-102页 |
5.1 引言 | 第78-79页 |
5.2 相关工作 | 第79-81页 |
5.3 基于NS的新闻推荐算法 | 第81-89页 |
5.3.1 基于主动学习的关键特征选择算法 | 第81-83页 |
5.3.2 建立用户双向兴趣集 | 第83-85页 |
5.3.3 NSNR算法 | 第85-89页 |
5.4 实验结果与分析 | 第89-99页 |
5.4.1 数据集 | 第89-90页 |
5.4.2 ALKFS算法有效性验证及分析 | 第90-92页 |
5.4.3 相似度计算优化设计验证与分析 | 第92-93页 |
5.4.4 NSNR算法的准确性验证及分析 | 第93-98页 |
5.4.5 NSNR算法的多样性验证及分析 | 第98-99页 |
5.5 本章小结 | 第99-102页 |
第6章 基于特征选择和迁移学习的微博情感分类算法 | 第102-122页 |
6.1 引言 | 第102-103页 |
6.2 相关工作 | 第103-105页 |
6.3 PT算法 | 第105-110页 |
6.3.1 微博短文本与表情符号 | 第105-106页 |
6.3.2 算法主体思路 | 第106-107页 |
6.3.3 PCAKFS算法 | 第107-109页 |
6.3.4 TLSC算法 | 第109-110页 |
6.4 实验与分析 | 第110-120页 |
6.4.1 数据集 | 第110-112页 |
6.4.2 评价标准及参照算法 | 第112页 |
6.4.3 PT算法的独立分类性能评估 | 第112-113页 |
6.4.4 PT算法的有效性验证 | 第113-116页 |
6.4.5 表情符号对微博短文本情感分类的影响 | 第116-118页 |
6.4.6 关键特征选择上限对情感分类性能的影响 | 第118-120页 |
6.5 本章小结 | 第120-122页 |
第7章 总结与展望 | 第122-126页 |
7.1 总结 | 第122-124页 |
7.2 展望 | 第124-126页 |
参考文献 | 第126-136页 |
作者简介及在学期间所取得的科研成果 | 第136-138页 |
致谢 | 第138-139页 |