基于分类的文本内容判别方法研究
摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-16页 |
·研究背景与意义 | 第10-12页 |
·课题研究背景 | 第10-11页 |
·课题研究意义和目的 | 第11-12页 |
·国内外研究现状 | 第12-14页 |
·论文工作与结构安排 | 第14-16页 |
·论文主要研究内容 | 第14-15页 |
·论文结构安排 | 第15-16页 |
第2章 中文分词及向量空间模型 | 第16-28页 |
·中文文本分词 | 第16-23页 |
·中文分词器简介 | 第16-17页 |
·常见中文分词算法 | 第17-22页 |
·常见的中文分词器 | 第22-23页 |
·向量空间模型(VSM)与降维 | 第23-28页 |
·向量空间模型简介 | 第23-24页 |
·特征权重计算算法 TF-IDF | 第24-25页 |
·文本特征向量降维 | 第25-28页 |
第3章 文本分类算法研究 | 第28-41页 |
·文本分类器的发展及基本流程 | 第28-31页 |
·基于统计的文本分类算法 | 第31-38页 |
·朴素贝叶斯分类器 | 第31-33页 |
·K 最近邻(KNN)分类器 | 第33-36页 |
·SVM 分类器 | 第36-38页 |
·基于语义的文本分类算法 | 第38-40页 |
·潜在语义分析 | 第38-39页 |
·基于 Hownet 的语义相似度计算 | 第39-40页 |
·几种分类器性能比较 | 第40-41页 |
第4章 系统的设计与实现 | 第41-49页 |
·二级分类器级联架构设计 | 第41-44页 |
·二级文本分类器级联设计的特点 | 第41-42页 |
·不良网页分类判别系统设计 | 第42-44页 |
·KNN 分类器的改进与实现 | 第44-46页 |
·SVM 分类器的改造以及与 KNN 的级联 | 第46-47页 |
·训练集与测试集的收集与筛选 | 第47-49页 |
第5章 系统测试与结果分析 | 第49-54页 |
·测试与结果分析 | 第49-52页 |
·结果评价标准介绍 | 第49页 |
·测试与分析 | 第49-52页 |
·系统的不足与提升措施 | 第52-54页 |
第6章 总结与展望 | 第54-57页 |
·本文工作总结 | 第54-55页 |
·未来工作展望 | 第55-57页 |
致谢 | 第57-58页 |
参考文献 | 第58-60页 |
附录 | 第60页 |