基于特征聚类的文本分类算法研究
| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 第一章 绪论 | 第10-14页 |
| ·课题的研究背景及意义 | 第10页 |
| ·国内外研究现状 | 第10-12页 |
| ·本文的主要内容 | 第12-13页 |
| ·本文的组织与结构 | 第13-14页 |
| 第二章 文本分类概述 | 第14-29页 |
| ·文本分类的相关概念 | 第14-16页 |
| ·文本分类的定义 | 第14页 |
| ·文本分类的一般过程 | 第14-16页 |
| ·文本分类相关技术 | 第16-25页 |
| ·中文分词方法 | 第16-18页 |
| ·特征选择技术 | 第18-21页 |
| ·文本分类方法 | 第21-25页 |
| ·文本分类的评价指标 | 第25-28页 |
| ·查全率与查准率 | 第26页 |
| ·宏平均与微平均 | 第26-27页 |
| ·Fβ测量值 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第三章 文本聚类算法 | 第29-36页 |
| ·聚类的基本概念 | 第29-30页 |
| ·主要聚类算法的分类 | 第30-32页 |
| ·常用的聚类算法 | 第32-34页 |
| ·本章小结 | 第34-36页 |
| 第四章 基于特征聚类的文本预处理 | 第36-48页 |
| ·中文分词模块 | 第36-39页 |
| ·词共现矩阵构造模块 | 第39-42页 |
| ·特征聚类模块 | 第42-45页 |
| ·扩展TF-IDF模块 | 第45-47页 |
| ·本章小结 | 第47-48页 |
| 第五章 基于特征聚类的文本分类实验 | 第48-58页 |
| ·基于特征聚类的文本分类系统 | 第48页 |
| ·实验数据 | 第48-49页 |
| ·搜狗语料库 | 第48-49页 |
| ·网易语料库 | 第49页 |
| ·实验结果与分析 | 第49-57页 |
| ·本章小结 | 第57-58页 |
| 结论与展望 | 第58-60页 |
| 一、结论 | 第58页 |
| 二、展望 | 第58-60页 |
| 参考文献 | 第60-63页 |
| 攻读硕士学位期间取得的研究成果 | 第63-64页 |
| 致谢 | 第64页 |