基于关联扩展的中文短文本分类方法研究
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 绪论 | 第9-13页 |
| ·研究背景和意义 | 第9页 |
| ·短文本分类方法现状调研 | 第9-11页 |
| ·论文的主要工作 | 第11-12页 |
| ·论文的组织结构 | 第12-13页 |
| 第二章 相关工作介绍 | 第13-35页 |
| ·引言 | 第13页 |
| ·文本分类的常用技术 | 第13-23页 |
| ·文档的预处理工作 | 第14-15页 |
| ·文本表示 | 第15-16页 |
| ·特征选择方法介绍 | 第16-19页 |
| ·文本分类的常用方法 | 第19-21页 |
| ·文本分类算法的评价指标 | 第21-23页 |
| ·词汇相关理论 | 第23-34页 |
| ·相关词汇对短文本分类的作用 | 第23页 |
| ·挖掘频繁模式、关联和相关 | 第23-24页 |
| ·频繁项集、闭项集和关联规则 | 第24-25页 |
| ·Apriori算法 | 第25-28页 |
| ·FPGrowth算法 | 第28-32页 |
| ·Apriori算法和FP增长算法的优缺点及改进 | 第32-34页 |
| ·本章小结 | 第34-35页 |
| 第三章 基于关联特征扩展的中文短文本分类方法 | 第35-47页 |
| ·引言 | 第35页 |
| ·关联规则集的获取方法 | 第35-38页 |
| ·高质量关联规则集的获取方法 | 第38-42页 |
| ·基于关联扩展的短文本分类方法 | 第42-43页 |
| ·基于自选择机制的特征扩展 | 第43-46页 |
| ·本章小结 | 第46-47页 |
| 第四章 短文本分类实验 | 第47-54页 |
| ·基于特征扩展的权值提升策略 | 第47-48页 |
| ·实验数据 | 第48-49页 |
| ·实验测试 | 第49-50页 |
| ·实验结果及分析 | 第50-52页 |
| ·本章小结 | 第52-54页 |
| 第五章 总结和展望 | 第54-56页 |
| ·工作总结 | 第54-55页 |
| ·工作展望 | 第55-56页 |
| 参考文献 | 第56-60页 |
| 致谢 | 第60-61页 |
| 作者攻读学位期间发表的学术论文目录 | 第61页 |