大规模短文本的分类过滤方法研究

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-15页
·引言	第10页
·研究的背景和意义	第10-13页
·选题背景	第11页
·研究意义和内容	第11-12页
·系统概述	第12-13页
·论文内容安排	第13-15页
第二章基于规则的短文本过滤模型	第15-27页
·基于规则的方法	第15-16页
·文本过滤模型及评估方法	第16-19页
·基于规则进行过滤的思想	第19-21页
·方法提出背景	第19-20页
·正则表达式	第20-21页
·系统的实现及实验	第21-27页
·规则集的生成	第21-23页
·系统结构及实现方法	第23-24页
·测试数据和实验结果	第24-27页
第三章统计语言模型的理论基础	第27-38页
·语言模型简述	第27-28页
·N-gram统计语言模型	第28-30页
·统计语言建模	第28-29页
·N-gram语言模型	第29-30页
·数据稀疏问题及其解决方法	第30-35页
·数据稀疏性问题	第31页
·经典平滑算法	第31-35页
·词相似度法及词聚类法	第35页
·语言模型的性能评价	第35-38页
第四章基于语言模型的短文本分类系统	第38-46页
·短文本分类体系的研究	第38-40页
·基本分类方法研究	第38-39页
·短信息的分类体系	第39-40页
·基于语言模型的分类系统	第40-43页
·短文本建模	第40-42页
·程序结构	第42-43页
·实验及讨论	第43-46页
·数据准备及实验	第44页
·结果分析	第44-46页
第五章总结及展望	第46-48页
·本文完成的工作	第46-47页
·下一步研究方向	第47-48页
参考文献	第48-50页
致谢	第50页