首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

大规模短文本的分类过滤方法研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-15页
   ·引言第10页
   ·研究的背景和意义第10-13页
     ·选题背景第11页
     ·研究意义和内容第11-12页
     ·系统概述第12-13页
   ·论文内容安排第13-15页
第二章 基于规则的短文本过滤模型第15-27页
   ·基于规则的方法第15-16页
   ·文本过滤模型及评估方法第16-19页
   ·基于规则进行过滤的思想第19-21页
     ·方法提出背景第19-20页
     ·正则表达式第20-21页
   ·系统的实现及实验第21-27页
     ·规则集的生成第21-23页
     ·系统结构及实现方法第23-24页
     ·测试数据和实验结果第24-27页
第三章 统计语言模型的理论基础第27-38页
   ·语言模型简述第27-28页
   ·N-gram统计语言模型第28-30页
     ·统计语言建模第28-29页
     ·N-gram语言模型第29-30页
   ·数据稀疏问题及其解决方法第30-35页
     ·数据稀疏性问题第31页
     ·经典平滑算法第31-35页
     ·词相似度法及词聚类法第35页
   ·语言模型的性能评价第35-38页
第四章 基于语言模型的短文本分类系统第38-46页
   ·短文本分类体系的研究第38-40页
     ·基本分类方法研究第38-39页
     ·短信息的分类体系第39-40页
   ·基于语言模型的分类系统第40-43页
     ·短文本建模第40-42页
     ·程序结构第42-43页
   ·实验及讨论第43-46页
     ·数据准备及实验第44页
     ·结果分析第44-46页
第五章 总结及展望第46-48页
   ·本文完成的工作第46-47页
   ·下一步研究方向第47-48页
参考文献第48-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:汉语普通话词重音理论对比研究
下一篇:我国群众体育政策的历史演进及过程优化