首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短消息文本处理关键技术研究

摘要第1-6页
Abstract第6-11页
1 引言第11-15页
   ·背景第11-12页
   ·国内外研究现状第12-14页
   ·论文主要研究内容以及工作第14-15页
2 网络爬虫技术研究第15-22页
   ·爬虫技术的原理第15-16页
   ·爬虫技术的分类第16-19页
   ·网络爬虫技术的研究现状第19-20页
   ·爬虫技术获取本文的数据集第20-21页
   ·小结第21-22页
3 文本分词技术研究第22-31页
   ·短消息文本的特征第22-23页
   ·短消息文本预处理第23-24页
   ·分词技术概述第24-29页
     ·分词技术的原理第24-26页
     ·常用分词包简介第26-28页
     ·分词技术的难题第28-29页
   ·基于分词的短消息文本第29-30页
   ·小结第30-31页
4 文本聚类技术研究第31-54页
   ·文本聚类技术概述第31-42页
     ·传统聚类算法简介第32-35页
     ·文本向量表示第35-37页
     ·文本特征选择第37-38页
     ·文本相似度衡量方法第38-40页
     ·聚类效果评价第40-42页
   ·基于AP算法的文本聚类技术第42-46页
     ·AP算法原理第42-45页
     ·AP算法的实现第45-46页
   ·AP算法和K-MEANS算法的对比第46-49页
   ·AP算法和STC(后缀树)算法的对比第49-53页
   ·本章小结第53-54页
5 基于AP算法的文本聚类原型系统第54-70页
   ·原型系统的流程图第54-56页
   ·系统结构设计第56-69页
     ·短消息文本获取模块第56-58页
     ·短消息文本预处理模块第58-59页
     ·短消息文本向量化模块第59-60页
     ·短消息文本聚类模块第60-69页
   ·小结第69-70页
6 总结与展望第70-73页
   ·总结第70-71页
   ·展望第71-73页
参考文献第73-77页
后记第77-78页
致谢第78-79页

论文共79页,点击 下载论文
上一篇:基于层次分析法的四川省体育产业竞争力的研究
下一篇:基于ZigBee的智能家居系统设计与实现