首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

舆情监测系统及相关技术研究

中文摘要第1-5页
Abstract第5-9页
1 绪论第9-16页
   ·研究背景和意义第9-10页
   ·发展与现状第10-14页
     ·网络舆情监测的相关技术[2]第12-13页
     ·中文分词第13-14页
   ·本文的研究内容第14-15页
     ·快速中文分词第15页
     ·文本聚类第15页
   ·本文的组织结构第15-16页
2 相关理论和技术分析第16-24页
   ·舆情监测的基本流程第16页
   ·信息检索第16页
   ·检索系统评价第16-17页
   ·全文检索的基本过程第17页
   ·中文分词方法第17-18页
   ·索引构建方法第18-20页
     ·基于块的排序索引构建方法第18-19页
     ·内存式单遍扫描索引构建方法第19-20页
   ·检索第20-24页
     ·检索过程与方式第20页
     ·文档评分第20-24页
3 快速分词第24-40页
   ·引言第24页
   ·典型的词典机制第24-28页
     ·基于整词二分的分词词典机制第24页
     ·基于 TRIE 索引树的词典机制第24-25页
     ·基于逐字二分的分词词典机制第25页
     ·基于双字哈希的分词词典机制第25-26页
     ·三数组 TRIE 词典结构第26-28页
   ·典型词典机制的一些改进第28-29页
     ·首字哈希表的改进第28页
     ·次字结构的改进第28-29页
     ·第三个字及以后的汉字的存储结构第29页
   ·本文采用的词典机制及实现第29-35页
     ·添加频率的双字哈希词典第29-32页
     ·基于自动机的词典结构第32-35页
   ·基于平衡二叉树的正向最大匹配中文分词算法第35-37页
   ·实验第37-39页
     ·实验说明第37-38页
     ·结果与分析第38-39页
 本章小结第39-40页
4 文本聚类第40-54页
   ·文本聚类概述第40-41页
   ·传统的文本聚类算法第41-43页
     ·基于层次的聚类算法第41-42页
     ·基于划分的聚类算法第42页
     ·基于密度的聚类算法第42-43页
   ·文本的层次聚类算法第43-46页
     ·最近距离第43-44页
     ·最远距离第44页
     ·平均距离第44页
     ·质心距离第44-45页
     ·中值距离第45页
     ·离差平方和第45-46页
   ·文本相似度计算第46-49页
     ·常用的文本相似度计算第46-48页
     ·加权的文本相似度计算第48-49页
   ·实验第49-53页
     ·实验数据第49页
     ·评价方法第49-52页
     ·实验结果及分析第52-53页
   ·本章小结第53-54页
5 系统框架第54-57页
   ·设计第54页
     ·系统设计第54页
   ·实现第54-57页
     ·分词器实现第54页
     ·索引器实现第54-55页
     ·检索器实现第55-56页
     ·聚类器实现第56-57页
6 总结与展望第57-58页
   ·总结第57页
   ·展望第57-58页
参考文献第58-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于JavaMail的企业信息传送系统设计与实现
下一篇:从审美角度看我国现代漆画之韵