舆情监测系统及相关技术研究

中文摘要	第1-5页
Abstract	第5-9页
1 绪论	第9-16页
·研究背景和意义	第9-10页
·发展与现状	第10-14页
·网络舆情监测的相关技术[2]	第12-13页
·中文分词	第13-14页
·本文的研究内容	第14-15页
·快速中文分词	第15页
·文本聚类	第15页
·本文的组织结构	第15-16页
2 相关理论和技术分析	第16-24页
·舆情监测的基本流程	第16页
·信息检索	第16页
·检索系统评价	第16-17页
·全文检索的基本过程	第17页
·中文分词方法	第17-18页
·索引构建方法	第18-20页
·基于块的排序索引构建方法	第18-19页
·内存式单遍扫描索引构建方法	第19-20页
·检索	第20-24页
·检索过程与方式	第20页
·文档评分	第20-24页
3 快速分词	第24-40页
·引言	第24页
·典型的词典机制	第24-28页
·基于整词二分的分词词典机制	第24页
·基于 TRIE 索引树的词典机制	第24-25页
·基于逐字二分的分词词典机制	第25页
·基于双字哈希的分词词典机制	第25-26页
·三数组 TRIE 词典结构	第26-28页
·典型词典机制的一些改进	第28-29页
·首字哈希表的改进	第28页
·次字结构的改进	第28-29页
·第三个字及以后的汉字的存储结构	第29页
·本文采用的词典机制及实现	第29-35页
·添加频率的双字哈希词典	第29-32页
·基于自动机的词典结构	第32-35页
·基于平衡二叉树的正向最大匹配中文分词算法	第35-37页
·实验	第37-39页
·实验说明	第37-38页
·结果与分析	第38-39页
本章小结	第39-40页
4 文本聚类	第40-54页
·文本聚类概述	第40-41页
·传统的文本聚类算法	第41-43页
·基于层次的聚类算法	第41-42页
·基于划分的聚类算法	第42页
·基于密度的聚类算法	第42-43页
·文本的层次聚类算法	第43-46页
·最近距离	第43-44页
·最远距离	第44页
·平均距离	第44页
·质心距离	第44-45页
·中值距离	第45页
·离差平方和	第45-46页
·文本相似度计算	第46-49页
·常用的文本相似度计算	第46-48页
·加权的文本相似度计算	第48-49页
·实验	第49-53页
·实验数据	第49页
·评价方法	第49-52页
·实验结果及分析	第52-53页
·本章小结	第53-54页
5 系统框架	第54-57页
·设计	第54页
·系统设计	第54页
·实现	第54-57页
·分词器实现	第54页
·索引器实现	第54-55页
·检索器实现	第55-56页
·聚类器实现	第56-57页
6 总结与展望	第57-58页
·总结	第57页
·展望	第57-58页
参考文献	第58-62页
致谢	第62页