摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 引言 | 第9-16页 |
1.1 BBS的发展及功能 | 第9-10页 |
1.2 安徽省高校BBS的背景及发展现状 | 第10-11页 |
1.2.1 由学校管理的校园BBS的发展现状 | 第10-11页 |
1.2.2 由非官方管理的校园BBS的发展现状 | 第11页 |
1.3 安徽省高校BBS的管理及困境 | 第11-13页 |
1.3.1 学校在BBS管理中的角色定位 | 第11-12页 |
1.3.2 学校在BBS管理中遇到的问题 | 第12-13页 |
1.4 高校BBS信息监控研究的重要性和意义 | 第13-14页 |
1.5 中国及国外对于BBS信息的管理及主要研究方向 | 第14-15页 |
1.6 论文的主要内容及结构安排 | 第15-16页 |
第二章 BBS信息安全管理的系统框架及数据挖掘技术 | 第16-22页 |
2.1 BBS信息安全管理的安全防护 | 第16-19页 |
2.1.1 高校BBS信息的特点 | 第16页 |
2.1.2 BBS信息的结构 | 第16-17页 |
2.1.3 BBS的一般网络安全措施 | 第17-18页 |
2.1.4 对BBS数据进行数据挖掘的价值 | 第18-19页 |
2.2 数据挖掘技术 | 第19-22页 |
2.2.1 数据挖掘技术的概念及功能 | 第19-20页 |
2.2.2 数据挖掘的步骤 | 第20-21页 |
2.2.3 数据挖掘的常用技术 | 第21-22页 |
第三章 文本信息的数据挖掘 | 第22-31页 |
3.1 热点话题的挖掘及分析过程 | 第22-23页 |
3.2 对于文本信息的预处理 | 第23-25页 |
3.2.1 中文分词技术 | 第23-24页 |
3.2.2 排重过滤 | 第24-25页 |
3.3 文本信息的特征提取 | 第25-26页 |
3.3.1 x~2统计量(CHI) | 第25页 |
3.3.2 信息量(Mutual Information,MI) | 第25-26页 |
3.4 文本特征降维 | 第26-27页 |
3.4.1 TF-IDF法 | 第26-27页 |
3.4.2 潜在语义索引法(Latent Semantic Indexing,LSI) | 第27页 |
3.5 文本的关联分析 | 第27-28页 |
3.6 文本分类 | 第28-29页 |
3.6.1 K近邻算法(k-nearest neighbor algorithm,KNN) | 第28页 |
3.6.2 朴素贝叶斯算法(Naive Bayes) | 第28-29页 |
3.6.3 支持向量机(Support Vector Machine,SVM) | 第29页 |
3.7 文本聚类 | 第29-31页 |
第四章 热点话题与突发事件 | 第31-40页 |
4.1 热点话题与突发事件发现的流程 | 第31-32页 |
4.2 热点话题 | 第32-34页 |
4.2.1 话题热度 | 第33-34页 |
4.2.2 文本的相似度计算 | 第34页 |
4.3 情感趋向分析 | 第34-36页 |
4.3.1 情感词和情感字典 | 第34-35页 |
4.3.2 词语的情感趋向分析 | 第35页 |
4.3.3 观点句分析 | 第35-36页 |
4.3.4 倾向性计算 | 第36页 |
4.4 突发事件 | 第36-38页 |
4.4.1 通过回复数和浏览数对突发事件进行判断 | 第37页 |
4.4.2 通过倾向性对突发事件进行判断 | 第37-38页 |
4.4.3 通过关键字对突发事件进行预判 | 第38页 |
4.5 热点话题与突发事件的关系 | 第38-40页 |
第五章 实验与分析 | 第40-49页 |
5.1 实验简介 | 第40页 |
5.2 热点话题及突发事件的发现 | 第40-45页 |
5.2.1 Discuz!平台的BBS的数据库表 | 第40-41页 |
5.2.2 对文本进行中文分词 | 第41页 |
5.2.3 回复密度与热点话题的发现 | 第41-43页 |
5.2.4 情感强度与突发事件的发现 | 第43-45页 |
5.3 普通话题与特殊话题的对比 | 第45-47页 |
5.4 通过SVM方法对情感文本的分类测试 | 第47-49页 |
第六章 总结与展望 | 第49-51页 |
参考文献 | 第51-53页 |
致谢 | 第53-54页 |
在学期间发表的论著及科研成果清单 | 第54页 |