摘要 | 第1-8页 |
ABSTRACT | 第8-12页 |
第一章 绪论 | 第12-17页 |
·BBS 发展现状不容乐观 | 第12-13页 |
·敏感信息与非敏感信息的区别 | 第13-14页 |
·敏感信息发现与识别的概念 | 第14页 |
·敏感信息发现与识别的重要意义 | 第14页 |
·国内外研究现状 | 第14-15页 |
·课题的提出 | 第15页 |
·本文的内容安排 | 第15-17页 |
第二章 中文文本表示技术 | 第17-30页 |
·论坛文本信息的预处理 | 第17页 |
·汉语的几种自动分词技术 | 第17-19页 |
·论坛帖子的向量化表示 | 第19-21页 |
·文本特征的提取 | 第21页 |
·经典的特征降维算法 | 第21-22页 |
·权重计算 | 第22-23页 |
·BBS 新词发现技术 | 第23-30页 |
第三章 已知先验知识的文本过滤 | 第30-37页 |
·文本分类的研究背景 | 第30页 |
·文本分类的研究历史 | 第30页 |
·文本分类主要过程 | 第30-32页 |
·文本分类经典算法 | 第32-35页 |
·文本分类的性能指标 | 第35页 |
·实验分类方法的选择 | 第35-37页 |
第四章 基于Naive Bayes 的论坛文本分类 | 第37-41页 |
·Naive Bayes 原理分析 | 第37-38页 |
·实验过程 | 第38页 |
·实验数据 | 第38-40页 |
·实验小结 | 第40-41页 |
第五章 未知敏感信息的捕获 | 第41-57页 |
·研究的背景概况 | 第41页 |
·决策树思想在未知敏感信息挖掘中的应用 | 第41-46页 |
·实验原理分析 | 第46-49页 |
·实验数据 | 第49-52页 |
·实验小结 | 第52-53页 |
·实验性能比较 | 第53-57页 |
第六章 工作总结与前景展望 | 第57-59页 |
·工作总结 | 第57-58页 |
·未来研究展望 | 第58-59页 |
参考文献 | 第59-70页 |
致谢 | 第70-71页 |
攻读硕士学位期间发表的学术论文 | 第71页 |