基于改进贝叶斯算法的文本分类器的研究及其在NERMS中的应用
| 第一章 引言 | 第1-9页 |
| ·研究背景 | 第7-8页 |
| ·本文的工作 | 第8-9页 |
| 第二章 文本分类系统 | 第9-17页 |
| ·分类问题 | 第9-10页 |
| ·文本分类 | 第10-12页 |
| ·分类算法 | 第12-17页 |
| ·朴素贝叶斯分类 | 第13页 |
| ·K-最近距离 | 第13-14页 |
| ·决策树 | 第14页 |
| ·归纳逻辑方法 | 第14页 |
| ·神经网络方法 | 第14-15页 |
| ·相关反馈分类 | 第15-16页 |
| ·支持矢量机方法 | 第16-17页 |
| 第三章 分词 | 第17-28页 |
| ·自动分词概述 | 第17-18页 |
| ·各种分词方法 | 第18-20页 |
| ·基于词典的分词方法 | 第18-19页 |
| ·基于统计的分词方法 | 第19-20页 |
| ·基于AI 的分词方法 | 第20页 |
| ·各种分词方法比较 | 第20-21页 |
| ·最大概率分词算法 | 第21-28页 |
| ·形式化描述 | 第21-23页 |
| ·举例 | 第23-24页 |
| ·将概率转化为“费用” | 第24-25页 |
| ·提高计算效率 | 第25-26页 |
| ·最大概率分词算法 | 第26页 |
| ·最大概率分词的优缺点 | 第26-28页 |
| 第四章 特征选择 | 第28-35页 |
| ·向量表示 | 第28页 |
| ·特征子集的选取 | 第28-32页 |
| ·文档频度 | 第29页 |
| ·熵增 | 第29-30页 |
| ·互信息 | 第30页 |
| ·χ~2 统计 | 第30-31页 |
| ·TFIDF 方法 | 第31-32页 |
| ·在特征选择时引入相对系数 | 第32-35页 |
| 第五章 朴素贝叶斯算法及其改进 | 第35-50页 |
| ·朴素贝叶斯分类 | 第35-38页 |
| ·贝叶斯定理 | 第35-36页 |
| ·朴素贝叶斯分类 | 第36-37页 |
| ·朴素贝叶斯分类的效率 | 第37-38页 |
| ·把相对系数应用到朴素贝叶斯分类 | 第38页 |
| ·改进后朴素贝叶斯分类的工作过程 | 第38-40页 |
| ·改进后分类器的设计 | 第40-42页 |
| ·改进后分类器的实现 | 第42-46页 |
| ·分词的实现 | 第42-43页 |
| ·分类的实现 | 第43-44页 |
| ·资源库的设计 | 第44-46页 |
| ·对比实验 | 第46-50页 |
| ·评估方法 | 第46-47页 |
| ·本实验选取的数据集 | 第47页 |
| ·实验结果 | 第47-49页 |
| ·实验结论 | 第49-50页 |
| 第六章 改进的朴素贝叶斯算法在NERMS 的应用 | 第50-56页 |
| ·NERMS 系统概述 | 第50-52页 |
| ·分类器在NERMS 中的应用 | 第52-53页 |
| ·应用实验 | 第53-56页 |
| 第七章 总结 | 第56-58页 |
| ·工作总结 | 第56页 |
| ·进一步的工作 | 第56-58页 |
| 参考文献 | 第58-61页 |
| 中文摘要 | 第61-63页 |
| Abstract | 第63-65页 |
| 致谢 | 第65-66页 |
| 导师与作者简介 | 第66-67页 |