文本分类新方法的研究与应用

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·选题背景和研究意义	第7-8页
·选题背景	第7页
·研究意义	第7-8页
·研究现状	第8-9页
·研究内容	第9-10页
·论文结构	第10-11页
第二章文本分类概述	第11-19页
·文本预处理与文本表示	第11-14页
·文本预处理	第11-12页
·文本表示	第12-13页
·特征选择	第13-14页
·文本分类相关算法	第14-16页
·文本相似度算法	第14页
·朴素贝叶斯模型	第14-15页
·K 近邻	第15页
·神经网络	第15页
·支持向量机	第15-16页
·性能评价与相关语料库	第16-19页
·性能评价	第16-17页
·相关语料	第17-19页
第三章基于不完整数据集的文本分类技术概要	第19-25页
·朴素贝叶斯方法	第19-21页
·直推向量机方法	第21-22页
·PU-learning 问题	第22-25页
第四章改进的基于不完整数据集的文本分类新方法	第25-39页
·统计推理和似然估计	第25-26页
·混合模型的EM 算法	第26-28页
·EM 算法介绍	第26页
·EM 算法推导	第26-28页
·B-EMNB 算法	第28-31页
·实验与结果	第31-38页
·实验组一	第31-33页
·实验组二	第33-35页
·实验组三	第35-36页
·实验组四	第36-38页
·小结	第38-39页
第五章基于不完整数据集发现新类别的文本分类方法	第39-51页
·文本相似度算法	第39-40页
·网页噪音处理	第40-41页
·LUD 分类算法	第41-42页
·实验与结果	第42-49页
·实验组一	第42-44页
·实验组二	第44-47页
·实验组三	第47-49页
·小结	第49-51页
第六章总结与展望	第51-53页
·总结	第51页
·展望	第51-53页
致谢	第53-54页
参考文献	第54-58页
附录：作者在攻读硕士学位期间发表的论文	第58页