基于类短语串和半监督学习的短文本分类研究

摘要	第1-7页
ABSTRACT	第7-13页
1 绪论	第13-20页
·课题研究的背景	第13-14页
·课题研究的意义	第14-15页
·短文本的语言特征	第15-17页
·国内外研究现状	第17-18页
·本文的工作及创新点	第18-19页
·论文的组织结构	第19-20页
2 文本分类中的半监督学习综述	第20-31页
·文本表示模型	第20-24页
·文本特征	第21-22页
·文本表示	第22-24页
·文本分类的监督学习算法	第24-28页
·朴素贝叶斯分类方法	第24-26页
·最大熵方法	第26页
·K最近邻分类	第26-27页
·神经网络	第27页
·支持向量机	第27-28页
·基于小规模标注语料的半监督学习	第28-30页
·生成式模型	第28-29页
·协同训练算法	第29-30页
·直推式学习	第30页
·本章小结	第30-31页
3 基于类短语串的短文本特征选择	第31-45页
·传统文本表示模型的不足	第31-32页
·类短语串的概念及界定	第32-35页
·相关定义	第32-33页
·类短语串的定义	第33页
·类短语串的界定	第33-35页
·基于类短语串的特征表示	第35-36页
·基于类短语串的特征选择	第36-39页
·常用特征选择方法	第37-38页
·结合文档频次和互信息量的特征选择方法	第38-39页
·实验结果与分析	第39-43页
·语料库	第39页
·评价指标	第39-41页
·实验设计	第41页
·实验结果及分析	第41-43页
·本章小结	第43-45页
4 嵌入集成学习的半监督EM短文本分类算法	第45-59页
·半监督的EM算法	第45-47页
·标准EM算法	第45-46页
·半监督的EM文本分类算法	第46-47页
·基于属性选择的集成学习	第47-52页
·常用属性选择方法	第47-50页
·基于ReliefF评估和独立性度量的属性选择	第50-52页
·基于属性选择的贝叶斯分类器集成	第52页
·嵌入集成学习的半监督EM短文本分类算法	第52-54页
·算法设计思路	第52-53页
·算法具体介绍	第53-54页
·实验结果与分析	第54-58页
·实验设计	第54页
·实验结果与分析	第54-58页
·本章小结	第58-59页
5 基于PLR和FB-EM的BBS话题跟踪系统	第59-64页
·话题跟踪综述	第59页
·基于PLR和FB-EM的BBS话题跟踪系统	第59-61页
·应用实验	第61-63页
·实验设计	第61页
·系统具体功能	第61-63页
·实验结果分析	第63页
·本章小结	第63-64页
6 结束语	第64-66页
·全文总结	第64-65页
·工作展望	第65-66页
参考文献	第66-69页
致谢	第69-70页
论文及科研情况	第70页
发表的论文	第70页
参与的科研项目	第70页