首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Markov随机游走的渐进式半监督文本分类研究

摘要第3-4页
Abstract第4-5页
1 引言第8-11页
    1.1 研究背景及研究意义第8-9页
    1.2 本文工作第9-10页
    1.3 本文的内容组织第10-11页
2 半监督学习第11-22页
    2.1 半监督学习的概念及意义第11-12页
    2.2 半监督学习的研究现状第12-13页
    2.3 半监督学习的算法第13-21页
        2.3.1 Co-training 算法第14-16页
        2.3.2 Self–training第16-17页
        2.3.3 半监督支持向量机第17-19页
        2.3.4 基于图的方法第19-21页
    2.4 本章小结第21-22页
3 文本分类关键技术第22-38页
    3.1 文本分类问题描述第22-25页
        3.1.1 文本分类的定义第22-23页
        3.1.2 文本自动分类系统第23-25页
    3.2 文本预处理第25-27页
        3.2.1 去除文档中的格式标记第25页
        3.2.2 过滤非法字符和字母大小写转换第25页
        3.2.3 去除停用词、稀有词和词干化处理第25-26页
        3.2.4 中文分词第26-27页
    3.3 文本表示模型第27-29页
    3.4 几种文本特征选择方法第29-31页
        3.4.1 信息增益第29页
        3.4.2 期望交叉熵第29-30页
        3.4.3 互信息(MI)第30页
        3.4.4 基于文档频率(Document Frequency,DF)的方法第30-31页
        3.4.5 χ~2统计量第31页
    3.5 常用的文本分类方法---文本分类方法第31-35页
        3.5.1 K 近邻第31-32页
        3.5.2 Rocchio 分类方法算法第32-33页
        3.5.3 支持向量机第33-34页
        3.5.4 朴素贝叶斯第34-35页
    3.6 分类器性能评估第35-37页
    3.7 本章小结第37-38页
4. 基于 MARKOV 随机游走的渐进式半监督文本分类研究第38-43页
    4.1 MARKOV 随机游走图的生成第38-39页
    4.2 基于 MARKOV 随机游走半监督分类模型第39-40页
    4.3 加入渐进学习思想的半监督 MARKOV 随机游走模型第40-42页
    4.4 本章小节第42-43页
5 实验设计及结果分析第43-48页
    5.1 实验准备第43页
    5.2 实验设计第43页
        5.2.1 初始点的选择第43页
        5.2.2 对比试验设计第43页
    5.3 参数调整第43-45页
        5.3.1 剪枝邻接点数k 的选择第44页
        5.3.2 衰减函数参数α值的选择第44-45页
        5.3.3 最优游走步数t的选择第45页
    5.4 实验结果及分析第45-47页
    5.5 本章小结第47-48页
6 总结与展望第48-49页
    6.1 总结第48页
    6.2 未来工作第48-49页
参考文献第49-55页
简历第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:IPv6与IPv4互通性能的研究
下一篇:基于聚类的Java包重构技术研究及实现