首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于半监督的网页分类

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-13页
    1.1 课题背景第8页
    1.2 课题目的及意义第8-9页
    1.3 国内外相关技术发展现状第9-12页
        1.3.1 文本分类技术的发展第9-10页
        1.3.2 半监督学习的发展第10-11页
        1.3.3 半监督文本分类的不足第11-12页
    1.4 本文的主要研究内容和组织结构第12-13页
第2章 半监督文本分类关键技术第13-25页
    2.1 半监督学习的 PAC 模型第13-18页
    2.2 文本标引和特征降维第18-23页
        2.2.1 文本的特征选择方法第19-21页
        2.2.2 文本的特征抽取方法第21-23页
    2.3 评估第23-24页
    2.4 本章小结第24-25页
第3章 半监督分类器与特征选择第25-40页
    3.1 基于 EM 的半监督分类器算法实现第25-26页
    3.2 基于 TSV M 的半监督分类器实现第26-28页
    3.3 基于 D B N 的半监督分类器实现第28-30页
    3.4 基于宏特征的文本特征抽取第30-33页
    3.5 正文提取第33-35页
    3.6 语言过滤第35-38页
    3.7 网页筛选第38-39页
    3.8 本章小结第39-40页
第4章 系统的设计与实现第40-44页
    4.1 半监督文本分类实验平台第40-41页
    4.2 网页处理系统第41-42页
    4.3 半监督分类器与特征模块第42-43页
    4.4 本章小结第43-44页
第5章 实验评测与结果分析第44-55页
    5.1 实验目的第44页
    5.2 评测方法第44页
    5.3 半监督分类器在向量数据集上的横向比较第44-45页
        5.3.1 实验数据集第45页
        5.3.2 实验结果及分析第45页
    5.4 特征选择方法对半监督文本分类的影响第45-51页
        5.4.1 实验数据集第45-46页
        5.4.2 EM实验结果第46页
        5.4.3 EM实验分析第46-47页
        5.4.4 TSVM实验结果第47-48页
        5.4.5 TSVM 实验分析第48页
        5.4.6 DBN 实验结果第48页
        5.4.7 DBN 实验分析第48-49页
        5.4.8 宏特征对半监督分类性能的影响第49-50页
        5.4.9 半监督算法在小数据集上的分类特点第50-51页
    5.5 半监督文本分类应用到大规模网页分类的效果第51-54页
        5.5.1 实验数据集第51-52页
        5.5.2 实验内容第52-53页
        5.5.3 实验结果及分析第53-54页
        5.5.4 半监督分类在大规模网页数据集上的缺陷第54页
    5.6 本章小结第54-55页
结论第55-56页
参考文献第56-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:敖南地区扶余油层水平井开发适应性研究
下一篇:机顶盒外围设备低功耗低成本技术的研究