首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

改进的基于DIV迭代査找和信息增益的网页特征选择算法

摘要第8-9页
ABSTRACT第9-10页
第1章 网页分类技术概述第11-15页
    1.1 研究背景第11页
    1.2 国内外研究现状第11-13页
        1.2.1 文本分类的研究现状第11-12页
        1.2.2 网页分类的研究现状第12-13页
    1.3 本文研究内容及组织结构第13-15页
第2章 网页分类的相关技术第15-24页
    2.1 文本分类的过程第15页
    2.2 网页分类的过程第15-16页
    2.3 常用的网页分类技术第16-24页
        2.3.1 爬虫技术及网页结构第16-17页
        2.3.2 网页去噪第17页
        2.3.3 中文分词第17-18页
        2.3.4 去停用词第18页
        2.3.5 特征选择第18-21页
        2.3.6 文本表示第21-22页
        2.3.7 特征权值计算第22页
        2.3.8 网页分类的评价标准第22-24页
第3章 基于网页模板检测和DIV迭代查找的网页预处理第24-33页
    3.1 常用的网页去噪方法第24-25页
    3.2 基于结构相似和内容相似的网页模板检测第25-29页
    3.3 基于DIV迭代查找的网页主体信息提取第29-31页
    3.4 基于ICTCLAS分词系统进行中文分词第31-33页
第4章 网页特征的选择及其特征向量第33-39页
    4.1 基于关联性的特征选择第33-35页
    4.2 基于类别区分性的特征选择第35-37页
    4.3 特征词权重的计算方法及特征向量表示第37-38页
    4.4 基于网页特征向量的运行实例第38-39页
第5章 实验结果与分析第39-45页
    5.1 基于支持向量机的网页分类第39-40页
    5.2 基于网页模板检测和DIV迭代查找的网页预处理实验结果及分析第40-41页
        5.2.1 基于结构相似和内容相似的网页模板检测实验第40-41页
        5.2.2 基于DIV迭代查找的网页主体内容提取实验第41页
    5.3 网页特征的选择及其特征向量实验结果及分析第41-45页
        5.3.1 实验设置第41-42页
        5.3.2 基于关联性的特征选择实验第42-43页
        5.3.3 基于类别区分性的特性选择实验第43-45页
第6章 总结与展望第45-47页
    6.1 本文工作总结第45页
    6.2 下一步工作第45-47页
参考文献第47-51页
致谢第51-52页
附件第52页

论文共52页,点击 下载论文
上一篇:广府地区殿堂建筑木构架研究
下一篇:吡唑醚菌酯拌种防治小麦纹枯病的研究