首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

人物信息相关网页过滤方法研究

摘要第4-5页
abstract第5-6页
缩略词表第11-12页
第一章 绪论第12-17页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-15页
        1.2.2 网页主题文本抽取第13-14页
        1.2.3 网页分类第14-15页
    1.3 本文主要工作与贡献第15-16页
    1.4 本文组织结构第16-17页
第二章 网页数据预处理相关技术第17-27页
    2.1 数据采集第17-19页
    2.2 网页去噪第19-21页
        2.2.1 网页去重第19页
        2.2.2 页内噪声去除第19-21页
    2.3 网页过滤方法第21-26页
        2.3.1 网页特征提取第21-22页
        2.3.2 网页表示第22页
        2.3.3 网页特征选择第22-24页
        2.3.4 支持向量机算法第24-25页
        2.3.5 网页过滤评价标准第25-26页
    2.4 本章小结第26-27页
第三章 基于DOM节点路径特征的潜在人物信息文本抽取方法第27-46页
    3.1 算法概述第27-28页
    3.2 节点路径第28-31页
        3.2.1 噪声标签过滤第29-30页
        3.2.2 节点路径定义第30-31页
    3.3 潜在人物信息正文文本抽取第31-41页
        3.3.1 节点路径特征系建立第31-33页
        3.3.2 节点路径聚类第33-36页
        3.3.3 正文类簇选择第36-38页
        3.3.4 簇内节点路径经验性调整第38-40页
        3.3.5 正文节点路径文本抽取第40-41页
    3.4 实验及方法评估第41-45页
        3.4.1 实验数据集第41-42页
        3.4.2 实验评估方法第42页
        3.4.3 实验结果及分析第42-45页
    3.5 本章小结第45-46页
第四章 基于人物信息触发词特征的网页过滤方法第46-71页
    4.1 算法概述第46-47页
    4.2 人物信息网页数据源获取及标注第47-51页
        4.2.1 人物信息网页数据采集第47-49页
        4.2.2 人物信息网页类型标注第49-51页
    4.3 数据预处理第51-61页
        4.3.1 网页预处理第52-54页
        4.3.2 文本预处理第54-61页
    4.4 人物信息网页特征构建第61-66页
        4.4.1 人物属性触发词特征第61-66页
        4.4.2 人物信息网页结构特征第66页
    4.5 实验及方法评估第66-70页
        4.5.1 实验数据集第67页
        4.5.2 实验结果及分析第67-70页
    4.6 本章小结第70-71页
第五章 总结与展望第71-73页
    5.1 工作总结第71-72页
    5.2 工作展望与不足第72-73页
致谢第73-74页
参考文献第74-77页
攻读硕士学位期间取得的研究成果第77页

论文共77页,点击 下载论文
上一篇:基于单电极脑电信号的身份识别系统研究与实现
下一篇:基于达芬奇平台的人脸识别技术的研究和实现