首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向Web站点的标签标识相关技术的研究与应用

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-14页
    1.1 研究背景和意义第10-11页
    1.2 网站标签标识的研究现状第11-12页
    1.3 研究内容第12-13页
    1.4 本文结构第13-14页
第二章 网站多标识相关技术第14-28页
    2.1 网络爬虫第14-16页
        2.1.1 网络爬虫原理第14-15页
        2.1.2 爬虫分类第15-16页
    2.2 网页去噪第16页
    2.3 Web信息抽取第16-18页
        2.3.1 信息抽取概述第16-17页
        2.3.2 信息抽取方法第17-18页
    2.4 文本分类技术第18-22页
        2.4.1 文本分类概述第18-19页
        2.4.2 文档表示模型第19-20页
        2.4.3 特征选择技术第20页
        2.4.4 文本分类技术第20-22页
    2.5 多标签算法第22-25页
    2.6 网站多标识系统的评价指标第25-28页
第三章 网站信息分析与挖掘第28-42页
    3.1 网页粒度分析第28-29页
    3.2 网站版块结构挖掘第29-33页
        3.2.1 站点结构第29-30页
        3.2.2 URL特征第30-31页
        3.2.3 拓扑结构与URL特征相结合的网站结构提取方法第31-33页
    3.3 网页正文内容挖掘第33-40页
        3.3.1 网页标题提取第34-35页
        3.3.2 网页正文提取第35-40页
    3.4 网站信息挖掘的基本流程第40-41页
        3.4.1 挖掘流程第40-41页
        3.4.2 实验结果分析第41页
    3.5 本章小结第41-42页
第四章 网站多标签第42-53页
    4.1 多标签分类常用数据集第42-43页
    4.2 网站多标签算法第43-44页
    4.3 属性加权ML-KNN算法S-ML-KNN第44-48页
        4.3.1 网站结构特征提取第44-47页
        4.3.2 属性加权的S-ML-KNN改进算法第47-48页
    4.4 网站标识的基本流程第48-50页
    4.5 实验结果及分析第50-51页
    4.6 本章小结第51-53页
第五章 网站标签标识系统的设计与实现第53-59页
    5.1 系统设计目标第53页
    5.2 系统架构第53-58页
        5.2.1 网站拓扑结构回溯模块第54-55页
        5.2.2 网页预处理模块第55-56页
        5.2.3 网站结构信息提取模块第56页
        5.2.4 网页正文抽取模块第56-57页
        5.2.5 网站多标签模块第57-58页
    5.3 系统性能分析第58-59页
第六章 总结与展望第59-61页
    6.1 总结第59-60页
    6.2 展望第60-61页
参考文献第61-65页
致谢第65-66页
攻读硕士学位期间主要研究成果第66页

论文共66页,点击 下载论文
上一篇:喷动床反应器内循环特性试验研究
下一篇:移动环境下序列推荐的研究