首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站内容多标签标识关键技术研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-15页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 本文的研究内容第13页
    1.4 本文结构第13-15页
第二章 网站内容多标签标识相关技术第15-26页
    2.1 网站资源获取第15-16页
        2.1.1 下载页面资源第15-16页
        2.1.2 页面资源预处理第16页
        2.1.3 关键信息处理第16页
    2.2 信息的展示方式第16-18页
        2.2.1 空间向量表示法第17-18页
        2.2.2 表、图、树表示法第18页
    2.3 文本分类技术第18-22页
        2.3.1 单标签分类第18-20页
        2.3.2 多标签分类第20-22页
    2.4 标签标识的评价指标第22-24页
        2.4.1 文本分类的衡量指标第22-24页
        2.4.2 网站内容多标签标识系统中其他特有的评价指标第24页
    2.5 网站内容多标签标识的关键技术第24-25页
    2.6 本章总结第25-26页
第三章 网站信息层次提取第26-39页
    3.1 相关研究现状第26-27页
    3.2 网络资源抓取第27-28页
        3.2.1 爬虫系统第27页
        3.2.2 资源抓取规则第27-28页
    3.3 正文提取第28-30页
    3.4 页面相异度第30-32页
        3.4.1 URL相异度第30-31页
        3.4.2 正文相异度第31-32页
        3.4.3 页面相异度第32页
    3.5 构建四元组集第32-34页
    3.6 实验设置第34-35页
    3.7 实验结果第35-37页
        3.7.1 采用本文算法的实验结果第35-36页
        3.7.2 采用基于站点链接结构的站点主题层次结构抽取算法的结果第36-37页
    3.8 本章小结第37-39页
第四章 标签库的构建第39-51页
    4.1 相关研究现状第39-43页
        4.1.1 文献分类法第40-42页
        4.1.2 标签分类法第42-43页
    4.2 复合式等级结构第43-49页
        4.2.1 标签库的结构第44-45页
        4.2.2 主题子标签库第45-48页
        4.2.3 其他子标签库第48-49页
    4.3 多标签标识算法第49-50页
        4.3.1 主题子库的一、二级标签标识第49-50页
        4.3.2 主题子库的三级标签标识第50页
    4.4 本章小结第50-51页
第五章 多标签标识的实验设计与结果分析第51-57页
    5.1 系统设计目标第51页
    5.2 实验设计第51-52页
        5.2.1 数据来源第51页
        5.2.2 实验数据的获取第51-52页
        5.2.3 试验评价标准第52页
    5.3 实验过程第52-54页
        5.3.1 数据爬取第53页
        5.3.2 信息层次结构提取第53页
        5.3.3 多标签标识第53-54页
    5.4 实验结果第54页
    5.5 实验结果分析第54-57页
第六章 总结及展望第57-59页
    6.1 论文工作总结第57页
    6.2 后续研究工作第57-59页
参考文献第59-62页
致谢第62-63页
攻读学位期间发表的学术论文目录第63页

论文共63页,点击 下载论文
上一篇:基于复杂网络的信息流传输优化研究
下一篇:面向服务的网管通知订阅、组播和编码自动化