首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于邻接特征的网页主题传播算法

中文摘要第6-7页
英文摘要第7-8页
第一章 绪论第11-18页
    1.1 研究背景及意义第11-13页
    1.2 研究现状及问题第13-16页
    1.3 本文的研究内容第16-17页
    1.4 本文的组织结构第17-18页
第二章 主题模型和标签传播相关介绍第18-30页
    2.1 引言第18页
    2.2 文本主题模型相关介绍第18-26页
        2.2.1 潜在语义分析第19页
        2.2.2 概率潜在语义分析第19-23页
        2.2.3 潜在狄利克雷分配第23-26页
    2.3 标签传播相关介绍第26-29页
        2.3.1 标签传播基本理论第26-28页
        2.3.2 标签传播的应用第28-29页
    2.4 本章小结第29-30页
第三章 网页的特征选择和表示第30-47页
    3.1 引言第30-31页
    3.2 网页的页面特征第31-33页
        3.2.1 文本属性第31页
        3.2.2 标签属性第31-32页
        3.2.3 可视化分析第32-33页
    3.3 网页的邻接特征第33-38页
        3.3.1 潜在假设第33-34页
        3.3.2 邻接页面第34-37页
        3.3.3 邻接特征第37-38页
    3.4 网页的其他特征第38-39页
    3.5 特征选择及表示第39-42页
        3.5.1 文本形式的页面特征第39-40页
        3.5.2 虚拟节点和虚拟链接第40-42页
    3.6 实验第42-46页
        3.6.1 邻接网页类型的选择第42-44页
        3.6.2 虚拟节点的有效性第44-46页
    3.7 本章小结第46-47页
第四章 基于邻接特征的网页主题传播算法第47-65页
    4.1 引言第47-48页
    4.2 数据采集第48-50页
        4.2.1 正文网页的判定第49-50页
        4.2.2 网页的特征提取第50页
    4.3 数据预处理第50-53页
        4.3.1 中文分词第51页
        4.3.2 网页去重第51页
        4.3.3 去除无效网页和无效链接第51-53页
    4.4 基于邻接特征的网页主题传播算法第53-60页
        4.4.1 基于超链接的有向图构建第53-54页
        4.4.2 构造虚拟节点和虚拟链接第54-57页
        4.4.3 计算节点的初始主题分布第57-58页
        4.4.4 网页主题分布的传播第58-60页
    4.5 实验第60-64页
        4.5.1 实验设置第60页
        4.5.2 实验结果与分析第60-64页
    4.6 本章小结第64-65页
第五章 总结与展望第65-67页
    5.1 本文工作总结第65-66页
    5.2 不足与展望第66-67页
参考文献第67-71页
致谢第71-72页
附录第72-73页

论文共73页,点击 下载论文
上一篇:车用材料PMMA的激光透射点焊实验研究及数值模拟
下一篇:基于ROP技术的二进制混淆技术研究