首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于隐马尔科夫模型的维基词条编辑者行为分析及挖掘

摘要第3-4页
abstract第4页
第一章 绪论第8-13页
    1.1 课题研究的背景及意义第8页
    1.2 国内外相关领域研究现状第8-10页
        1.2.1 时间序列聚类研究发展分析第8-9页
        1.2.2 维基百科相关研究现状第9-10页
    1.3 本文的主要工作第10-11页
    1.4 论文的结构安排第11-12页
    1.5 本章小结第12-13页
第二章 相关知识概要第13-25页
    2.1 张量模型第13-17页
        2.1.1 张量的基本概念及公式第14-15页
        2.1.2 CP分解第15-16页
        2.1.3 Tucker分解第16-17页
        2.1.4 张量小结第17页
    2.2 时间序列的相似性度量第17-20页
        2.2.1 时间序列基本概念第17-18页
        2.2.2 欧几里德距离第18-19页
        2.2.3 动态时间规整第19-20页
        2.2.4 两种相似性度量算法的比较第20页
    2.3 隐马尔科夫模型第20-23页
        2.3.1 马尔科夫过程第20页
        2.3.2 隐马尔科夫模型的基本概念第20-22页
        2.3.3 隐马尔科夫模型的主要内容第22-23页
        2.3.4 隐马尔科夫模型的优缺点第23页
    2.4 本章小结第23-25页
第三章 张量模型下的维基词条数据分析第25-37页
    3.1 数据预处理第25-30页
        3.1.1 数据源描述第26-28页
        3.1.2 数据处理第28-30页
        3.1.3 构造稀疏张量第30页
    3.2 维基词条张量模型分解第30-32页
        3.2.1 稀疏张量数据库的建立第30-31页
        3.2.2 稀疏张量分解第31-32页
    3.3 基于张量分解用户行为分析第32-36页
        3.3.1 稀疏张量分解第32页
        3.3.2 张量分解结果分析第32-35页
        3.3.3 基于张量分解的用户行为分析第35-36页
    3.4 本章小结第36-37页
第四章 基于改进隐马尔科夫模型的用户行为分析及挖掘第37-49页
    4.1 基于DTW的K-medoids分段数据聚类第37-43页
        4.1.1 序列分段第37页
        4.1.2 版本分段数据相似性计算第37-41页
        4.1.3 基于DTW的K-medoids算法思想第41-43页
    4.2 混合隐马尔科夫模型第43-46页
        4.2.1 HMM模型的构造第43-44页
        4.2.2 基于序列后延概率的模型修正第44-45页
        4.2.3 迭代增量式模型修正第45-46页
    4.3 基于隐马尔科夫模型的维基词条编辑行为分析算法第46-48页
        4.3.1 用户群体编辑行为挖掘算法原理分析第46-47页
        4.3.2 算法中所涉及的函数第47-48页
    4.4 本章小结第48-49页
第五章 用户群体编辑行为挖掘算法实验与分析第49-57页
    5.1 实验准备第49-50页
        5.1.1 样本选取说明第49页
        5.1.2 实验环境描述第49页
        5.1.3 实验数据处理第49-50页
    5.2 实验运行速度分析第50-51页
    5.3 聚类对比实验分析第51-53页
    5.4 聚类实验效果分析第53-56页
    5.5 实验结果总结第56-57页
第六章 结论与展望第57-59页
    6.1 结论第57页
    6.2 展望第57-59页
参考文献第59-63页
作者在读期间科研成果简介第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于深度学习的对象实体相似度研究
下一篇:乌金体梵音藏文古籍字丁样本库的设计及构建