首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于短文本的Web日志挖掘系统的设计与实现

摘要第4-5页
abstract第5-6页
第一章 绪论第13-21页
    1.1 研究背景与意义第13-14页
    1.2 国内外研究现状第14-18页
        1.2.1 国外研究现状第14-17页
        1.2.2 国内研究现状第17-18页
    1.3 论文主要工作第18-19页
    1.4 论文的组织结构第19-21页
第二章 相关理论及技术研究第21-35页
    2.1 数据挖掘技术的研究第21-23页
        2.1.1 数据挖掘的定义及常用技术第21-22页
        2.1.2 数据挖掘流程第22-23页
    2.2 Web日志挖掘技术研究第23-25页
    2.3 短文本聚类技术研究第25-33页
        2.3.1 短文本相关简介第25-26页
        2.3.2 文本表示模型第26-30页
        2.3.3 文本聚类第30-33页
        2.3.4 文本主题描述第33页
    2.4 系统总体分析及设计第33-34页
    2.5 本章小结第34-35页
第三章 基于MB-kmeans++算法的用户会话聚类第35-60页
    3.1 日志数据预处理第35-36页
    3.2 用户会话识别与相似性度量第36-47页
        3.2.1 用户会话识别第36-38页
        3.2.2 用户行为相似性计算方法第38-41页
        3.2.3 Web页面的相似性度量第41-43页
        3.2.4 加权的用户离散访问矩阵构造第43-45页
        3.2.5 用户会话相似性度量第45-47页
    3.3 改进的k-means算法第47-53页
        3.3.1 k-means算法介绍第48-49页
        3.3.2 k-means++算法初始选点策略第49-51页
        3.3.3 基于少量抽样的kmeans++改进算法第51-53页
    3.4 基于MB-kmeans++算法的Web用户会话聚类第53-54页
    3.5 实验结果分析第54-59页
        3.5.1 实验数据集第54-56页
        3.5.2 聚类结果分析第56-59页
    3.6 本章小结第59-60页
第四章 基于融合BTM主题模型的日志挖掘第60-80页
    4.1 文本预处理第60-61页
        4.1.1 分词技术第60-61页
        4.1.2 去掉停用词第61页
    4.2 BTM主题模型第61-66页
        4.2.1 BTM模型原理第61-64页
        4.2.2 Gibbs采样第64-66页
    4.3 短文本向量表示和相似度计算第66-68页
        4.3.1 短文本向量表示第66-67页
        4.3.2 TF-IDF加权原理第67页
        4.3.3 文本相似度计算第67-68页
    4.4 基于主题结构优化的聚类算法第68-71页
    4.5 基于融合BTM模型的短文本主题聚类第71-73页
    4.6 实验结果分析第73-79页
        4.6.1 实验数据集第73页
        4.6.2 实验结果分析第73-79页
    4.7 本章小结第79-80页
第五章 系统实现及验证分析第80-89页
    5.1 系统平台设计第80-84页
        5.1.1 系统总体框架第81-83页
        5.1.2 模块结构设计第83-84页
    5.2 系统实现第84-88页
        5.2.1 日志数据存储第84-85页
        5.2.2 日志预处理第85-86页
        5.2.3 用户会话聚类第86-87页
        5.2.4 短文本聚类第87-88页
    5.3 本章小结第88-89页
第六章 总结与展望第89-91页
    6.1 总结第89页
    6.2 展望第89-91页
致谢第91-92页
参考文献第92-96页
攻读硕士学位期间取得的研究成果第96页

论文共96页,点击 下载论文
上一篇:基于频率调谐显著和多尺度线性滤波的疵点分割方法研究
下一篇:在线问答社区推荐算法研究