首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站日志的数据挖掘

中文摘要第4-5页
英文摘要第5页
1 绪论第9-12页
    1.1 论文的研究背景及选题意义第9-10页
    1.2 国内外的现状综述第10页
    1.3 论文的研究内容第10-12页
2 面向INTERNET的数据挖掘第12-16页
    2.1 WEB内容挖掘第12-13页
    2.2 WEB结构挖掘第13-14页
    2.3 WEB使用记录挖掘第14页
    2.4 XML在数据挖掘中的应用第14-16页
3 WEB日志挖掘的分析和研究第16-26页
    3.1 WEB术语第16页
    3.2 WEB挖掘的原始数据源第16-17页
        3.2.1 内容数据第16页
        3.2.2 结构数据第16-17页
        3.2.3 网站访问数据第17页
        3.2.4 用户注册数据第17页
        3.2.5 WEB使用记录挖掘数据源分析第17页
    3.3 常用的挖掘算法第17-23页
        3.3.1 统计分析第18页
        3.3.2 关联规则第18-19页
        3.3.3 序列模式第19-20页
        3.3.4 聚类第20-21页
        3.3.5 分类第21-23页
    3.4 WEB挖掘的基本框架第23-24页
    3.5 网站日志预处理第24-26页
4 APRIORI算法分析与研究第26-36页
    4.1 基本概念与定义第26-29页
    4.2 算法描述第29页
    4.3 频繁项集挖掘算法伪代码第29-30页
    4.4 规则挖掘算法伪代码第30-31页
    4.5 算法改进第31-33页
        4.5.1 基于散列技术第32页
        4.5.2 事务压缩第32页
        4.5.3 划分技术第32页
        4.5.4 选样技术第32-33页
        4.5.5 动态项集计数第33页
        4.5.6 频繁模式增长方法第33页
    4.6 apriori算法应用于网站日志挖掘第33-36页
        4.6.1 网站日志数据的清理第33-35页
        4.6.2 挖掘的针对性第35页
        4.6.3 apriori算法优化的选择第35-36页
5 WEB日志挖掘在重庆电视台互联网站日志数据中的应用第36-41页
    5.1 重庆电视台网站简介第36页
    5.2 数据源第36-37页
        5.2.1 网站拓扑结构数据第36页
        5.2.2 日志数据第36-37页
        5.2.3 网站资源文件第37页
    5.3 日志预处理第37-38页
        5.3.1 数据清理第37-38页
        5.3.2 事务识别第38页
        5.3.3 数据转换第38页
    5.4 模式发现第38-39页
    5.5 模式评价第39-41页
6 论文总结第41-42页
    6.1 论文的主要工作第41页
    6.2 进一步努力的方向第41-42页
致谢第42-43页
参考文献第43-45页

论文共45页,点击 下载论文
上一篇:赵州南山大法藏寺碑考释
下一篇:云南工科专业大学生英语二语动机自我系统研究