| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 目录 | 第7-9页 |
| 第一章 绪论 | 第9-14页 |
| ·互联网业务发展状况 | 第9-10页 |
| ·研究背景和意义 | 第10-11页 |
| ·本文的主要工作 | 第11-12页 |
| ·本文的组织结构 | 第12-14页 |
| 第二章 网络用户行为分析的相关研究 | 第14-24页 |
| ·网络用户行为相关概念释义 | 第14-16页 |
| ·网络用户行为定义 | 第14页 |
| ·网络用户行为的特点 | 第14-15页 |
| ·网络用户行为的分类 | 第15-16页 |
| ·网络用户行为的提取和表示 | 第16-20页 |
| ·网络用户行为特征值的选择 | 第16-18页 |
| ·卡方统计量(CHI)特征提取算法 | 第18-19页 |
| ·网络用户行为表示方法 | 第19-20页 |
| ·网络行为分析中的相关技术介绍 | 第20-23页 |
| ·数据挖掘技术 | 第20-21页 |
| ·聚类分析 | 第21-22页 |
| ·孤立点分析 | 第22页 |
| ·流量分析与网络流量技术 | 第22-23页 |
| ·本章小结 | 第23-24页 |
| 第三章 改进的K-means聚类算法 | 第24-34页 |
| ·聚类算法的概念 | 第24-25页 |
| ·聚类算法的分类 | 第25-27页 |
| ·基于层次的聚类算法 | 第25页 |
| ·基于密度的聚类算法 | 第25-26页 |
| ·基于划分的聚类算法 | 第26页 |
| ·基于网格的聚类算法 | 第26页 |
| ·模糊聚类算法 | 第26-27页 |
| ·距离与相似性度量 | 第27-28页 |
| ·明可夫斯基(Minkowski)距离 | 第27页 |
| ·二次型距离(Quadratic) | 第27-28页 |
| ·二元特征样本距离 | 第28页 |
| ·K-均值聚类算法 | 第28-31页 |
| ·K-均值算法定义 | 第28-29页 |
| ·K-均值划分聚类方法的要求 | 第29-30页 |
| ·K-均值值算法的性能分析 | 第30-31页 |
| ·ISODATA算法 | 第31-33页 |
| ·ISODATA算法与K-means聚类算法的比较 | 第31页 |
| ·ISODATA算法步骤和基本思想 | 第31-33页 |
| ·改进的K-均值算法 | 第33页 |
| ·K-mode算法 | 第33页 |
| ·K-prototype算法 | 第33页 |
| ·本章小结 | 第33-34页 |
| 第四章 贝叶斯理论方法与模型建立 | 第34-47页 |
| ·引言 | 第34页 |
| ·理论基础 | 第34-36页 |
| ·概率论基础与相关定义 | 第34-35页 |
| ·贝叶斯公式 | 第35页 |
| ·关于假设的定义 | 第35-36页 |
| ·相互独立事件 | 第36页 |
| ·图论基础 | 第36-37页 |
| ·贝叶斯分类器 | 第37-46页 |
| ·朴素贝叶斯分类模型(NBC) | 第37-40页 |
| ·半朴素贝叶斯分类模型(SNBC) | 第40-42页 |
| ·树增强朴素贝叶斯分类模型(TAN) | 第42-44页 |
| ·NBTree(A Naive Bayes/Decision—Tree Hybrid) | 第44页 |
| ·加权朴素贝叶斯分类模型(FWNBC) | 第44-46页 |
| ·本章小结 | 第46-47页 |
| 第五章 网络用户身份识别模型 | 第47-54页 |
| ·实现目标 | 第47页 |
| ·实验平台 | 第47-48页 |
| ·数据采集 | 第48-49页 |
| ·数据分析及特征提取 | 第49-51页 |
| ·用户识别 | 第51-53页 |
| ·本章小结 | 第53-54页 |
| 第六章 总结与展望 | 第54-55页 |
| 参考文献 | 第55-57页 |
| 致谢 | 第57-58页 |
| 攻读硕士学位期间发表的学术论文目录 | 第58页 |