改进的聚类挖掘算法对网络自助出版“长尾”文本的推荐应用
中文摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
引言 | 第7-8页 |
第一章 绪论 | 第8-14页 |
第一节 数据挖掘理论研究 | 第8-14页 |
一、数据挖掘 | 第8-11页 |
(一) 数据挖掘的定义 | 第8-9页 |
(二) 数据挖掘的方法 | 第9-10页 |
(三) 数据挖掘的流程 | 第10页 |
(四) Web挖掘研究 | 第10-11页 |
二、文本聚类 | 第11-13页 |
(一) 聚类综述 | 第11-12页 |
(二) 文本聚类的方法 | 第12-13页 |
三、本文研究内容和结构安排 | 第13-14页 |
第二章 基于有向图的聚类算法 | 第14-24页 |
第一节 自助出版与长尾理论研究 | 第14-16页 |
第二节 基于有向无环图的长尾聚类算法描述 | 第16-24页 |
一、问题研究 | 第16-17页 |
二、算法基本思想 | 第17-19页 |
(一) 算法形式化定义 | 第17页 |
(二) 节点权重计算 | 第17-18页 |
(三) 相似度计算与记录集合并 | 第18-19页 |
三、基于有向无环图的长尾聚类算法代码实现 | 第19-21页 |
四、算法性能测试 | 第21-24页 |
(一) 基准数据集准备 | 第21页 |
(二) 算法性能评价标准 | 第21-22页 |
(三) 测试结果与分析 | 第22-24页 |
第三章 个性化推荐系统分析与总体设计 | 第24-39页 |
第一节 系统背景介绍 | 第24-28页 |
一、个性化推荐服务发展历程 | 第24-25页 |
(一) 国外个性化服务研究历程 | 第24-25页 |
(二) 国内个性化服务的研究历程 | 第25页 |
二、个性化推荐系统研究现状 | 第25-28页 |
(一) 个性化推荐系统研究现状概述 | 第25-26页 |
(二) 个性化系统代表性推荐技术介绍 | 第26-27页 |
(三) 目前方法存在的问题 | 第27-28页 |
第二节 推荐系统结构设计 | 第28-31页 |
一、推荐系统总体架构 | 第28-29页 |
二、推荐系统功能模块设计 | 第29-31页 |
(一) 系统被动推荐模块 | 第29页 |
(二) 系统主动推荐模块 | 第29-31页 |
第三节 推荐系统运行流程 | 第31-36页 |
一、Web源数据预处理 | 第31-34页 |
(一) 数据清洗 | 第31页 |
(二) 识别客户访问事务 | 第31-32页 |
(三) 偏好数据库构造 | 第32-34页 |
二、推荐列表生成 | 第34-36页 |
第四节 个性化推荐系统应用实例 | 第36-39页 |
一、推荐系统需求分析 | 第36页 |
二、开发环境和工具 | 第36页 |
三、推荐系统评估标准 | 第36-37页 |
四、应用试验结果分析 | 第37-39页 |
(一) 系统性能评价 | 第37-38页 |
(二) 系统面临的挑战和研究方向 | 第38-39页 |
第四章 总结和展望 | 第39-41页 |
参考文献 | 第41-45页 |
后记 | 第45-46页 |