基于点击的用户聚类的研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章引言	第9-14页
·课题研究的背景和意义	第9-10页
·国内外研究现状	第10-12页
·本文主要研究内容	第12-14页
第二章建设语料库所需技术及其软件	第14-20页
·语料库简介	第14-16页
·概述	第14-15页
·建设Web 语料库的环节	第15页
·原理和实现	第15-16页
·网页获取技术	第16-17页
·网络爬虫工具	第17-19页
·Wget 爬虫工具的优点	第17页
·Wget 使用的语法及基本参数	第17-19页
·本章小结	第19-20页
第三章个性化数据采集过程及其方法	第20-37页
·建立语料库	第20-22页
·数据采集流程	第22-23页
·匹配过滤	第23-25页
·网页抓取	第25-29页
·标记日志	第29-32页
·格式化处理	第32-36页
·本章小结	第36-37页
第四章传统用户兴趣模型的研究	第37-45页
·用户兴趣模型的创建	第37-38页
·基于内容的方法	第37页
·基于分类的方法	第37-38页
·基于概率的方法	第38页
·用户兴趣模型的更新	第38页
·流程实现	第38-39页
·用户兴趣挖掘系统功能的实现	第39-43页
·系统构成	第39-40页
·日志清理	第40-41页
·建立索引与下载网页	第41页
·正文抽取	第41-42页
·特征提取	第42-43页
·文档聚类生成用户兴趣模型	第43页
·本章小结	第43-45页
第五章基于点击的用户兴趣聚类	第45-54页
·传统兴趣模型的缺点	第45-47页
·模型更新问题	第45-46页
·兴趣分类问题	第46-47页
·评价方法问题	第47页
·基于点击的用户聚类	第47-52页
·聚类分析在用户分类中的应用	第48-50页
·基于点击的个性化信息服务方案	第50-51页
·基于点击方法的分类	第51-52页
·前期工作小结	第52-53页
·本章小结	第53-54页
第六章实验结果与软件测试	第54-62页
·实验环境	第54页
·数据采集报告	第54-55页
·系统功能要求	第55-56页
·系统输入	第55页
·系统输出	第55-56页
·软件测试	第56-60页
·原始数据的处理	第56页
·数据分类	第56-57页
·数据再处理	第57页
·建立索引	第57-59页
·用户聚类	第59-60页
·测试结果	第60-61页
·本章小结	第61-62页
第七章结论	第62-64页
致谢	第64-65页
参考文献	第65-69页