摘要 | 第1-4页 |
Abstract | 第4-8页 |
1 绪论 | 第8-16页 |
·本文研究的背景 | 第8-10页 |
·本文研究的目的与意义 | 第10页 |
·Web文本挖掘概述 | 第10-13页 |
·Web文本挖掘的定义 | 第11页 |
·Web文本挖掘任务 | 第11页 |
·Web文本挖掘的研究现状 | 第11-13页 |
·网站推荐系统概述 | 第13-14页 |
·本文的研究内容 | 第14-15页 |
·本文的组织结构 | 第15-16页 |
2 基于Web挖掘技术的推荐原理 | 第16-23页 |
·基于WEB挖掘技术的推荐流程 | 第16-18页 |
·改进的推荐模块的建立 | 第18-20页 |
·概述 | 第18页 |
·推荐模型的结构 | 第18-19页 |
·推荐模型的说明与分析 | 第19-20页 |
·推荐算法概述 | 第20-21页 |
·本章小结 | 第21-23页 |
3 基于网络爬虫的DOM树Web文档结构解析 | 第23-36页 |
·WEB页面结构化的背景及相关工作 | 第23-24页 |
·网络爬虫原理 | 第24-26页 |
·工作原理及关键技术 | 第24-25页 |
·网页搜索策略 | 第25页 |
·网页分析算法 | 第25-26页 |
·基于DOM树的页面分块 | 第26-34页 |
·DOM树的定义 | 第26-27页 |
·基于内容比重的DOM树页面分块 | 第27-34页 |
·基于DOM树的网页信息提取 | 第34页 |
·本章小结 | 第34-36页 |
4 基于WEB文本内容的聚类研究 | 第36-48页 |
·文本聚类的一般步骤 | 第36页 |
·文本特征的建模 | 第36-38页 |
·聚类方法介绍 | 第38-42页 |
·K均值算法 | 第39-40页 |
·BIRCH算法 | 第40页 |
·DBSCAN算法 | 第40-42页 |
·STING算法 | 第42页 |
·利用近似EMD距离精确聚类结果 | 第42-45页 |
·EMD距离 | 第42-43页 |
·近似EMD距离 | 第43-44页 |
·基于近似EMD距离的DBSCAN改进算法 | 第44-45页 |
·实验结果及解析 | 第45-47页 |
·本章小结 | 第47-48页 |
5 基于用户的协同过滤推荐与加权关联规则相结合的推荐研究 | 第48-62页 |
·基于用户的协同过滤推荐机制 | 第48-51页 |
·关联规则原理 | 第51-53页 |
·Apriori关联规则经典算法解析 | 第53-55页 |
·Apriori算法描述 | 第53-54页 |
·Apriori算法瓶颈 | 第54页 |
·算法改进 | 第54-55页 |
·基于加权关联规则的协同推荐改进算法 | 第55-58页 |
·基于推荐内容的加权关联规则 | 第55页 |
·加权关联规则生成算法 | 第55-57页 |
·IWAR-CF算法 | 第57-58页 |
·实验结果及解析 | 第58-61页 |
·本章小结 | 第61-62页 |
6 全文总结与未来展望 | 第62-63页 |
·全文总结 | 第62页 |
·未来展望 | 第62-63页 |
致谢 | 第63-64页 |
参考文献 | 第64-68页 |
附录 | 第68页 |