Web挖掘技术及其在互联网中的应用研究
中文摘要 | 第10-12页 |
ABSTRACT | 第12-13页 |
符号说明 | 第14-15页 |
第一章 绪论 | 第15-20页 |
§1.1 研究背景 | 第15-16页 |
§1.2 研究现状 | 第16-17页 |
§1.3 技术难点 | 第17-18页 |
§1.4 论文结构 | 第18-19页 |
§1.5 本章小结 | 第19-20页 |
第二章 Web挖掘理论基础 | 第20-32页 |
§2.1 数据挖掘与机器学习技术 | 第20-23页 |
2.1.1 数据挖掘的概述 | 第20-21页 |
2.1.2 机器学习的概述 | 第21页 |
2.1.3 数据挖掘的实现过程和技术分类 | 第21-23页 |
§2.2 Web挖掘技术 | 第23-25页 |
2.2.1 Web挖掘的概述 | 第23-24页 |
2.2.2 Web挖掘的技术分类 | 第24-25页 |
§2.3 Web文本预处理技术 | 第25-27页 |
2.3.1 文本表示模型的生成过程 | 第26-27页 |
2.3.2 文本表示模型的计算过程 | 第27页 |
§2.4 话题检测与追踪技术 | 第27-30页 |
2.4.1 话题检测与追踪的概述 | 第27-28页 |
2.4.2 话题检测与追踪的任务和新方向 | 第28-29页 |
2.4.3 话题检测与追踪的评测体系 | 第29-30页 |
§2.5 用户行为分析技术 | 第30页 |
§2.6 反作弊技术 | 第30-31页 |
§2.7 本章小结 | 第31-32页 |
第三章 互联网新闻话题检测与追踪技术 | 第32-41页 |
§3.1 引言 | 第32页 |
§3.2 互联网新闻报道类文本的特点 | 第32-33页 |
§3.3 针对传统文本的话题检测与追踪技术 | 第33-34页 |
§3.4 针对互联网新闻报道的话题检测与追踪技术 | 第34-37页 |
3.4.1 多级话题树模型 | 第34-35页 |
3.4.2 改进混合层次划分聚类算法 | 第35-37页 |
§3.5 实验与结论 | 第37-40页 |
3.5.1 实验数据集与预处理 | 第37页 |
3.5.2 改进话题检测算法的实验 | 第37-38页 |
3.5.3 多级层次化话题的实验 | 第38-40页 |
§3.6 本章小结 | 第40-41页 |
第四章 中文微博突发话题检测技术 | 第41-49页 |
§4.1 引言 | 第41-42页 |
§4.2 突发话题检测的基本机制 | 第42-43页 |
§4.3 针对微博文本的预处理技术 | 第43-44页 |
4.3.1 预处理技术概述 | 第43页 |
4.3.2 基于微博用户的筛选与过滤规则 | 第43-44页 |
4.3.3 基于微博内容的筛选与过滤规则 | 第44页 |
§4.4 基于主题词的权重算法 | 第44-45页 |
§4.5 改进的增量式模糊聚类算法 | 第45-47页 |
4.5.1 主题词相似度计算方法 | 第45-46页 |
4.5.2 主题词与簇相似度计算 | 第46页 |
4.5.3 改进模糊算法 | 第46-47页 |
§4.6 实验与结论 | 第47-48页 |
§4.7 本章小结 | 第48-49页 |
第五章 基于用户行为的搜索引擎用户满意度分析 | 第49-61页 |
§5.1 用户行为分析 | 第49-51页 |
5.1.1 用户调研分析 | 第49页 |
5.1.2 基于Web日志的用户行为分析 | 第49-50页 |
5.1.3 搜索引擎用户行为的特点 | 第50-51页 |
§5.2 Web日志预处理技术 | 第51-53页 |
5.2.1 日志内容详述 | 第51页 |
5.2.2 会话级日志 | 第51-52页 |
5.2.3 用户行为数据抽取 | 第52页 |
5.2.4 特征抽取与筛选技术 | 第52-53页 |
§5.3 基于CURE的样本推荐标注技术 | 第53-54页 |
5.3.1 CURE算法概述 | 第53-54页 |
5.3.2 样本推荐标注技术 | 第54页 |
§5.4 机器学习动态建模技术 | 第54-57页 |
5.4.1 动态建模技术的概述 | 第54-55页 |
5.4.2 动态建模的多模型机制 | 第55-56页 |
5.4.3 动态建模的自动更新机制 | 第56-57页 |
5.4.4 动态建模的反馈机制 | 第57页 |
§5.5 实验与结论 | 第57-59页 |
5.5.1 实验准备 | 第57-58页 |
5.5.2 用户满意度实验 | 第58页 |
5.5.3 动态模型的学习效果实验 | 第58-59页 |
§5.6 本章小结 | 第59-61页 |
第六章 总结与展望 | 第61-63页 |
§6.1 本文工作总结 | 第61-62页 |
§6.2 未来工作展望 | 第62-63页 |
参考文献 | 第63-68页 |
致谢 | 第68-69页 |
攻读硕士学位期间发表的论文和研究成果 | 第69-70页 |
附件 | 第70页 |