首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网络信息流中热门访问主题挖掘技术研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-20页
   ·课题背景第10页
   ·课题的目的及意义第10-11页
   ·网络舆情相关技术的研究现状第11-15页
     ·Web 挖掘的研究现状第12-14页
     ·数据流挖掘的研究现状第14-15页
   ·网络舆情涉及到的领域第15-19页
     ·计算机网络第16-17页
     ·自然语言处理第17-18页
     ·数据仓库与数据挖掘第18-19页
   ·本文的研究内容及组织结构第19-20页
第2章 网络舆情综述第20-26页
   ·舆情的定义和特点第20-21页
   ·网络舆情的定义和特点第21-22页
   ·网络舆情的产生和传播第22-24页
   ·网络舆情系统的设计第24-25页
   ·本章小结第25-26页
第3章 句子相似度计算第26-35页
   ·中文分词技术第26-28页
     ·分词算法概念第26-27页
     ·常用的分词方法第27-28页
   ·基于索引的逆向最大匹配分词算法第28-31页
     ·词典和索引的设计第28-29页
     ·逆向最大匹配分词算法第29-30页
     ·新词的发现第30-31页
   ·句子相似度计算第31-33页
     ·句子相似度计算的概念第31页
     ·句子相似度的计算方法第31-33页
   ·主题相似度计算方法第33-34页
   ·本章小结第34-35页
第4章 数据流中频繁项挖掘算法第35-49页
   ·数据流和频繁项的定义第35-39页
     ·数据流的定义和特点第35-36页
     ·频繁项集的定义第36-37页
     ·数据流中频繁项的定义第37页
     ·窗口技术在数据流挖掘中的作用第37-38页
     ·数据流中频繁项算法的介绍第38-39页
   ·Lossy Counting 算法第39-41页
     ·算法性质第39页
     ·算法描述第39-41页
     ·算法性质证明第41页
   ·热门访问主题挖掘第41-45页
     ·热门访问主题挖掘算法第41-42页
     ·摘要设计第42-43页
     ·算法设计第43-45页
   ·挖掘一段时期热门访问主题算法第45-48页
     ·算法思想第45-46页
     ·算法合理性证明第46页
     ·基于ε邻域的文本聚类算法第46-48页
   ·本章小结第48-49页
第5章 关键技术的实现第49-65页
   ·系统组成第49-50页
   ·网络信息流获取技术第50-52页
     ·网卡的工作原理和设置第50-51页
     ·交换机的设置第51-52页
   ·网页捕获技术第52-56页
     ·HTTP 协议简介第52页
     ·HTTP 传输过程第52-53页
     ·请求头第53-54页
     ·应答头第54-55页
     ·网页捕获算法详细设计第55-56页
   ·网页特征提取技术第56-60页
     ·HTML 概述第56-59页
     ·网页特征提取方法第59-60页
   ·编码转换技术第60-64页
     ·GB2312、GBK 和GB18030 编码基础第61页
     ·BIG5 码基础第61-62页
     ·Unicode 编码基础第62页
     ·编码转换算法第62-64页
   ·本章小结第64-65页
第6章 系统测试第65-70页
   ·测试方案第65页
   ·测试环境第65页
   ·测试数据第65-66页
   ·实验结果及分析第66-69页
     ·各段频繁项支持度热门访问主题的数量第66页
     ·频繁项支持度θ对热门访问主题个数的影响第66页
     ·误差上界ε对热门访问主题个数的影响第66-67页
     ·主题类相似度阈值δ对主题个数和性质的影响第67页
     ·误差上界ε对系统性能的影响第67-68页
     ·主题类相似度度阈值δ对系统性能的影响第68-69页
   ·本章小结第69-70页
结论第70-72页
参考文献第72-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:异构网络模拟的性能推算研究
下一篇:网络模拟中的数据包—流混合模拟研究