首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于数据流挖掘的网页热门主题获取技术研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-21页
   ·课题背景第10-11页
   ·课题的目的及意义第11-12页
     ·研究目的第11页
     ·研究意义第11-12页
   ·Web挖掘的定义及相关领域第12-15页
     ·Web挖掘的定义第12-13页
     ·Web挖掘与信息检索第13-14页
     ·Web挖掘与信息提取第14-15页
     ·Web挖掘与机器学习第15页
   ·网络舆情挖掘的研究现状及面临的问题第15-19页
     ·点击流挖掘第15-17页
     ·话题检测与跟踪第17-18页
     ·热门主题的研究现状第18-19页
     ·舆情挖掘的应用第19页
   ·本文的研究内容及组织结构第19-21页
第2章 Web挖掘技术第21-31页
   ·Web挖掘的分类——按挖掘对象分类第21-23页
   ·Web挖掘的分类——按应用角度分类第23-30页
     ·基于生产者的挖掘第24-26页
     ·基于消费者的挖掘第26-27页
     ·基于增值服务提供者的挖掘第27-30页
   ·本章小结第30-31页
第3章 HTTP协议及用户访问特点研究第31-44页
   ·信息在网页中的分布特性第31-33页
     ·网页的内容——HTML语法第31-32页
     ·网页的URL信息第32-33页
   ·HTTP协议第33-41页
     ·HTTP服务器与客户端之间的会话第33-36页
     ·网页传输特点分析第36-41页
   ·用户访问习惯第41-43页
     ·网站分类第41-42页
     ·网站访问量排行第42页
     ·网页标题的长度第42-43页
   ·本章小结第43-44页
第4章 频繁项挖掘算法第44-55页
   ·数据流模型与统计高频项算法第44-46页
     ·数据流基本模型第44-45页
     ·输入数据分布的细尾特征第45页
     ·计数策略统计高频项第45-46页
   ·改进的Lossy Counting算法第46-52页
     ·无限数据流频繁项挖掘问题第46页
     ·Lossy Counting算法第46-49页
     ·改进的Lossy Counting算法第49-52页
   ·字符串数据的聚类处理第52-54页
     ·字符串的相似度计算公式第52-53页
     ·字符串类的表示第53-54页
   ·本章小结第54-55页
第5章 系统实现第55-68页
   ·系统组成模块第55-62页
     ·过滤模块第56页
     ·日志记录模块第56-59页
     ·预处理模块第59页
     ·聚类模块第59-62页
     ·提交模块第62页
   ·系统测试第62-66页
     ·实验环境第62页
     ·实验数据第62页
     ·实验结果第62-65页
     ·实验结果分析第65-66页
   ·本章小结第66-68页
结论第68-70页
参考文献第70-74页
攻读学位期间发表的学术论文第74-75页
哈尔滨工业大学硕士学位论文原创性声明第75页
哈尔滨工业大学硕士学位论文使用授权书第75页
哈尔滨工业大学硕士学位涉密论文管理第75-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:个人通信系统中的位置管理研究
下一篇:基于静脉纹络认证的联合身份验证系统的研究