首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

支持Splog过滤的博客搜集系统研究与设计

摘要第1-4页
Abstract第4-9页
第1章 绪论第9-19页
   ·课题背景第9-10页
   ·博客现状概述第10-13页
     ·博客的定义第11-12页
     ·博客的存在方式第12-13页
   ·垃圾博客特征概述第13-14页
     ·一般特征第13页
     ·链接工厂特征第13页
     ·广告博客特征第13-14页
   ·博客与博客搜索引擎第14-17页
     ·搜索引擎的工作原理第14-15页
     ·博客搜索和通用搜索的比较第15-17页
   ·本文的研究内容和章节安排第17-18页
   ·本章小结第18-19页
第2章 文本检索与分类技术综述第19-30页
   ·基于文本的信息检索第19-22页
     ·全文检索第20页
     ·特征向量第20-21页
     ·向量模型第21-22页
   ·文本分类技术第22-29页
     ·自动分类背景与发展第23-24页
     ·文本分类的定义第24页
     ·文本分类的过程第24-25页
     ·常用分类算法第25-29页
   ·本章小结第29-30页
第3章 垃圾博客特征提取算法研究第30-47页
   ·问题建模第30-32页
     ·博客搜索本质第31页
     ·速度要求第31-32页
     ·超链分析第32页
   ·网络垃圾作弊技术第32-36页
     ·搜索引擎与 Spamming第32-33页
     ·Web作弊分析第33-36页
   ·本地特征提取模型第36-37页
     ·博客文章文本分析第36-37页
     ·超链接描述文本分析第37页
   ·全局特征提取模型第37-46页
     ·链接属性第37-41页
     ·时间分布属性第41-46页
   ·本章小结第46-47页
第4章 垃圾博客检测算法的实验与评价第47-61页
   ·实验数据第47页
   ·评价指标第47-49页
   ·实验策略第49-53页
     ·文本特征选取第49-50页
     ·文本特征表示第50页
     ·实验内容第50-53页
   ·实验实现第53-57页
     ·开源工具第53-54页
     ·实验流程第54-57页
   ·实验结果与讨论第57-60页
   ·本章小结第60-61页
第5章 基于Nutch的博客搜集系统实现第61-70页
   ·开源搜索引擎Nutch第61-64页
     ·Nutch的使用方式第62页
     ·Nutch存储模块第62-63页
     ·Nutch插件机制第63-64页
   ·支持垃圾过滤的博客搜集系统设计与实现第64-69页
     ·系统需求第64页
     ·系统功能第64-65页
     ·数据库设计第65-67页
     ·系统架构第67-68页
     ·工作流程第68页
     ·软件环境第68-69页
   ·本章小结第69-70页
第6章 总结与展望第70-72页
   ·本文工作总结第70页
   ·未来工作展望第70-72页
参考文献第72-76页
攻读硕士学位期间主要的研究成果第76-77页
致谢第77-78页
作者简历第78页

论文共78页,点击 下载论文
上一篇:基于图模型的聚类算法研究
下一篇:基于Agent的SVG图形操作票系统研究与实现