首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于维基类目网络和URL模式树的网页分类方法探究

摘要第1-5页
ABSTRACT第5-7页
目录第7-10页
表格索引第10-11页
插图索引第11-12页
第一章 绪论第12-22页
   ·网页分类的重要性第12-14页
     ·创建和维护站点目录第12-13页
     ·提高搜索质量第13页
     ·类目指向的网页爬虫第13-14页
     ·用户行为分析系统第14页
   ·网页分类研究第14-16页
     ·网页分类问题第14-15页
     ·基于文本的网页分类第15-16页
   ·大数据环境下的分类系统第16-21页
     ·互联网日志和大数据第16-17页
     ·分类系统问题描述第17-21页
   ·文章结构第21页
   ·本章小结第21-22页
第二章 分类模型和算法描述第22-39页
   ·维基主题分类模型第22-29页
     ·维基知识体系第22-23页
     ·维基类目网络的构建第23-28页
     ·WikiClassifer第28-29页
   ·URL 模式树分类模型第29-38页
     ·核函数第29-30页
     ·自然语言语法树的核函数第30-33页
     ·URL 的“语法”规则第33-38页
   ·本章小结第38-39页
第三章 分类系统实现细节第39-61页
   ·Hive 系统第40-45页
     ·MapReduce 模型第40-41页
     ·Hive 上数据存储和操作第41-42页
     ·HiveQL 和 MapReduce 的转化逻辑第42-45页
   ·URL 模式树生成模块第45-55页
     ·URL 的分割和规范化第45-47页
     ·令牌的生成第47-48页
     ·URL 模式生成第48页
     ·URL 模式树的构建第48-54页
     ·URL 模式树的分类实现第54-55页
   ·基于维基树网络的分类算法实现第55-60页
     ·维基类目关联算法的实现第55-59页
     ·分类模型的实现第59-60页
   ·本章小结第60-61页
第四章 分类系统测试和评估第61-70页
   ·测试环境第61-62页
   ·维基主题分类的参数测试第62-67页
     ·数据准备第62页
     ·继承函数评测第62-64页
     ·提权函数评测第64-67页
     ·总体测试第67页
   ·URL 模式树分类的测试第67-68页
     ·数据准备第67-68页
     ·URL 模式树分类评测第68页
   ·本章小结第68-70页
全文总结第70-72页
参考文献第72-76页
致谢第76-77页
攻读学位期间发表的学术论文目录第77-78页
攻读学位期间参与的项目第78-79页
附件第79-81页

论文共81页,点击 下载论文
上一篇:基于Meanshift的视频人体目标跟踪算法研究
下一篇:Hadoop架构下数据挖掘与数据迁移系统的设计与实现