首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

数据挖掘在Internet信息检索中的应用

摘 要第1-4页
Abstract第4-9页
第一章 绪论第9-24页
   ·INTERNET 信息检索第9-10页
   ·搜索引擎研究现状第10-16页
     ·搜索引擎工作原理第10-12页
     ·目前搜索引擎所使用的关键技术第12-15页
     ·目前中文搜索引擎的一些不足第15-16页
   ·WEB 挖掘技术第16-22页
     ·自动分词第17-18页
     ·自动文摘第18页
     ·信息过滤第18-19页
     ·自动网页分类第19页
     ·网页聚类第19-22页
   ·本文的工作第22-24页
第二章 全二分快速分词算法第24-34页
   ·分词词典第24-27页
     ·汉字编码体系第24页
     ·汉语词的特点第24-25页
     ·分词词典第25-27页
   ·分词词典维护第27-29页
     ·构造首字Hash 表第27-28页
     ·构造词索引表第28-29页
   ·全二分快速分词算法第29-32页
   ·算法分析第32-34页
第三章 特定领域的WWW 信息采集第34-43页
   ·WEB 结构概述第34-36页
     ·物理结构第34-35页
     ·逻辑结构第35-36页
   ·用户兴趣模型第36-40页
     ·用户兴趣模型第36-38页
     ·网页相似度第38-40页
   ·特定领域的网页采集第40-43页
     ·网页相似度预测第40-41页
     ·采集控制策略第41-43页
第四章 基于结构信息的自动网页分类第43-51页
   ·网页结构信息第43-44页
   ·网页分类器第44-48页
     ·网页分类树第45页
     ·构造网页分类器第45-48页
   ·自动网页分类第48-51页
     ·网页相似度阈值第48-49页
     ·自动网页分类第49-51页
第五章 网页聚类第51-59页
   ·网页N-词重合度第51-53页
   ·网页聚类表第53-55页
   ·快速网页聚类第55-59页
     ·一次聚类第56-57页
     ·二次聚类第57-59页
第六章 系统实现第59-67页
   ·系统概述第59-62页
     ·WIISS 系统的特点第59-60页
     ·WIISS 系统的体系结构第60-62页
   ·系统实现第62-67页
     ·“机器人”采集子系统第62-63页
     ·网页处理子系统第63-64页
     ·用户查询子系统第64-65页
     ·难点处理第65-67页
第七章 总结与展望第67-69页
   ·总结第67-68页
   ·展望第68-69页
参考文献第69-73页
发表文章目录第73页
作者简历第73页
攻读研究生期间主要的研究开发工作第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:脉动热管的运行与传热研究
下一篇:Web应用服务器框架WebFrame的设计和实现