首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于文本分类的WEB信息检索技术的研究

摘要第1-4页
Abstract第4-7页
绪论第7-9页
 一. 课题研究背景第7-8页
 二. 本文的意义及主要工作第8-9页
第一章 搜索引擎概述第9-14页
   ·信息检索技术第9-11页
     ·信息检索的概念第9页
     ·信息检索系统模型第9-10页
     ·信息检索系统的处理过程第10-11页
   ·搜索引擎简介第11-13页
     ·Web 信息资源的特点第11页
     ·搜索引擎的发展历史第11-12页
     ·搜索引擎的分类第12-13页
 本章小结第13-14页
第二章 搜索引擎相关技术第14-22页
   ·搜索引擎的体系结构第14-15页
   ·Spider 概述第15-17页
     ·网页的基本结构第15页
     ·网络爬虫Spider 的结构及处理流程第15-17页
   ·Indexer 分析第17-19页
   ·Searcher 中的关键问题第19-20页
   ·中文自动分词第20-21页
 本章小结第21-22页
第三章 文本分类技术第22-41页
   ·文本分类的概念与特点第22-23页
   ·文本分类的过程第23-24页
   ·文本的表示模型第24-26页
     ·布尔模型(Boolean Model)第25页
     ·概率模型(Probabilistic Model )第25页
     ·向量空间模型(Vector Space Model,VSM)第25-26页
   ·基于向量空间模型的文本分类算法分析第26-30页
     ·TF-IDF 权重第26-28页
     ·主要文本分类算法第28-30页
     ·关于阈值的确定第30页
   ·文本分类的评估第30-31页
     ·准确率(Precision)与召回率(Recall)第30-31页
     ·F 值(F-measure)第31页
   ·改进的权值计算方法第31-33页
   ·网页中HTML 标记对词条权重的影响第33-40页
     ·HTML 标记与关键词权重的联系第33-36页
     ·改进权重算法实验分析第36-40页
 本章小结第40-41页
第四章 全文检索引擎Lucene第41-49页
   ·Lucene 全文检索第41-43页
     ·Lucene 的特点及优势第41-42页
     ·Lucene 系统结构分析第42-43页
   ·Lucene 索引文件的结构第43-45页
   ·索引模块第45-47页
   ·检索过程和结果显示第47-48页
 本章小结第48-49页
第五章 基于Lucene 的主题分类搜索系统第49-56页
   ·简述第49页
   ·系统结构第49-53页
     ·基于Lucene 的索引与检索第50-51页
     ·索引建立过程第51-53页
   ·系统部署第53-55页
 本章小结第55-56页
结论第56-57页
 1.全文总结第56页
 2.后续工作展望第56-57页
参考文献第57-59页
攻读硕士学位期间发表的学术论文第59-60页
致谢第60-61页

论文共61页,点击 下载论文
上一篇:面向领域的数据仓库构建技术研究及应用
下一篇:基于JavaEE规范的轻量级企业应用架构的研究及应用