首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的垂直搜索引擎设计

提要第1-8页
第一章 引言第8-13页
第二章 DEEP WEB 主题爬虫设计第13-29页
   ·分类器设计第13-19页
     ·文本的表示第15-16页
     ·特征选取第16-18页
     ·SVM 文本分类第18-19页
   ·在线爬行第19-23页
     ·爬行过程第19-21页
     ·网页解析第21-23页
   ·HTML 解析第23-25页
   ·中文分词第25-26页
   ·DEEP WEB 爬行算法框架第26-29页
第三章 本文用到的开源组件介绍第29-39页
   ·LUCENE 介绍第29-32页
   ·HTTPCLIENT 介绍第32-37页
   ·HTMLPARSER 介绍第37-39页
第四章 HYSE 垂直搜索系统设计与实现第39-44页
   ·体系结构第39-40页
   ·DEEP WEB 主题网络采集器第40页
   ·增量索引结构的建立第40-42页
   ·网络信息查询服务第42-43页
   ·LUCENE 中文语言分析器设计第43页
   ·系统部署第43-44页
第五章 总结和展望第44-45页
参考文献第45-47页
摘要第47-50页
Abstract第50-53页
致谢第53-54页
导师及作者简介第54页

论文共54页,点击 下载论文
上一篇:过程式程序设计语言操作语义的可视化实现
下一篇:文本聚类算法的研究与实现