首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Java技术的智能化搜索引擎的研究与设计

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-16页
   ·搜索引擎概述第10页
   ·搜索引擎发展第10-13页
   ·搜索引擎的分类第13页
   ·垂直搜索引擎的研究第13-14页
   ·本文主要工作第14-16页
第2章 搜索引擎关键技术第16-32页
   ·网页信息抓取第16-19页
     ·网络蜘蛛原理第16-18页
     ·网络蜘蛛工作过程第18-19页
   ·网页信息与处理第19-21页
     ·Lucene 简介第19页
     ·Lucene 索引文件的建立第19-21页
     ·Lucene 索引文件格式第21页
   ·信息检索模型第21-28页
     ·布尔模型第22页
     ·向量模型第22-24页
     ·概率模型第24-26页
     ·Lucene 检索机制第26-28页
   ·自动摘要技术第28-31页
     ·基于统计的自动摘要第28-29页
     ·基于理解的自动摘要第29-30页
     ·基于信息抽取的自动摘要第30页
     ·基于结构的自动摘要第30-31页
   ·本章小结第31-32页
第3章 特定领域智能化搜索引擎的设计第32-37页
   ·需求分析第32-33页
   ·系统总体设计第33-34页
     ·系统开发环境第33页
     ·总体设计第33-34页
   ·系统工作原理第34-35页
   ·系统软件模块功能分析第35-36页
   ·本章小结第36-37页
第4章 主题网络爬虫的设计与实现第37-55页
   ·主题网络爬虫的设计分析第37-39页
   ·主题网络爬虫的技术要点第39-52页
     ·多线程第39-40页
     ·线程同步第40页
     ·数据库存储设计第40-42页
     ·提取链接第42-43页
     ·停止协议第43-44页
     ·字节输入输出流第44-45页
     ·爬行策略第45-52页
   ·实验测试第52-54页
   ·本章小结第54-55页
第5章 索引和检索功能模块设计与实现第55-77页
   ·功能模块设计分析第55-57页
   ·网页去噪第57-60页
     ·HTML 网页文件第57页
     ·网页净化第57-60页
   ·自动文本摘要第60-68页
     ·自动文摘方法选择第60-61页
     ·基于统计方法的文本摘要生成第61-65页
     ·自动摘要性能评测第65-68页
   ·索引文件构造及扩展配置功能第68-69页
   ·检索功能及界面设计与实现第69-71页
   ·实验测试第71-76页
   ·本章小结第76-77页
结论第77-78页
参考文献第78-82页
攻读硕士学位期间发表的论文和取得的科研成果第82-83页
致谢第83页

论文共83页,点击 下载论文
上一篇:基于J2EE的SOA架构在仓储服务领域的研究与设计
下一篇:基于OpenGL虚拟海洋环境仿真