首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于个性化服务的汽车信息搜索引擎的研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-16页
   ·研究背景第9-10页
   ·搜索引擎工作原理第10-13页
     ·主题搜索引擎的特点第11-12页
     ·个性化搜索引擎的特点第12-13页
   ·国内外研究现状第13-14页
   ·论文主要研究内容第14页
   ·论文章节安排第14-16页
第2章 网络爬虫Heirtrix技术分析第16-23页
   ·网络爬虫简介第16-17页
   ·Heritrix系统架构第17-20页
     ·Heritrix系统简介第17页
     ·Heritrix结构分析第17-20页
   ·扩展和改进Heritrix第20-21页
     ·解析汽车网站的解析器Extractor第20页
     ·扩展FrontierScheduler抓取汽车网页信息第20-21页
     ·定制Queue-assignment-policy实现多线程抓取第21页
   ·Heritrix优缺点分析第21-22页
   ·本章小结第22-23页
第3章 检索框架Lucene的分析研究第23-32页
   ·Lucene概述第23-25页
     ·全文检索的基本原理第23-24页
     ·Lucene工作流程第24-25页
   ·Lucene索引技术第25-27页
     ·Lucene倒排索引技术第25-26页
     ·Lucene索引结构第26-27页
   ·Lucene排序技术第27-31页
     ·信息检索的排序技术第27-28页
     ·Lucene排序技术第28-29页
     ·Lucene排序算法的改进第29-31页
   ·本章小结第31-32页
第4章 系统设计与实现第32-54页
   ·购车者的需求第32页
   ·系统总体架构第32-34页
   ·汽车主题爬虫模块设计第34-40页
     ·定制抓取汽车网页的爬虫程序第34-38页
     ·多线程抓取汽车网页第38-40页
   ·汽车网页信息抽取模块设计第40-44页
     ·使用HTMLParser高效提取网页内容第40-42页
     ·信息抽取模块设计第42-44页
   ·索引模块设计第44-50页
     ·数据库与汽车索引结构第44-45页
     ·创建汽车产品索引第45-47页
     ·加入自定义的词库第47-49页
     ·获取用户的个性化需求信息第49-50页
   ·用户查询模块设计第50-53页
   ·本章小结第53-54页
第5章 系统测试第54-62页
   ·系统演示第54-58页
   ·网络爬虫测试第58-61页
     ·改进前后网络爬虫测试第58-60页
     ·改进后的爬虫不同条件下测试第60-61页
   ·本章小结第61-62页
第6章 总结与展望第62-64页
参考文献第64-67页
致谢第67-68页
攻读硕士学位期间发表的论文第68页

论文共68页,点击 下载论文
上一篇:基于语义的网上股评信息的提取研究
下一篇:高效的RFID安全协议研究与设计