首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

网购比价搜索系统设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-11页
   ·课题背景第9-10页
   ·课题任务第10页
     ·课题内容第10页
     ·本人承担任务第10页
   ·论文结构第10-11页
第二章 相关技术分析第11-18页
   ·索引第11-15页
     ·全文检索第11-12页
     ·倒排结构与段索引方式第12页
     ·建立索引第12-14页
     ·索引的优化第14-15页
   ·查询第15-17页
     ·Java的并发第15-16页
     ·Remote Method Invocation第16-17页
   ·本章小节第17-18页
第三章 整体框架的设计第18-24页
   ·系统整体框架的设计第18-19页
   ·购物抓取模块的设计第19-20页
   ·网页抽取模块的设计第20-22页
   ·搜索索引模块的设计第22-23页
   ·本章小结第23-24页
第四章 购物抓取模块的详细设计与实现第24-30页
   ·实现框图第24-26页
   ·数据库服务器第26-28页
     ·Site Table第26页
     ·Seller Table第26-27页
     ·Seller Injector& Seller Selector第27页
     ·Seller Information Updater第27-28页
   ·抓取节点第28-29页
     ·Seed Fetch Client& Webpage Fetcher第28页
     ·URL Cache第28-29页
   ·本章小结第29-30页
第五章 网页数据抽取模块的详细设计与实现第30-37页
   ·主要处理流程第30-32页
     ·在线模块第30-31页
     ·测试模块(离线)第31页
     ·主要模块描述第31-32页
   ·数据第32-34页
     ·所要分析的网页类型第32页
     ·需要抓取的数据字段第32-33页
     ·XML格式第33-34页
   ·接口第34-36页
     ·与Crawler、Indexer接口框图第34-35页
     ·与Crawler接口第35-36页
     ·与Indexer接口第36页
   ·本章小节第36-37页
第六章 分布式查询索引模块的详细设计与实现第37-57页
   ·索引子系统第37-41页
     ·索引子系统软件结构第37页
     ·XianTao Engine第37-38页
     ·索引结构设计第38-39页
     ·Lucene的评分机制第39-41页
   ·分布式查询第41-44页
     ·分布式搜索系统第41-42页
     ·查询服务器负载均衡第42-44页
   ·数据处理第44-49页
     ·消重处理第45-46页
     ·分发第46-47页
     ·XML四种读写方式比较第47-49页
   ·中文分词器第49-52页
     ·中文分词与英文分词的区别第49页
     ·中文分词的方法第49-50页
     ·分析器第50-52页
   ·系统部署和数据流向第52-53页
     ·分布式搜索节点部署第52页
     ·分布式搜索系统数据流向第52页
     ·分词相关设置第52-53页
   ·配置文件说明第53-54页
     ·日志配置文件第53页
     ·系统配置文件第53-54页
   ·索引更新程序第54-55页
     ·执行索引更新第54-55页
     ·清空、重建索引第55页
   ·查询测试程序第55-56页
   ·本章小节第56-57页
第七章 结束语第57-60页
   ·运行测试第57-58页
   ·论文工作总结第58-59页
   ·问题和展望第59-60页
附录第60-64页
参考文献第64-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:联通省级一卡充系统设计与实现
下一篇:特种物品管理信息系统用户权限管理子系统的设计与实现