首页--工业技术论文--无线电电子学、电信技术论文--无线通信论文--移动通信论文

基于移动搜索的Spider爬行策略的研究和实现

摘要第1-6页
ABSTRACT第6-10页
第1章 引言第10-15页
   ·选题依据第11-13页
     ·网络爬虫对于信息检索的重要性第11页
     ·网络爬虫研究现状第11-12页
     ·WAP 网页爬取技术研究的意义第12-13页
   ·论文研究内容及创新点第13-15页
     ·论文研究内容第13-14页
     ·论文创新点第14-15页
第2章 网络爬虫基本原理及关键技术第15-26页
   ·网络爬虫的基本原理第15-23页
     ·WAP 爬虫工作方式第19-22页
     ·爬虫的难题第22页
     ·爬虫的更新周期第22-23页
   ·WAP 网络爬虫关键技术第23-25页
     ·逐层爬取策略第23页
     ·不重复爬取策略第23-24页
     ·网页重访策略第24-25页
     ·Robots 协议第25页
   ·本章小结第25-26页
第3章 网页信息处理方法第26-46页
   ·网页信息预处理第26-34页
     ·几种标记语言简介及HTTP 协议第27-31页
     ·网页信息的结构化第31-33页
     ·获取网页信息第33-34页
   ·建立索引和实现查询第34-40页
     ·索引的建立及其在搜索引擎中的作用第35-36页
     ·索引策略第36-40页
   ·进行WML 转换第40-42页
     ·WAP 体系与结构第40-41页
     ·HTML 到WML 转换第41-42页
   ·PageRank 算法及其改进第42-46页
     ·问题的提出第42页
     ·PageRank 算法思想第42-44页
     ·PageRank 算法改进第44-46页
第4章 基于移动Spider 爬取策略的研究与设计第46-53页
   ·查询语句解析第46-47页
   ·引擎在 Spider 爬取信息过程中的查询策略第47-48页
   ·结果去重与过滤第48-49页
   ·搜索结果排序第49-52页
   ·搜索策略总体流程第52-53页
第5章 基于移动搜索爬取策略的手机阅读检索功能实现第53-67页
   ·移动搜索Spider 爬行策略简介第53-54页
   ·服务器网关要实现的内容第54-58页
     ·手机阅读软件客户端需实现的功能第55页
     ·手机阅读软件客户端和服务器网关之间的通信第55-56页
     ·服务器网关的框架设计第56-58页
   ·Spider 爬行网页信息模块功能实现API第58-60页
   ·Spider 运行爬行程序过程中索引的维护第60-64页
     ·Spider 运行爬行程序过程中索引存储方式第61-63页
     ·Spider 运行爬行程序过程中索引插入与删除第63-64页
   ·Spider 运行爬行程序过程中索引策略总体流程第64-65页
   ·手机阅读软件检索资源运行实例第65-67页
结论第67-68页
 1. 研究成果第67页
 2. 建议第67-68页
致谢第68-69页
参考文献第69-73页
攻读学位期间取得学术成果第73页

论文共73页,点击 下载论文
上一篇:航空伽玛能谱勘查系统的高压电源研制
下一篇:一种基于LEACH的无线传感器网络分簇路由协议的分析与改进