首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究与实现

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-10页
1 绪论第10-14页
   ·通用搜索引擎概述第10-12页
     ·搜索引擎定义第10页
     ·搜索引擎的分类第10-11页
     ·通用搜索引擎的不足第11-12页
   ·垂直搜索引擎的研究意义第12-14页
     ·垂直搜索引擎的定义第12页
     ·垂直搜索引擎的优势第12页
     ·垂直搜索引擎的研究现状第12-14页
2 搜索引擎技术概述第14-27页
   ·搜索引擎的工作原理及体系结构第14-18页
     ·网页信息搜集模块第14-15页
     ·预处理模块第15-17页
     ·查询服务模块第17-18页
   ·搜索引擎核心技术第18-27页
     ·Spider技术第18-21页
     ·中文分词技术第21-23页
     ·网页排名技术第23-27页
3 垂直搜索引擎关键技术第27-35页
   ·专业网络爬虫技术第27-30页
     ·专业网络爬虫工作原理及关键技术概述第27-28页
     ·主题描述第28页
     ·主题相关度判定第28-30页
     ·网页搜索策略第30页
   ·网页的结构化信息抽取技术第30-35页
     ·信息抽取技术概述第31页
     ·信息抽取技术的评价标准第31-32页
     ·Web页面信息抽取技术概述第32页
     ·Web信息抽取关键技术第32-33页
     ·Web信息抽取方法:第33-35页
4 专业爬虫的设计与实现第35-48页
   ·专业爬虫系统设计第35-41页
     ·专业爬虫体系结构第35-36页
     ·主题确立模块第36-37页
     ·网页抓取模块第37页
     ·主题相关度分析模块第37-38页
     ·主题预测模块第38-40页
     ·网页分析模块第40页
     ·网页排序模块第40-41页
   ·专业爬虫的实现第41-44页
     ·URL管理器第41-42页
     ·页面抓取器第42-43页
     ·网页解析器第43页
     ·主题判别器第43-44页
     ·主题预测器第44页
   ·性能测试及结果分析第44-48页
     ·测试指标第44页
     ·测试方法第44-45页
     ·测试结果与分析第45-48页
5 结构化信息抽取模块的设计与实现第48-52页
   ·系统结构第48页
   ·数据预处理模块第48-50页
     ·概述第48-49页
     ·HTML到XML的转换第49页
     ·中文分词第49-50页
   ·数据抽取模块第50-52页
     ·概述第50页
     ·抽取规则的定义第50-51页
     ·信息抽取的执行第51-52页
6 总结第52-53页
参考文献第53-54页
作者简历第54-56页
学位论文数据集第56页

论文共56页,点击 下载论文
上一篇:丁丙诺啡经皮给药制剂的研究
下一篇:基于WiFi-SIP的固定移动融合及相关切换技术的研究