首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

垂直搜索引擎关键技术的研究与实现

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-19页
   ·引言第10-11页
   ·通用搜索引擎概述第11-13页
   ·垂直搜索引擎技术第13-17页
     ·垂直搜索引擎概述第13页
     ·垂直搜索引擎的研究和发展概况第13-16页
     ·垂直搜索引擎组成及工作原理第16-17页
   ·论文研究内容及组织结构第17-19页
第二章 垂直搜索引擎技术概述第19-35页
   ·引言第19页
   ·主题网络爬虫第19-26页
     ·主题爬虫的工作原理第19-20页
     ·主题爬虫结构第20-22页
     ·网络爬虫的搜索策略第22-26页
   ·信息抽取技术第26-29页
     ·信息抽取技术的评价标准第26-27页
     ·网络信息抽取关键技术第27-29页
   ·文本分类技术第29-31页
     ·文本表示模型第29页
     ·特征项提取第29-30页
     ·中文分词设计第30-31页
   ·垂直搜索引擎整体架构第31-34页
     ·Lucene 简介第31-33页
     ·Heritrix 简介第33-34页
   ·小结第34-35页
第三章 基于主题内容和链接地址分析的网络爬虫的设计与研究第35-47页
   ·引言第35页
   ·主题搜索孤岛问题第35页
   ·常用网页搜索排序算法第35-42页
     ·基于链接分析的网页搜索排序算法第36-40页
     ·基于网页内容搜索排序算法第40-42页
   ·基于主题内容和URL 链接地址的网页排序算法第42-45页
     ·基于主题内容和URL 链接地址的网页排序算法描述第43-44页
     ·基于主题内容和URL 链接地址目标函数第44-45页
   ·小结第45-47页
第四章 高等教育垂直搜索引擎设计与实现第47-59页
   ·引言第47页
   ·设计内容第47页
   ·系统框架设计第47-50页
     ·整体模块划分第47-48页
     ·系统流程设计第48-50页
   ·信息抽取模块第50页
   ·HTML 解析模块第50-52页
     ·标签的提取第50-51页
     ·链接提取第51页
     ·标题提取和编码格式转换第51页
     ·HTML 解析模块类图第51-52页
   ·相关度判断模块第52-54页
     ·分词第52-53页
     ·网页相关度判断搜索方法第53页
     ·模块类图第53-54页
   ·日志模块及综合管理模块第54-56页
   ·实验结果分析第56-58页
   ·小结第58-59页
第五章 总结与展望第59-61页
   ·结论第59页
   ·后续研究工作展望第59-61页
参考文献第61-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:基于ARM芯片的嵌入式图像处理平台开发与实现
下一篇:基于SharePoint的企业员工社会网络系统设计与实现