首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究与设计

摘要第1-5页
ABSTRACT第5-8页
第一章 引言第8-15页
   ·相关背景第8-9页
   ·垂直搜索概述第9-13页
     ·垂直搜索的特征第10-11页
     ·垂直搜索的关键技术第11-13页
   ·垂直搜索现状第13页
   ·本文所做的工作第13-15页
第二章 垂直搜索概要设计和网络爬虫技术第15-27页
   ·系统简介第15-16页
   ·网络爬虫基本原理第16-19页
     ·网络爬虫概要第16-17页
     ·抓取目标的描述第17页
     ·网页搜索策略第17-18页
     ·大型网络爬虫的问题第18-19页
   ·垂直搜索中的网络爬虫技术第19-27页
     ·相关的工作第19页
     ·基于URL 规则的爬虫算法第19-27页
第三章 一体化中文分词和结构化提取技术第27-43页
   ·网页预处理第27-28页
     ·统一编码第27页
     ·噪声的识别和过滤第27页
     ·整理第27-28页
   ·结构化提取技术第28-33页
     ·几个概念第28-29页
     ·系统结构第29-30页
     ·对等节点的识别第30页
     ·对等矩阵的排列第30-31页
     ·模式发掘第31-32页
     ·可选节点归并第32页
     ·数据格式检测第32-33页
   ·暗藏网页的信息抽取第33-34页
   ·论坛页面的抓取与抽取第34页
   ·中文分词第34-43页
     ·概述第34-37页
     ·整体设计第37页
     ·词典机制和词典查询算法第37-39页
     ·基于最长路径的统计模型第39页
     ·停用词去除第39页
     ·新词发现第39-43页
第四章 系统设计与实现第43-63页
   ·爬虫设计第43-50页
   ·网页处理模块设计第50-52页
   ·中文分词模块的设计第52-55页
   ·索引及检索系统的设计第55-61页
   ·搜索系统评测第61页
   ·本章小结第61-63页
第五章 总结与展望第63-65页
   ·总结第63页
   ·发展方向第63-65页
参考文献第65-68页
致谢第68-69页
攻硕期间取得的研究成果第69-70页

论文共70页,点击 下载论文
上一篇:二十一世纪以来的中国独立影像该何去何从?
下一篇:第三代移动通信系统身份鉴别协议的安全性分析