首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向丝绸领域的垂直搜索引擎关键算法研究

中文摘要第1-4页
ABSTRACT第4-8页
第1章 绪论第8-14页
   ·课题的背景及意义第8页
   ·垂直搜索引擎现存的问题第8-10页
     ·垂直搜索引擎的产生第8-10页
     ·存在的问题第10页
   ·国内外垂直搜索引擎的发展第10-12页
   ·垂直搜索引擎的发展前景第12-13页
   ·课题的主要研究内容第13-14页
第2章 搜索引擎实现原理第14-26页
   ·通用搜索引擎的工作流程第14-15页
   ·网页信息采集技术和软件第15-19页
     ·网页信息采集软件的工作方式第16-17页
     ·网页采集软件的组成模块第17-19页
   ·索引器第19-21页
     ·实现原理第19-20页
     ·索引数据组织第20-21页
     ·索引文件导出过程第21页
   ·网页存储器与分析索引器第21-22页
   ·查询器和用户接口的设计第22-23页
     ·查询器第22-23页
     ·用户接口第23页
   ·搜索引擎的性能评价指标第23-25页
   ·小结第25-26页
第3章 垂直搜索引擎的关键技术第26-35页
   ·页面分析技术第26-27页
   ·超链接分析算法第27-30页
     ·PageRank 算法第27-29页
     ·HITS 算法第29-30页
   ·网页信息的结构化抽取第30-33页
     ·网页信息的结构化抽取方式第31页
     ·结构化信息抽取系统的结构第31-32页
     ·中文网页结构化信息抽取的难点第32-33页
   ·暗藏网页的信息抽取第33-34页
   ·小结第34-35页
第4章 面向丝绸领域垂直搜索引擎的总体设计第35-40页
   ·基本功能需求第35-36页
   ·丝绸产品信息搜索引擎系统的总体框架第36-37页
   ·系统开发环境第37-38页
   ·系统功能特点第38页
   ·系统的逻辑功能模块设计第38页
   ·系统的关键技术分析第38-40页
第5章 面向丝绸领域的垂直搜索引擎的具体实现第40-57页
   ·丝绸信息网页自动搜索算法的具体实现第40-48页
     ·元搜索算法第40-42页
     ·自动搜索过程的实现第42-45页
     ·网页爬行的控制模块实现第45-46页
     ·HTML 标准化与页面解析第46-47页
     ·网页爬行的控制模块的性能测试第47-48页
   ·页面分析与丝绸产品信息的自动抽取第48-52页
   ·Lucene 倒排文件索引结构第52-53页
   ·用户查询功能的实现第53-56页
     ·网页形式的丝绸产品信息查询与返回第54-55页
     ·站内数据库中的丝绸产品信息查询与返回第55-56页
   ·小结第56-57页
结论第57-59页
参考文献第59-61页
攻读学位期间公开发表的论文第61-62页
致谢第62-63页
详细摘要第63-64页

论文共64页,点击 下载论文
上一篇:基于SVM的车辆自动分类方法研究与实现
下一篇:基于WEB的高师普通物理(电磁学)双语教学支持系统研究