首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向专业搜索引擎的主题爬行技术研究

提要第1-9页
第一章 绪论第9-29页
   ·研究背景第9-11页
     ·主题爬行技术的意义第9-10页
     ·主题爬行技术的发展第10-11页
   ·Web 挖掘与搜索引擎第11-15页
     ·Web 挖掘第11-12页
     ·搜索引擎及发展第12-15页
       ·搜索引擎的分类第12-13页
       ·搜索引擎的发展历史第13页
       ·搜索引擎的基本原理第13-14页
       ·面向主题的专业搜索引擎第14-15页
       ·搜索引擎的未来发展第15页
   ·主题爬行技术基本原理第15-20页
     ·网页信息下载第17页
     ·分类器第17-18页
     ·URLs 排序第18页
     ·爬行策略的探索第18-20页
       ·面向立即回报的目标网页内容评价策略第18-19页
       ·面向未来回报的Tunnel 页面评价策略第19-20页
       ·面向未来回报的在线机器学习策略第20页
   ·网页分类技术第20-25页
     ·文档分类概念第21页
     ·文档分类方法第21-22页
     ·文档分类过程第22-23页
     ·文档分类关键技术第23-25页
       ·文本表示第23页
       ·特征提取第23页
       ·分类模型第23-25页
     ·文档分类意义第25页
   ·本文工作第25-29页
     ·利用网页结构对基于链接上下文的自适应主题爬行研究第26页
     ·改进的粒子群优化算法的优化过程第26页
     ·对增量过程的研究第26页
     ·隧道的穿越第26-27页
     ·专业搜索引擎LookClearTSSE 的构建第27-29页
第二章 基于链接上下文的自适应爬行技术第29-55页
   ·链接上下文(Link-contexts)简介第29-31页
   ·链接上下文提取算法第31-39页
     ·提取固定数量文本第32-33页
     ·利用HTML Tag 树结构提取上下文第33-37页
     ·综合提取链接上下文?ζ-IDOM第37-39页
   ·利用反向链接(Back-links)提取特征集第39-41页
   ·基于链接上下文的自适应(Self-adaptive)主题爬行第41-45页
     ·链接上下文的主题表示及判断方法第41-42页
     ·自适应主题爬行算法第42-45页
   ·性能评价第45-52页
     ·评价方法第45-46页
     ·实验结果第46-52页
   ·小结第52-55页
第三章 BWPSO 的优化过程第55-73页
   ·引言第55-56页
   ·粒子群优化算法原理及改进第56-63页
     ·改进的粒子群优化算法BWPSO第56-59页
     ·测试实验第59-63页
   ·BWPSO 优化过程第63-68页
     ·网页预处理及表示第63-66页
     ·网页分类器的训练及BWPSO 优化过程第66-68页
   ·实验及结果第68-71页
   ·小结第71-73页
第四章 ITCMS:增量特性的主题爬行策略第73-103页
   ·算法增量第73-86页
     ·增量模型第73-75页
     ·增量训练过程第75-76页
     ·PU 分类问题第76-78页
     ·可信反例的提取第78-79页
     ·改进的1-DNF 算法第79-81页
     ·构建分类器第81-82页
     ·实验结果分析第82-86页
   ·数据增量第86-103页
     ·网页变化的判定依据第87-88页
     ·基于网页内容的判定第88-92页
       ·网页噪音的去除第88-89页
       ·基于主题的噪音去除过程第89-91页
       ·基于DOM 树的网页变化判定过程第91-92页
     ·网页变化的随机性第92-97页
     ·网页变化的数学模型第97-98页
     ·数据增量爬行算法第98-101页
     ·测试结果第101-103页
第五章 隧道的穿越第103-123页
   ·引言第103-105页
   ·灰色隧道的穿越第105-114页
     ·方法简介第105-106页
     ·基于DOM 树的网页分块第106-108页
     ·基于网页分块的爬行过程第108-110页
     ·实验结果第110-114页
   ·黑色隧道的穿越第114-120页
     ·黑色隧道中的网页处理第115-117页
     ·测试结果第117-120页
   ·利用关联规则与Petri 网穿越隧道的启发第120-121页
   ·小结第121-123页
第六章 LookClearTSSE: 专业搜索引擎第123-147页
   ·LookClearTSSE 体系结构第123-125页
   ·主题网络信息采集第125-129页
   ·增量索引结构的建立第129-139页
     ·预处理第129-132页
     ·增量索引结构的建立第132-139页
       ·正排索引第133-134页
       ·增量倒排索引第134-139页
   ·网络信息查询服务第139-147页
     ·建立索引的检索接口第139-141页
     ·查询结果的排序第141-143页
     ·性能分析第143-147页
第七章 结论与展望第147-151页
   ·结论第147-148页
   ·未来展望第148-151页
参考文献第151-162页
致 谢第162-163页
作者读博士期间发表的部分论文目录第163-165页
摘 要第165-169页
Abstract第169-173页

论文共173页,点击 下载论文
上一篇:公路软土地基沉降量变权重组合预测的研究
下一篇:丰花月季体细胞无性系变异及NaN3诱变变异的研究