首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向互联网的多元信息获取技术研究

目录第1-5页
摘要第5-6页
Abstract第6-7页
第一章 引言第7-16页
   ·任务介绍和应用领域第7-8页
   ·研究背景及相关工作第8-13页
     ·网页获取的基本概念第8-9页
     ·网页相关性分析第9-11页
     ·网页获取的相关工作第11-12页
     ·多元信息去重的相关工作第12-13页
   ·本文的工作第13-14页
   ·本文的组织结构第14-16页
第二章 快速信息网页获取方法第16-31页
   ·信息网站的选择第16-17页
   ·网页的初步下载和简单过滤第17-18页
   ·信息抽取和信息网页标定第18-19页
   ·URL模式归纳第19-24页
     ·基于Token的URL模式学习第19-23页
     ·基于共有前缀的URL模式学习第23-24页
   ·URL模式精选第24-27页
     ·URL模式精选:信息覆盖数优先第24-25页
     ·URL模式精选:信息耗费低优先第25-27页
   ·下载导航器的产生和使用第27-31页
第三章 多元信息冗余判断第31-38页
   ·多元信息表示第31页
   ·信息元素的分类第31-32页
   ·多元信息去重一般流程第32-33页
   ·信息相似度计算第33-34页
   ·信息冗余度判断第34-35页
   ·命名实体信息元素的自动扩展第35-38页
第四章 评测与实验第38-50页
   ·快速信息网页获取方法实验第38-44页
     ·实验设置介绍第38页
     ·实验比较方法第38页
     ·减少网页下载量实验第38-40页
     ·时间适用性实验第40-41页
     ·快速网页获取的参数实验第41-43页
     ·网站扩充步骤实验第43-44页
     ·运行时间分析第44页
   ·多元信息去重实验第44-50页
     ·信息去重的评测指标第45-46页
     ·事件信息去重第46-48页
     ·论文索引信息去重第48-50页
第五章 总结与展望第50-51页
参考文献第51-54页
攻读学位期间参加的科研项目与发表的论文第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:基于链接分析的网页排序及相关Link Spam算法的研究
下一篇:面向WS-BPEL的访问控制策略合成研究