首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

实时搜索引擎中时间信息的获取及简单应用

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-20页
   ·搜索引擎第10-15页
     ·搜索引擎的种类第13-14页
     ·网络爬虫第14-15页
   ·实时搜索引擎第15-16页
     ·实时搜索引擎中产生的背景第15-16页
     ·实时搜索引擎中的爬虫第16页
   ·实时搜索引擎的研究现状第16-18页
   ·本文结构安排第18-20页
第2章 相关技术第20-27页
   ·HTML和XML第20-22页
     ·XPath第21-22页
     ·HTML和XML对比第22页
   ·自然语言处理第22-24页
     ·自动分词技术第23页
     ·词性标注第23-24页
   ·文本聚类第24-27页
     ·文本的相似度衡量第24-26页
     ·常见的聚类算法第26-27页
第3章 页面的重构第27-53页
   ·页面的结构第27-29页
     ·文本对象模型(DOM)第28-29页
   ·页面解析器第29-31页
     ·DOM Parser第29-30页
     ·SAX Parser第30页
     ·StAX Parser第30-31页
   ·页面内容抽取的方法第31-39页
     ·HTML页面中的可视化结点第31-33页
     ·基于DOM结点信息的页面内容抽取方法第33-34页
     ·基于页面分割的内容提取方法VIPS第34-39页
   ·基于内容语义特征和可视化特征的页面重构算法第39-50页
     ·页面内容的语义特征第41-42页
     ·页面可视化结点的语义信息第42-46页
     ·基于内容语义特征和可视化特征的页面重构算法SemV第46-50页
   ·实验结果以及分析第50-53页
第4章 页面时间要素的估计第53-64页
   ·页面的时间要素第53页
   ·页面时间要素信息的获取第53-57页
     ·基于网页档案数据库进行比对的方法第54-55页
     ·基于页面内容理解的方法第55-56页
     ·基于页面之间链接结构分析的方法第56-57页
   ·基于事件模型的时间要素估计方法EOM第57-61页
     ·事件的要素与联系第57-59页
     ·基于事件对象模型的时间要素估计算法EOM第59-61页
   ·实验以及结果分析第61-64页
第5章 页面时间要素在爬虫中的简单应用第64-67页
   ·爬虫获取页面的更新信息的爬行策略第64-65页
   ·基于页面更新周期的爬虫爬行策略第65-67页
第6章 总结与展望第67-69页
   ·本文总结第67-68页
   ·工作展望第68-69页
参考文献第69-72页
作者简介及在学期间所取得的科研成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:轮式起重机设计计算平台的研究与实现
下一篇:高校计算机实验室上机管理系统的设计与实现