首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

城市移动黄页信息定向采集与管理技术的研究与应用

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-14页
   ·课题背景与意义第8-9页
   ·国内外研究现状第9-12页
     ·数字旅游技术国内外研究现状第9-10页
     ·Web 信息采集技术国内外研究现状第10-12页
   ·课题的主要工作第12-13页
   ·论文组织结构第13-14页
第2章 Web 信息采集技术第14-20页
   ·Web 组成及相关技术第14-17页
     ·Web 组成第14-15页
     ·XML 与 DOM第15-16页
     ·Web 语义第16-17页
   ·Web 信息采集系统简介第17-18页
     ·基本概念和结构流程第17页
     ·工作过程第17-18页
   ·本章小结第18-20页
第3章 Web 信息定向采集关键技术研究第20-38页
   ·基于正则表达式抽取策略的页面清洗第20-25页
     ·页面清洗思路第20-21页
     ·旅游网页特征及结构分析第21-24页
     ·正则表达式匹配抽取过程第24-25页
   ·基于扩展 XPath 策略的信息抽取第25-31页
     ·信息抽取方法和特点第26-28页
     ·旅游网页信息抽取的系统框架第28-29页
     ·旅游网页 XPath 抽取规则的建立第29-31页
   ·基于旅游主题的页面相关性判别第31-37页
     ·主题相关性判别方法分析第31-35页
     ·综合相关性权重的改进 PageRank 算法第35-36页
     ·综合 URL 主题和页面主题进行判别第36-37页
   ·本章小结第37-38页
第4章 数据管理分析与研究第38-52页
   ·数据组织第38-41页
     ·数据源及数据源映射策略第38-40页
     ·数据存储策略第40-41页
   ·数据转换与聚合第41-51页
     ·数据语义描述第42-43页
     ·基于 XML/RDF Schema 的数据语义聚合方法第43-51页
   ·本章小结第51-52页
第5章 黄页信息采集系统设计与实验分析第52-68页
   ·系统总体设计第52-56页
     ·设计思想第52-53页
     ·系统结构和功能模块第53-56页
   ·系统界面以及主要功能第56-57页
   ·系统关键技术实验分析第57-66页
     ·页面清洗第58-61页
     ·信息定位和抽取第61-65页
     ·主题相关性判别第65-66页
   ·实验结果分析与评价第66-67页
   ·本章小结第67-68页
结论第68-70页
参考文献第70-74页
攻读硕士学位期间发表的学术论文第74-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:中文文本分类中的特征选择和权重计算方法研究
下一篇:基于树模式查询的XQuery递归查询优化技术的研究