Web Mashup模式发现及编排优化技术
【摘要】:在最近十几年,Web相关技术得到飞速发展,特别是移动计算技术使得Web应用无处不在。Open API实现了将网站服务、数据、内容等封装成一系列计算机易识别和访问的数据接口,并发布出去供第三方开发者构建Mashup应用。通常来讲,Web Mashup指的是将来源不同的两个或多个Open API,按照一定模式进行糅合,从而完成用户特定的任务需求。例如,Housingmaps.com是Google Map API与Craigslist的RSS集合而成的典型Mashup应用。自从其上线以来,Mashup引起了业界的广泛关注并得到了迅速的发展。为了便于向用户提供更好的服务,许多Web公司都选择将其核心业务以Open API的方式进行发布,从而导致了Open API数量和种类的快速增加。丰富的Open API为Mashup应用提供了服务实现基础。但是,大量的Open API又为简化用户构建Mashup过程中的Open API选取、Open APIs编排模式的选择提出了巨大的挑战。针对上述问题,本文以Mashup模式为基础展开了研究。本文的主要内容和创新成果包括以下四个方面:(1)提出Mashup有向编排模型。一个Mashup应用由两个或多个Open API共同参与完成,Open API构成了Mashup应用的基本组成元素。Open API之间的数据交互形成了Open API的组合关系:串行和并行组合关系。Mashup有向编排模型形式化地描述了Open API的组合关系,为接下来的模式发现提供了依据。(2)提出频繁Mashup编排模式发现算法。Mashup有向编排模型是一个有向图,图的顶点表示Open API,边代表Mashup中Open API之间的组合关系。它具有节点个数少、边稀疏的特点。在Open API库中,每个Open API都分配有一个唯一编号,标识Open API的唯一性。结合这些性质,本文提出频繁Mashup编排模式发现算法FSOMM。它可以准确有效地挖掘出Mashup中的频繁模式。(3)提出基于频繁模式的索引结构MPLIndex。Mashup的特征可以用频繁模式来描述。利用形式概念的理论,将Mashup模式集合描述为概念的外延,频繁模式特征描述为概念的内涵,建立了频繁模式的索引结构MPLIndex,并将索引放入缓存中,降低Mashup模式的检索时间,从而提高Mashup的编排效率。(4)实验论证。通过模拟数据集和真实数据集验证了算法的性能。通过将FSOMM算法运用于真实数据集,实现了真实频繁Mashup编排模式的挖掘。通过模拟数据集验证了MPLIndex的可扩展性和查询性能。
【关键词】:Mashup应用 频繁编排模式 Open API 图索引
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09