Informatica在云数据管道上增加了一倍

科技2020-10-28 15:54:24
导读在过去的几年里,我们一直专注于云原生架构如何改变数据库的研究。通过将计算与存储分离,数据库提供者能够通过无

在过去的几年里,我们一直专注于云原生架构如何改变数据库的研究。通过将计算与存储分离,数据库提供者能够通过无服务器部署简化操作;利用快速的互连和廉价的存储来扩展复制,从而提高服务水平;并通过利用存储中的智能重新定义事务提交的方式。

由于企业越来越需要处理来自数据中心内部和外部的数据,因此集成平台即服务(IPaaS)已经成为一个竞争非常激烈的市场。IPaaS市场非常拥挤,包括一系列专注于应用程序和/或数据集成的提供商。

我们最近有机会深入研究Informatica的智能云服务(IICS)。这实际上是Informatica在云中的第二次尝试,因为它将整个Informatica组合重新设计为一个云本地平台。IICS于2016年推出,最近其对Informatica投资组合的覆盖达到了临界质量。

这家公司最近因为达到几个关键的里程碑而上了新闻。自私有化以来,该公司首次实现了10亿美元的经常性收入,他们刚刚宣布换届,由产品主管担任CEO。

说得更简单一点,Informatica也发现了数据目录的bug。是的,我们对目录也有自己的抱怨,因为我们一直认为数据目录应该是更广泛的集成解决方案的一部分,而不是它们自己的竖井。但事实是,在大多数组织中,企业数据目录的概念将被证明与实现企业数据模型和主数据管理方案一样实用和可能。不管怎样,数据目录有很多种。对于拥有或使用数据的人员或部门组织来说,数据可能是一种个人化的东西,因此部门或部门级别的数据目录具有不同寻常的持久力。好吧,我们说的是你。

因此,Informatica将其数据目录定位为“目录的目录”是很现实的,因为大多数组织可能会有多个目录。Informatica的目录旨在成为从各种点获取元数据和发现关系的结缔组织。Informatica将其目录嵌入到其投资组合的元数据层。

言归正传,Informatica的云集成平台即服务(IPaaS)。platform展示了将以前一系列不同的工具重构和重新架构为基于云的微服务体系结构的可能性。

基于通用元数据核心,有不同的连接和集成层,其中触发了摄取和ETL操作;用户体验;以及处理引擎,在那里你可以选择执行方法的选择,如星火批处理,实时串流。系统通过将处理推到数据存储位置附近来自动优化执行模式。例如,可以将SQL调用推入数据库,将Spark处理推入数据湖,而实时物联网处理则直接推入流引擎。它允许对工作负载进行物理分离,因此可以同时进行摄取、复制、查询处理、数据质量和数据分析,同时最小化或消除干扰。

通过将计算从存储中分离出来,并将公共功能抽象到微服务中,它允许平台利用无服务器操作,消除了管理来自客户的自动标度的负担。通过重构数据管理服务的“核心平台”(例如,运行时、安全代理、集群、连接等),可以促进重用,并使系统能够更好地抵御错误——这是交付一致sla的关键。

当然,如果不强调机器学习的作用,任何关于托管云服务的对话都是不完整的,因为两者都有共生关系。的关键画云是操作简单,它可以提供,管理云服务,服务提供者可以从客户如何使用其服务的“学习”提供指导经验,可以进一步简化操作和快速调试操作问题,否则沼泽人在故障排除。反过来,通过操作托管服务,云提供商拥有为ML模型提供数据的宝贵日志。在我们2019年的年度展望中,我们谈到了云和机器学习与数据库的关系:云将重新定义数据库的架构,机器学习将运行它。这同样适用于作为服务提供的任何平台,如IPaaS。

Informatica一直在稳步增加机器学习在其服务中的使用,并将其打上了克莱尔(CLAIRE)的烙印。它不是一个独立的特性或单一的算法,而是ML的一个保护伞,它使跑腿工作自动化,以保持操作简单。例如,如果一个集成作业由于缓存问题而失败,那么CLAIRE会“响应”建议重新调整缓存。虽然它听起来可能不像解决世界饥饿问题的人工智能模型那样引人注目,但在托管的云服务中,ML提供的适度优化(如重新调整缓存)是有意义的。

免责声明:本文由用户上传,如有侵权请联系删除!