语义和虚拟化、 数据集成和数据治理正在走向云
atScale是一家数据虚拟化分析提供商。这意味着AtScale提供了一个抽象层,使其用户能够以简化的方式访问它支持的底层数据存储。上一次我们报道AtScale,是在2016年11月,AtScale刚刚从Hadoop框中爆发出来。今天,AtScale宣布了它在多云和混合云分析、数据平台灵活性和时间分析方面的飞跃,并推出了AdaptiveAnalytics2020.1平台发布。
ZDNet与AtScale首席执行官克里斯·林奇(ChrisLynch)联系,讨论数据和分析市场以及AtScale在其中的定位。
宣布AtScale自适应分析2020.1强调安全、自助服务分析,同时加快底层数据存储的性能。根据AtScale的云数据仓库基准报告,AtScale降低了10倍的计算成本,提高了12.5倍的查询性能,并提高了61倍的用户并发性。
从概念上讲,AtScale实现这些结果的方式仍然是一样的,它从2016年开始就一直这样做:设计、缓存、查询。在AtScale2020.1中的其他增强包括一个虚拟立方体目录,用于简化数据资产管理和粒度策略控制,该策略与现有的企业数据目录提供集成。
然而,今天的数据和分析景观是不同的。这就是推动与林奇交易的原因。此前在ZDNet上,Lynch表示,他的目标是确保在Hadoop上运行该产品的AtScale客户的百分比将与Hadoop在分析市场中的份额相称,相对于其他平台。
这是官方的:Hadoop是遗产,AtScale首席执行官克里斯·林奇说
我们自己的感觉是,今天,大多数现有的Hadoop本地部署都是遗留的。一些正在迁移到云中的新Cloudera。一些到新的Cloudera分布的前提。一些给Databricks。还有一些到云中的数据仓库。林奇证实,客户在市场上的数据平台选择正在发生巨大变化:
“我们继续在Hadoop环境下预订新的业务和扩展。然而,这是规则的例外。我们没有看到新的客户希望在Hadoop(或Teradata或Oracle)上部署网络新的基础上。相反,我们看到像Snowflake、Google BigQuery和Amazon Redshift(按顺序排列)这样的云数据仓库是AtScale最受欢迎的目标数据平台。
就像前提Hadoop一样,我们看到客户有兴趣在Teradata和Oracle等遗留数据仓库上部署AtScale,但他们的意图是保持稳定或减少这些平台投资,并专注于公共云中的新工作负载。
由于AtScale将这些数据平台选择虚拟化,我们的客户真的很喜欢这样一个事实,即他们可以利用他们在本地数据平台(Hadoop、Teradata、Oracle)上的现有投资,同时迁移到云中,而不会干扰他们的下游用户。我们给我们的客户一个迁移路径,不需要大规模撕裂和更换”。
林奇接着补充说,在云数据仓库方面,他们看到了来自Snowflake的巨大吸引力,GoogleBigQuery遥遥领先第二,Amazon Red Shift遥遥领先第三,Azure SQL/DW并没有真正出现在雷达上。谷歌BigQuery和Snowflake真的很受零售商的欢迎,而亚马逊Redshift却以此为代价。AtScale的云数据仓库基准报告对这些产品的性能进行了深入分析。
从战壕里听到这些洞见是肯定的。但尽管这可能很有用,但这只是一个快照-工具和偏好的变化。然而,就AtScale而言,一个关键点是,它的中间件、语义层是否只能具体解决这些解决方案,或者它也可以应用于其他解决方案。
林奇说,从一开始,AtScale的平台就被设计成与任何公开JDBC接口的数据平台进行对话。选择Hadoop作为第一个进入市场的目标,但产品绝不局限于该平台:
“要成为一个通用的语义层,您必须与任何数据平台进行对话,并允许来自任何数据使用者(BI、AI或自定义应用程序)的连接。我们就这么做了。在本版本中,我们扩展了我们的虚拟化功能,允许在一个虚拟立方体中混合来自多个数据平台的数据。
我们扩展到其他数据平台只是我们基于客户需求的正常工作过程。例如,在本版本中,我们增加了对Teradadata、Oracle、SQLServer和DB2等基于客户请求的遗留数据仓库的支持。
语义和虚拟化、数据集成和云端数据治理
对我们来说,这就是我们需要开放讨论的地方,包括我们认为真正的语义。自适应分析2020.1平台发布由3个支柱组成。一种多源智能数据模型,一种虚拟立方体目录,以及自我优化的查询加速结构..
前2个在我们看来分别是数据集成和数据治理的1-1匹配型,林奇确认数据集成是AtScale的主要用例,数据治理是接近第二..
一旦你有了一个通用的语义层,包括智能虚拟化,并为分析优化,林奇说,许多用例打开。首先,他接着添加了一个通用的语义层,客户可以始终如一地执行数据访问策略和安全性,无论数据存储在哪里或谁在查询它。
我们不会反对这一点。然而,我们想知道的是,提供同样好处的知识图技术,但也恰好是标准化的,而不是AtScale的专利技术,是否可以作为替代方案。
林奇回答说,AtScale已经建立了一个基于图形的查询优化器和规划器并获得了专利,这对他们来说是一个关键的技术区别。这也许是对的,但它并没有涉及我们认为知识图表标准化最重要的方面-数据模型本身。使用AtScale,以及任何专有实现,数据模型和映射也是专有的。
就未来计划而言,虽然林奇没有分享具体细节,但他暗示即将在部署策略和自主模型创建和数据发现方面进行创新。
我们从中得到的启示是相当清楚的。AtScale继续沿着它为自己开辟的道路执行任务,显然取得了成功。通过这样做,它为我们提供了宝贵的见解,数据和分析景观今天是什么样子。此外,我们还可以添加一个提示,说明它的发展方向:语义和虚拟化、数据集成和数据治理。