谷歌云平台开始填充它的数据栈
当谷歌云平台(GCP)在其去年春天的下一次会议上展示了一系列高管背书时,其中一位与会者的评论为GCP的吸引力带来了宝贵的启示。可口可乐的首席技术官指出,GCP的先进“NoOps”技术使其能够将全球300多万张照片中的幸福旗帜拼在一起。他的辞职是可口可乐2014年世界杯数字营销活动的明星。但迅速动员病毒内容的能力,并不一定是cio或cto会联想到的那些更平凡的工作,比如SAP或甲骨文(Oracle)。
这就是谷歌想要改变的说法,它今天推出了三种企业数据平台。谷歌正在穿越亚马逊早在10年前就铺设的老路,寻找方法来揭示、货币化和交付它用来运行核心业务的技术。
今天的公告包括云SQL,谷歌的管理MySQL服务;云数据存储,支持谷歌应用引擎平台即服务(PaaS)的JSON NoSQL数据库;还有Cloud BigTable,它是最初启发HBase的数据平台的公共云版本。
云SQL类似于Amazon Aurora,因为两者都是完全托管的MySQL实现,都适用于云。这意味着跨三个区域或实例复制容错,在Aurora的情况下,每个区域复制两个数据副本。两者都对数据进行加密,并运行在高性能SSD闪存驱动器上。主要的区别在于Aurora更加成熟(云SQL现在只是从两个beta中出现),并且优化了与其他组件或特定于每个玩家栈的服务的集成。Aurora是与MySQL兼容的,因为它与MySQL api兼容,而谷歌声称云SQL是一个更普通的版本,只是少了一些像超级特权用户角色这样的功能,否则备份就会遭到破坏。
云数据存储是Amazon DynamoDB和Microsoft DocumentDB的对应项。虽然DynamoDB在商业版本中先于云数据存储,但谷歌在2008年首次将该数据库作为谷歌应用程序引擎的一部分。新的是GCP版本将数据库与应用程序引擎解耦,尽管它仍然支持使用服务器端脚本。否则,这些引擎都具有类似的规格,比如提供可调的一致性。但在ACID事务支持上存在差异;云数据存储将单个事务中可以读取或失败的多个操作分组;DynamoDB依赖于酸支持的应用;而DocumentDB的ACID保证仅限于单个分区内的数据。
当然,如果不提到MongoDB,对JSON云数据库的讨论就不完整。虽然已经有几个第三方将MongoDB作为一种服务提供,但Mongo自己现在也开始涉足Atlas云服务。明显的不同之处在于,对于大型的MongoDB安装基础,在云计算中没有新的数据库需要学习;虽然MongoDB数据库平台相当成熟,但它的云服务是全新的,而且还在逐步发展。
虽然Cloud Datastore的目标数据最多是几tb的数据,但如果您的目标更高,那么就应该转向HBase、Cassandra或Cloud BigTable,后者是启发了其他两个数据库的谷歌宽列数据库。除了Cloud BigTable执行原子性、单行操作的能力外,其他功能也类似。这是一个合作的例子,BigTable与HBase共享相同的API,您可以通过谷歌的云DataProc服务访问HBase,该服务包括Hadoop堆栈的其余部分。因此,云BigTable的关键区别在于服务的管理方面。
最新版本的云存储、谷歌的对象存储,类似于Amazon的S3和微软的Azure BLOB存储,以及托管的SQL Server 2016服务的开始,目前涵盖了标准版和周三版(企业版将随后推出)。
由于Amazon S3实际上已经成为云中大量存储数据的标准,因此谷歌将其对象存储设计为使用相同的api来鼓励迁移。这个版本的新功能是支持在摄取数据时加密数据,但将密钥限制在客户端(一种防止有人侵入谷歌云来破译数据的安全措施);性能增强,减少或消除从归档中检索数据的3 - 5秒延迟,使数据可用于分析。
由于这些是谷歌的数据平台的第一批产品版本(它们之前是通过公共测试版提供的),所以必须通过正在进行的工作来观察一切。虽然谷歌正在构建技术构件,但它仍在构建交付和支持渠道的过程中。今天,谷歌以其先进的技术而闻名,特别是它的NoOps方法,即在一个黑盒中自管理操作。它还以先进的人工智能/机器学习能力而闻名,与行业主流不同的是,这种能力正以深度学习作为起点。但是,当涉及到运行企业的heartbeat工作负载时,谷歌有责任证明,它的NoOps方法对于单调乏味的工作负载来说,就像它对于整合复杂的全球数字营销活动一样成熟。