APP下载

数据云,Snowflake与星环科技殊途同归

2020-01-11郭涛

中国信息化周报 2020年50期
关键词:数据仓库容器数据库

郭涛

时值岁末年初,又到了各个市场进行盘点的时候。虽然受到疫情的影响,但是今年一些重要的IPO还是值得我们关注和深思,因为它们可能代表着未来的发展方向。其中,2020年9月16日上市首日便冲破发行价、估值超700亿美元的Snowflake,如今已经成为美国硅谷乃至全球最红的数据独角兽。Snowflake受到追捧的关键点之一便是其全力打造的企业“数据云”平台。数据云的概念一下子火了,成了云原生时代数据应用与服务领域一面新的旗帜。殊不知,早在2018年,国内的星环科技就已经率先提出了“数据云”的概念,如今星环数据云(Transwarp Data Cloud,简称TDC)已经升级到2.0版本。

现在,我们大可不必纠结到底是谁第一个提出了“数据云”这个概念,最重要的是,数据云作为以数据为驱动和核心的新型数字化基础设施,将成为云上数据处理、分析和实现智能应用的基石和支撑。

以数据为核心的云底座

我们首先要明确的一点是,数据云是一种新型的数字化基础设施。在它出现之前,云平台的建设方式是以资源为中心的,比如我们耳熟能详的IaaS。数据云的不同之处在于,它是紧紧围绕着数据这一核心而打造的云平台,旨在冲破应用和数据的壁垒。

为什么会有这种转变?从工作负载的需求入手进行分析就比较容易理解了。业界早就有这种共识,互联网应用这类无状态的应用比较适合构建在IaaS上,可以满足其灵活伸缩、调度的需求。而像数据库、数据仓库、数据湖这类以数据为核心的有状态的应用究竟要如何上云呢?实践证明,只有在容器云平台上,才能在弹性、利用率、多租户、安全性等方面更好地满足这类数据应用的需求。云原生成了必然选择。

从容器技术的出现,到CNCF的成立,再到云原生的火爆,轻量级的平台、存算分离的架构、与应用层更紧密地衔接等为基于云原生的数据云的诞生做好了理论和技术上的铺垫。

同为新型数字化基础设施,数据云与IaaS之间又是什么关系呢?以星环科技的数据云平台为例,它的定位是PaaS,是一个与IaaS兼容并蓄的平台。以前,IaaS、PaaS和SaaS作为最典型的云的三种模式,彼此之间的界线是泾渭分明的,但是现在融合的趋势更为明显,比如后来出现的所谓aPaaS平台或iPaaS平台。星环数据云基于云原生、大数据和 AI技术构建,通过统一的云操作系统层支持异构的CPU和操作系统,既可以运行于私有云、公有云和混合云等各种IaaS之上,也可以脱离开IaaS,直接运行在物理机上,能够以多租户和服务的方式提供对数据库、数据仓库、数据湖、数据工程、数据科学家和数据应用开发等多种数据工作负载的支撑,同时提供低代码平台、DevOps、微服务治理等能力,加速企业数据和应用上云。

我们再换个角度,从现在比较热门的中台的视角来审视数据云,它实际上就是将数据中台、AI中台、业务中台和技术中台以数据和应用为中心,更加有效地协同在一起,统一支撑应用类无状态的工作负载以及数据类有状态的工作负载。

从本地到云上,数据的应用与处理到底发生了什么样的变化?以数据仓库为例,以前在本地运行时,扩展、迁移、备份等很多工作都需要手工介入,不仅周期长,而且效率低。由于这套系统资源比较固定,因此一般只开放给有限的业务或用户使用,不能以类似SaaS的方式服务于一线业务人员。而在上云后,基于容器的数据云平台的灵活伸缩和调度能力,以及多租户模式等不仅可以加快数据工作负载的部署和运行,而且可以同时服务企业内部有不同需求的多个部门,并基于容器来实现安全的隔离,在数据安全和服务共享之间形成一个有效的平衡。在一个统一的数据云平台之上,过去可能需要几天甚至几周时间才能完成的数据仓库的部署,现在可能只需一小时便可完成。由传统本地的垂直部署方式到云上平台化的横向部署和应用模式,数据云带来的效率、多租户、安全性、灵活性等方面的提升显而易见。

在数据上云后,企业用户从思想观念到系统和应用的构建方式都需要来一次彻底转变,以前习惯的项目制方式,现在则变为了平台化的部署模式。首先打造一个统一的数据云平台,作为数字基座,它集数据的采集、存储、交换等于一体,形成一份统一的数据,可以轻松实现数据的查询、分析等功能;然后在此数据云平台之上,企业用户可以任意构建数据库、数据仓库、数据湖等与数据相关的工作负载,效率更高,也更易扩展。

数据云“姓公姓私”

用户需求说了算

Snowflake成立于2012年,星环科技成立于2013年,回顾两家公司的发展历程,有着惊人的相似之处,大致都经历了从云上数据仓库到云上数据平台,再到数据云的发展过程。所谓英雄所见略同,如今两家公司一中一外都扛起了数据云的大旗,交相辉映。不过,中外云环境、用户需求和使用习惯,以及两家公司在数据云平台的技术和实现方式上的差异,造成了两家公司在各自数据云平台的定位、应用和推广上存在着明显差异。

Snowflake最早提供的是云上的数据仓库,最近几年不断深化DaaS(Data as a Service)服务,提供更多如数据服务、数据共享交换等能力,逐步完善成为能够提供包括数据仓库、数据湖、数据工程、数据共享在内的数据云,通过构建在AWS、Azure、Google Cloud三大公有云平台之上,利用公有云的IaaS资源。

星环科技早期也主要提供包括分布式分析型数据库、NoSQL数据库等在内的数据库服务,主要面向国内大型企业,从2014年开始研发基于容器云技术的数据云服务,并于2018年发布了面向私有化的数据云产品。

TDC是一个PaaS平台,不仅包括上层的DaaS部分,还提供了包括应用PaaS和智能分析PaaS在内的PaaS能力,还直接提供各类数据库服务,目前主要是以私有云的方式部署在客户的数据中心内提供服务支持。星环科技的数据云平台既可以支持星环科技自己的数据仓库、数据湖、数据分析等应用产品,也可以支持企业客户原有的数据类工作负载。

一个是基于公有云的SaaS服务,一个是部署在私有云环境中的PaaS平台,之所以会产生这样的差异,主要是因为中美在云计算的发展,以及用户使用习惯等方面的差异。在美国,云计算市场主要是由包括AWS、Azure、Google Cloud Platform等在内的三四家巨头垄断,公有云发展相对成熟和完善,企业用户要么就还在使用虚拟机,要么就一步跨入公有云,选择第三条道路的很少。而在中国,情况则复杂得多,不同企业用户处于数字化转型的不同阶段,需求各异,私有云、公有云、混合云甚至专有云,都有各自数量不少的拥趸。在这种情况下,从供应商的角度,只能選择自己擅长的技术,以及专注的客户群体作为发力点。从中国市场和客户的实际需求出发,星环科技的选择也是顺理成章。

在这里需要特别强调的一点是,星环科技不仅率先推出了数据云平台,而且是最早基于容器技术打造的云原生平台,通过提供完整的数据、应用和智能的开发工具,帮助企业实现数据和应用互联互通,是一朵真正意义上的数据“云”,并且在上海市区多个政务数据中心,以及多个大型央企实现了生产落地,帮助大型企业客户提升了数字化业务的速度。容器或者说云原生,将成为衡量一朵数据云是否真的“地道”的重要标准。

数据云 殊途同归

对于星环科技和Snowflake来说,数据云最开始可能只是它们各自独有的,或者说实现差异化竞争的利器。但从资本市场上Snowflake掀起的热潮,以及越来越多业内厂商对数据云的关注可以预见,数据云未来将成为一个新的行业标准或一类通用的技术框架,这一概念将得到快速普及和推广。从市场竞争的角度看,无论是从技术的先进性、平台的成熟度,还是在生产系统中的大量实践积累,星环科技与Snowflake在数据云市场领先了一步。

就像星环科技专注PaaS和私有云,而Snowflake以SaaS和公有云服务见长,在数据云这一明确而统一的发展方向上,不同的企业可能对数据云的内涵和外延有不同的解读,甚至打造出不同的产品和服务模式,但是殊途同归,都是为企业用户数据上云提供坚实、可靠的数字化底座。

猜你喜欢

数据仓库容器数据库
Different Containers不同的容器
难以置信的事情
基于数据仓库的住房城乡建设信息系统整合研究
数据库
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
数据库
数据库
数据库
取米