云原生数据库Yugabyte,开源后3年增长到200万集群,估值13亿美元
2022-08-07 17:43:40
  • 0
  • 0
  • 0

来源:阿尔法公社   作者:阿尔法公社


市场必将不断催生Yugabyte类的云原生服务在中国出现。

Yugabyte由Kannan Muthukkaruppan、Karthik Ranganathan、Mikhail Bautin三位联合创始人于2016年共同构建,它是云原生的分布式SQL数据库,旨在为全球规模的云原生应用程序提供支持。三位联合创始人均是产品和技术出身,目前担任CTO和架构师等职位,CEO则由资深的行业内人士Bill Cook担当。

经过最初的积累后,Yugabyte在2020-2021年一年半时间内完成了3轮融资,包括2020年6月的B轮融资,2021年4700万美元的加轮,以及2021年10月完成的1.88亿美元C轮融资,目前已经是估值13亿美元的独角兽。

它的C轮融资由Sapphire Ventures领投,过往的股东还包括Lightspeed Venture Partners、8VC、Dell Technologies Capital等。

Yugabyte发展迅速 ,目前拥有大约50个付费客户,包括Wells Fargo、Kroger、Hudson River Trading和Narvar等公司,其付费客户的数量还在不断增加中。

它的投资人表示, Yugabyte开源后的爆炸式增长(超过200万个集群部署在80个以上的国家)以及它既有DBaaS服务,又有自我管理的数据库,并且能适应多云环境的超强服务能力是他们看好这家公司的核心原因。

应用程序大规模向云迁移,让Yugabyte应运而生

Yugabyte的联合创始人们在Facebook相遇,他们在那里负责大规模的数据基础设施,例如Apache Cassandra和Apache HBase。他们的目标是将 Facebook Messenger等拥有大体量用户的应用程序放在具有弹性、易于管理和操作并且能处理数据中心故障的数据层上。

Yugabyte的联合创始人们

他们在Facebook经历和观察到了新趋势:微服务、容器化、高可用性、分布式、以及开发人员们对API和开源的兴趣,这些趋势未来将影响大多数企业。

几位联合创始人也意识到,随着应用程序向云迁移,数据库也应该效仿,并着手实现这一使命—搭建云原生的全球分布式数据库,为基于云的应用程序提供支持,Yugabyte也就应运而生。

在过去五年中,AWS、微软Azure和Google Cloud的年收入呈指数级增长,从70亿美元增长到700亿美元。IDC预测,未来几年将是“多云年”,疫情大流行加速了数字化转型,也推动了云计算普及。Gartner表示,到2022年,75%的数据库将部署或迁移到云平台。

Yugabyte的联合创始人们看到了明显的市场机会,数据库的潜在市场总额估计在650亿美元左右,Snowflake这样的公司在分析领域取得巨大成功,而云原生数据库的市场可能比Snowflake所在的数据仓库/数据湖市场机会更大。

企业客户在数字化转型的过程中,也开始向云原生微服务以及边缘应用程序转变,这推动了不同层级数据一致性的需求。数据不会全部托管到单个公有云中,这反过来推动了Yugabyte等分布式事务数据库的需求。

Yugabyte的CEO库克指出,如果客户想要一个跨不同层的一致事务SQL数据库,并且不想被绑定到某个特定的超大规模公共云产品中,那么客户会需要适应任何云和本地环境的云中立数据库。

促使Yugabyte这样的分布式SQL数据库崛起的另一个重要驱动因素是边缘计算的出现。

Gartner预测,到2025年75%的企业生成数据将在传统的集中式数据中心或公有云之外创建和处理。智慧城市、车联网和工业控制系统等应用正在推动对数据层的需求,该数据层可以扩展以摄取大量机器生成的数据,并提供对分析和事件的低延迟访问。跨购物、银行、医疗保健和其他行业的移动消费者和复杂的现场数字零售体验正在进一步推动向更分散的方法来部署和管理应用程序和数据,以便在更接近用户的地方提供更低的延迟和更快的处理时间。

边缘计算需要一种新型的数据基础设施。公司们正在意识到,无论是传统的RDBMS还是现代的公共云DBaaS,都无法满足近边缘和远边缘的数据需求。它们需要一个可以灵活部署在云和边缘位置的数据库,即使在边缘与外界断开连接的情况下也能提供弹性和持续可用性,并且在任何地方都易于操作。虽然这个市场仍处于初期阶段,但预计未来几年会出现结构性转变。

云原生,分布式,高安全性的新一代数据库

Yugabyte的主要产品是云原生分布式数据库YugabyteDB,DBaaS服务YugabyteDB Anywhere以及YugabyteDB Managed。

YugabyteDB

YugabyteDB将企业级关系数据库功能与云原生架构的水平可扩展性和弹性相结合。YugabyteDB就像为云原生世界重新构筑的PostgreSQL,它可以用客户需要的任何方式和位置进行部署。

此外YugabyteDB采用Apache 2.0许可,可在私有云、公共云和混合云环境中的Kubernetes、VM和裸机上运行。

YugabyteDB具有以下特点:

PostgreSQL兼容性

YugabyteDB不仅与PostgreSQL的线路兼容,而且是代码兼容的。这意味着开发人员可以方便使用PostgreSQL兼容的框架、应用程序、驱动程序和工具的生态系统来提高工作效率。

高级关系数据库功能

YugabyteDB提供了一套全面的高级RDBMS功能,这意味着开发人员不再需要在NoSQL系统的水平可扩展性和传统SQL系统的ACID保证之间做出选择。

弹性和高可用性

使用YugabyteDB,关键服务可以在节点、区域和数据中心故障期间保持可用,并能实现快速故障转移。YugabyteDB通过自动复制数据进行自我修复,并在软件升级、安全补丁和分布式备份等维护任务上实现零停机。

水平可扩展性

运营团队只需将节点添加到他们的YugabyteDB集群,即使在重负载下也可以毫不费力地进行扩展,而不会造成中断或停机。

地理分布

YugabyteDB在地理分布式环境中提供最全面、最灵活的部署选项。客户可以利用同步和异步数据复制和地理分区来实现所需的一致性、弹性、性能和合规性目标。

YugabyteDB Anywhere

对于希望在云原生环境中大规模使用YugabyteDB的企业,YugabyteDB Anywhere是一种提供简化操作体验以及全面支持和服务的产品。它是一种数据库即服务 (DBaaS),使用YugabyteDB Anywhere只需单击几下即可在世界任何地方的任何云上部署YugabyteDB。

YugabyteDB Managed

YugabyteDB Managed是完全托管的YugabyteDB即服务,YugabyteDB Managed具有全球可用性,现已在谷歌云和AWS的市场推出,覆盖全球30多个地区,通过腾讯云也可以使用它的服务。

YugabyteDB Managed还具有高安全性,使用身份和访问管理、密钥轮换、数据库访问日志记录和审计、VPC对等、网络隔离和交钥匙加密等功能,有效地保护YugabyteDB Managed中的数据。

最新版本添加多租户功能

2022年6月,Yugabyte发布了YugabyteDB的最新版本2.15,在2.14增强了性能和安全性的基础上,2.15版本增加了多租户,动态应用感知分片等功能,还新增了开源数据迁移引擎YugabyteDB Voyager。

Yugabyte与云原生数据生态结合的非常紧密,与生态内各个产品都有集成,包括服务网格的Istio,数据可观测工具Grafana Loki,HashiCorp Vault(能够保护和管理秘密和敏感的那部分数据),数据仓库Snowflake等。

Yugabyte的客户很多都分布在新兴的科技和应用领域,例如Justuno(Martech),Manrtu(数据隐私平台),Narvar(B2B SaaS),Turvo(实时协作物流平台),Temenos(金融科技)等。Yugabyte为这些客户提供简单,高可用,云原生的数据库服务,帮助他们降低数据库成本,提高数据库性能,减少停机时间。

开源后,YugaByte的数据库集群,三年增长到200万个

在越来越多的数据库选择变更开源协议以防止被“滥用”的时候,YugaByte DB选择将包括企业版在内的功能100%完全开源,采用的是Apache 2.0开源许可证。

而这也是经过了一番探索的,在创业初期,云计算还不那么普及时,YugaByte 80%是封闭的,20%开源的。但到2019年,他们改变了方向,转向了完全开源,再加上云计算及应用的大规模普及,他们的业务才开始起飞。

目前YugaByte的采用量达到了200万个YugabyteDB集群,从增长曲线来看,确实是2019年宣布开源后,采用量迎来了飞速的提升。

为何要开源?

多年以来,开源已被证明是开发和分发关键业务型基础设施软件最成功的方法。

首先,它消除了用户使用软件的阻碍,再加上开源软件具有完全的使用自由,这使得它的采用率呈指数级增长成为可能。

第二,由于大家都采用开源软件,且开源具有快速、协作和社区驱动的特质,这就为开发功能丰富的软件提供了必要的快速反馈路径,同时保持软件的高质量和可靠性。

通过开源,这些基础设施软件不但迅速获取到了大量的用户和市场,还保证其能实现快速的稳步迭代。

DB商业化与DBaaS商业化

我们能从OSS数据库商业化的历史中学习到什么?

例如Amazon Aurora为何能成功地将PostgreSQL和MySQL的巨大采用规模实现商业化。

MongoDB如何通过MongoDB Atlas将MongoDB的大规模采用率实现商业变现?

在数据分析市场,Databricks和AWS EMR又是如何通过Apache Spark开展商业化业务?

可以看到直接将OSS数据库商业化少有取得成功的例子,但通过云服务进行商业化则有广泛的成功案例。

这里深层次的原因是用户需要花费很长的时间才能建立对涉及关键业务的数据库(business-critical DB)的信任,但这种信任一旦建立,他们愿意为DB-as-a-Service (DBaaS) 带来的便利投入大量资金,尤其是他们的采用率达到一定规模的时候。

如果AWS基于OSS项目构建托管服务,那可以说是如入无人之境。虽然包括 AGPL在内的一些开源许可证会影响AWS的扩张速度,但无法阻止它对市场的蚕食。另外,AWS基于OSS项目构建托管服务也证明了此项目具有持续发展的潜力。

所以YugaByte认为,对于商业OSS公司而言,这就意味着他们必须提供足够优秀的DBaaS服务来与AWS竞争,而非只依赖于核心OSS数据库的优势。

基于上述的原因,YugaByte决定将YugaByte DB 100%完全开源,并划清 OSS数据库和商业DBaaS产品之间的界限。目前YugaByte DB的商业产品主要以DBaaS形式来体现。

在定价方面,以YugabyteDB Manage为例,它有两种方式;

一种是Pay-as-you-go (PAYG):定价0.25美元/vCPU/小时,最少2个 vCPU。使用以一分钟为增量计费,客户在月底支付实际使用费用。

另一种是传统的订阅制:一年2200美元/vCPU,最少2个vCPU,客户可以根据需要选择vCPU的数量。

作为开源的数据库厂商,Yugabyte也十分重视社区的建设,目前YugabyteDB 社区的Slack群组中已经有超过5000名用户,Yugabyte在群组中与用户交流,可以获得有关数据库使用的挑战、建议和帮助。

云原生架构趋势不可阻挡,创业公司仍有机会

微服务、云基础设施和DevOps以及新兴数据技术栈的兴起给传统的技术基础设施架构和数据库带来了很大压力,它们的一些特性和性能已经不能满足新一代高科技应用的需求。

而云原生加分布式数据库则是未来趋势,而且已经形成了一个新兴的赛道,即NewSQL。在这个赛道上,既有巨头玩家,也有和Yugabyte一样的独立公司,在中国市场,同样有云原生分布式数据库的出现。

巨头方面,Amazon Aurora和Google Spanner是典型代表,但是正如之前提到的,巨头的产品是基于各自的AWS和Google Cloud的产品,相对更封闭。

独立公司产品方面,除了Yugabyte之外,目前Couchbase和Cockroach是典型代表。

Couchbase于2021年7月在纳斯达克上市,它提供完全托管的名为Capella的数据库即服务 (DBaaS) 产品,以及需要客户自己管理的Couchbase Server。这些产品都支持混合和多云功能,开发人员可以更容易的在应用程序和云之间无缝同步数据。此外,Couchbase也十分关注边缘计算的趋势,他们的产品在这个方面做了针对性的优化。

Cockroach在2021年获得了2.78亿美元的F轮融资,目前是估值50亿美元的独角兽。它的产品有三种选项,包括完全托管的DBaaS服务,按照消费定价的无服务器版本,以及相对传统需要自建基础设施的自托管版本。它有200名付费客户,包括Bose,康卡斯特和Netflix等对于数据库性能要求很高的大公司,其业务相比之前增长了500%。

在中国市场,云原生分布式数据库的代表是阿里云的PolarDB-X,它采用储存计算分离架构,能够满足公有云和专有云的不同部署要求,在性能上也经过了“双十一”的考验,收费方面是订阅制和按量收费两种。在2021年阿里云已经将其开源。

云原生技术架构目前方兴未艾,而云原生数据库作为云原生技术基础设施的核心部分,未来市场空间巨大。在这个赛道上,虽然已经有了巨头玩家和先行者,但创业公司只要找到自己合适的目标市场和竞争优势,仍有机会占据一席之地。

*本文由阿尔法公社综合创作,部分素材来自Yugabyte的官方博客。



 
最新文章
相关阅读