近日,正式发布,推出了时序集合等重磅新特性,进一步拓宽适用版图。与此同时,这款分布式文档数据库在 DB-Engines 最新公布的 中高居第 5 位,且分数还在不断增加,成为国际数据库市场上最受欢迎的 NoSQL 数据库产品。

自 MongoDB 公司于 2018 年之后,MongoDB 曾一度陷入巨大的争议漩涡,导致了当时很多企业用户的弃用,不少人对 MongoDB 的发展持消极态度。三年过去,MongoDB 却以持续增长的态势稳坐 NoSQL 数据库一哥的位置,出乎了很多人的意料。

MongoDB 在国内的现状

MongoDB 中文社区创始人、前 MongoDB 大中华区技术总监唐建法(TJ)是资深的数据库技术专家,多年来一直从事 MongoDB 的相关工作。早在 2016 年时,TJ 曾指出国内对 MongoDB 的认知程度不够,以至于大部分时候都是使用在非关键型应用场景。发展到今天,TJ 一路见证了 MongoDB 在国内的成长,越来越多的国内企业和开发者开始接受和使用 MongoDB。

TJ 表示,自己虽然已经离开了 MongoDB 团队,但仍作为 MongoDB 中文社区创始人,一直在关注着 MongoDB 在国内的发展动向。

“MongoDB 这些年来在国内的发展一直是非常棒的,我们观察到很多企业都已经接受了其在很多关键场景可以发挥独特价值的地方,我身边一半的创业公司都在使用 MongoDB。”TJ 说。在金融场景,中国银行、招商银行以及太平洋保险、泰康等这些头部金融行业,都开始使用 MongoDB;在很多公有云平台,MongoDB 也成为除了 MySQL 之外使用最广泛的一个数据库之一。

而在社区方面,TJ 创立的 MongoDB 中文社区也已经从最初的几十人发展到了今天的数万人。TJ 表示,在疫情解除后,社区的技术交流活动也会回归正常,今年社区在长沙、杭州、北京等地举办的技术交流活动也吸引了大量的 MongoDB 爱好者参加。

如今的 MongoDB 在国内的发展可谓是欣欣向荣。

MongoDB 的特色

在传统关系型数据库老而弥坚,新兴 NewSQL 数据库风头正盛的今天,MongoDB 又是凭借什么优势在数据库市场中立足的呢?

TJ 告诉我们,MongoDB 是一个比较通用的多用途分布式文档数据库产品。与其他主流数据库相比,它的核心亮点是其弹性 JSON 模型,对应用开发非常友好,可以数量级的降低数据库开发的工作量。

经过这些年的优化迭代,MongoDB 可以像 MySQL 一样,支持 ACID 事务,可以作为大部分 APP 的后台数据库。它原生的 Shared Nothing 的分片架构,可以提供非常强大的扩展能力,支持类似于字节跳动这样海量用户的高并发访问。

MongoDB 通过 RAFT 协议来支持多节点互备,而不是传统的通过落盘来保证数据的持久性,这样能够以接近内存数据库的速度来为那些对响应延迟极低的应用提供支持,用户往往不再需要 Redis 这样的专用缓存。

此外,它的 Change Stream 功能就像一个 Mini-Kafka 一样,能够为 pub-sub 场景提供一个非常方便的队列功能。

正是看中 MongoDB 的这些特性,TJ 决定将其用来作为实时数据服务平台的存储方案,开启了自己的创业之路 —— 创办 Tapdata。

MongoDB:创业者的不二之选

Tapdata 想要解决的问题是传统企业 IT 架构的“数据孤岛”现象,即为客户提供实时打通多源异构数据库的能力。

事实上,这些年来为解决“数据孤岛”出现的产品并不少见,从数仓、数据湖再到数据中台,可以发现,三者支持的核心业务场景还是偏 BI 报表、各种数据分析等 OLAP 场景,重在对历史数据做洞察和分析。而一个能为企业提供即时数据、用于 OLTP 业务支撑的实时数据平台却少之又少。正是看中了这一市场空白,Tapdata 决定以实时数据为服务,打造一个面向 TP 的实时 DaaS 平台。

不过 TJ 也指出,Tapdata 的 DaaS 平台与其他数仓和大数据平台并不是非此即彼的关系,因为 DaaS 是以数据服务为导向的数据平台,并不企图大而全地支撑起所有数据业务,因此可以和数据湖和数仓形成上下游关系,为其提供完整、统一、准确的实时数据。用 TJ 的话说就是:“我只把数据像自来水一样给到你,你把‘水’拿过去以后,是用去做饮料还是啤酒,由你来定。”这也是 Tapdata 创立的初衷:Make Your Data on Tap!

TJ 介绍,相比于动辄需要 5-10 个开源技术栈集成起来的大数据平台,Tapdata 实时数据服务平台依赖 MongoDB 的特性实现了部署运维轻,学习成本低等高度产品化的优点。其中的核心技术优势,则是实现了覆盖数据采集到存储过程的全链路实时。

Tapdata 目前面向的数据管理人员、应用开发或者架构师,在定位上更偏向基础软件。关于如何让市场更好的理解这一点并接受,TJ 表示有一个明确的“开放+开源”的路线图。

开源商业化的探索

在基础架构软件领域,开源是最快提高市场接受度的一种模式。2021 年可以说是开源商业化爆发的一年,根据 oss capital 的统计,截止到 2021 年上半年,仅仅 6 个月的时间里风投公司对开源商业公司的投资额已经超过了 50 亿美元,全年产品融资额已经达到甚至超越此前 20 年的总和。但是作为一个从市值 230 亿美元的开源商业化大坑里爬出来的老兵,TJ 表示他还在琢磨 Tapdata 开源后最合适的商业化模式。

据悉,在代码开源之前,Tapdata 会通过云上开放的方式,以另一种方式将核心产品能力免费提供给社区。Tapdata Cloud 已于近日正式推出公测版(http://cloud.tapdata.net) , 目前这个版本还只是 Tapdata产品的一部分功能,但是已经可以独立完成多达十几种数据库的异构数据同步能力,为新业务扩展,缓存加速, 全文检索,数据库备份容灾等很多新型业务场景提供生产级的支撑。

TJ 表示 Tapdata 的这款云产品其实已经在数月前成功和移动公有云 ecloud 合作上线,为移动云上和云下所有的数据库提供上云和云间同步迁移能力。所以大家可以放心使用。Tapdata Cloud 目前的版本现在和将来都不会收费。由于其架构的特性,运营管理成本完全可以持续由 Tapdata 公司来承担。TJ 希望通过免费云版开放来让大家体会到实时数据的巨大价值,并能够进一步了解并采用 Tapdata 的 Real Time DaaS 数据架构及产品。

下一步,在完成必要的准备工作后,Tapdata 将会把核心模块的代码开源,使得不能上云的用户也能使用到 Tapdata 的技术。也是通过这样的策略,Tapdata 将海外市场作为未来增长的重要方向。事实上,在尚未开源和推广的情况下,Tapdata 已经获得了若干海外付费客户,并于今年 7 月获得了数千万美元的融资。

最后,TJ 也为自己的创业团队打了个小广告:“Tapdata 正处于高速发展的时期,希望能有更多技术大牛加入我们,我们会提供书面期权等丰厚的福利。”

嘉宾简介

唐建法(TJ),MongoDB 中文社区主席,Tapdata 创始人,前 MongoDB 大中华区技术总监

8 月 1 日,TJ 将作为全球开源技术峰会 GOTC 2021 深圳站的演讲嘉宾,在「分布式数据库与存储」分论坛上带来主题为“基于 MongoDB 构建实时数据中台的技术实现和挑战” 的精彩演讲。TJ 将在本次分享中为大家讲解什么是实时数据中台,核心技术需求都有哪些,技术选型的主要依据什么,以及快速落地的方案。通过本次分享你将了解基于 MongoDB 的特点和特性,快速落地实施数据中台系统的关键技术细节。

详情请查看:https://gotc.oschina.net/forum/lists/2/34