TEDxZhichunRd秉承TED理念“Ideas worth spreading”,传播科技创新成果,以TEDx演讲为核心价值,通过多种衍生形态为汽车、汽车金融、科技等行业同行、专家学者提供平台。为了打造全国最大的创新者发声平台,TEDxZhichunRd联合爱分析,对行业内创新人物进行采访,了解公司发展,树立品牌形象。

本期采访到的是红象云腾创始人童小军,他将就红象云腾的产品、经营策略,以及数据库行业发展趋势与各位读者进行交流。(内容转自爱分析)

打开网易新闻 查看精彩图片

以下为访谈实录:

支持Hadoop 3.0,产品向完整平台发展

问题:红象云腾在今年3月份发布了CRH v6.0,与之前版本相比,6.0版本有什么优势?

童小军:首先,CRH v6.0是首个支持Hadoop3.0以及OpenPOWER大数据平台软件,通过了相关产品兼容性测试和认证;其次,CRH v6.0实现了与开源项目Ambari的集成,可以实现Hadoop 3.0快速部署;最后,加入了新的技术,比如Erasure Coding(提高存储利用率)、多NameNode(提供高可用性)以及Nativetask数据处理引擎(提高数据处理速度)等等。

问题:目前,红象云腾的产品结构是怎样的?

童小军:主要包括CRF(数据采集模块)、CRH(数据存储模块)以及CRS(数据挖掘模块)。通过这三个模块的组合以及各模块中的工具选择,来满足不同客户的需求。

问题:为什么选择基于Storm开发流数据计算引擎?

童小军:其实也有其他的流计算架构,比如像Flink等,虽然Flink也很成熟,但是我们还是考虑到用户需求,以及整个生态环境的完善程度,最后选择了Storm作为流数据计算引擎。

问题:红象云腾的发展路径是怎样的?

童小军:我们在底层芯片支持工作上花了很多时间,从之前的财务表现来看,其实并不是很令人满意,但是从整体形势上来说,我们现在已经从之前大量的工作积累中得利了。

比如国产芯片公司,在中兴事件出来之前,它本身的产品是很难卖的,但是之后由于中兴事件的出现,国内客户对于国产产品的需求激增,国产芯片的订单数量也开始快速增长,我们因为支持底层芯片技术,自然而然的也被这些客户选择了。

问题:为什么要选择支持多种芯片?

童小军:从底层芯片,到中间服务器提供商,再到操作系统,最后是我们红象这类中间件软件和上层应用,这是一个完整的生态。

每一种芯片都需要一个生态来配合它,我们也需要配合每一种生态来满足不同客户的需求,这样我们才有更多的机会来被客户选择。

我们之所以能应用在中国航天系统中,也与我们所做的芯片支持工作有关。

打开网易新闻 查看精彩图片

问题:未来是否会向上层应用发展?

童小军:我们在CRH两侧加入了数据采集以及数据挖掘展现,会更加贴近客户,可以为客户提供一个完整的平台。

但是,我们整个CRH平台还是一个开放的平台,我们还是会和其他软件去合作。比如在CRF中,我们的侧重点在流计算上,与数据采集软件不冲突;在CRS中,我们的侧重点在算法上,与数据展现软件不冲突。这样我们可以取长补短,完善整个产品,更好的为客户服务。

问题:今后是否会考虑推出云服务?

童小军:我们还在观察市场上整个云服务的效益,由于云服务客户的付费习惯与传统企业不同,所以我们还在考虑这件事。

以渠道销售为主,降低人力成本

问题:红象云腾有哪些合作伙伴?

童小军:现在最大的合作伙伴是浪潮,之所以浪潮会选择与我们合作,也是因为我们对于IBM POWER架构的芯片提供支持,这样浪潮才会认可我们。

问题:销售模式是怎样的?

童小军:主要是通过跟集成商合作的方式,因为他们的销售渠道更多,并且可以把我们带入更大的项目中。做大数据基础软件,需要这些头部的项目做示范案例。

问题:客户主要在哪些行业?

童小军:主要是公安、银行、航天军工。公安中主要应用在搜索查询和数仓场景,银行中主要应用为数仓,替代Teradata,航天中主要应用为替代EMC存储。

问题:是否会在银行业拓展业务?

童小军:肯定会继续做银行的相关业务,但是关注重点可能还是在航天这一块,因为在这个领域我们已经占据了大部分的上游市场,之后还可以往下游延伸。

所以,我们现在的行业重点还是在航天上。

问题:除了产品节点收入以外,是否有其他的服务收入?

童小军:主要有一些维护以及应用的开发优化费用,我们会不断的帮助客户围绕Hadoop生态完善整个系统。

问题:红象云腾团队规模有多大?

童小军:大约有20人,主要还是以研发为主。

打开网易新闻 查看精彩图片

问题:单个项目周期大概是多长时间?

童小军:我们尽量控制在3个月内。在项目部署阶段,投入的人力是非常少的。

Hadoop技术已成熟,新创业公司入场较难

问题:Hadoop主要的应用场景有哪些?

童小军:Hadoop主要面对大数据量存储,数据价值可能相对来说较低,主要应用在非结构化和半结构化数据上,对于银行的核心交易系统,Hadoop很难去取代原有的数据库。

Hadoop大部分应用场景还是在于离线分析,对于实时分析方面,可以有其他的软件来弥补,比如说Hbase实时数据库。

问题:您认为Hadoop市场渗透率如何?

童小军:我认为,起码世界500强企业,大部分都在使用Hadoop,在互联网行业,排名前1000的公司应该都会使用Hadoop。

问题:您认为以Hadoop为核心的新创业公司还有机会吗?

童小军:现在这个阶段,不太可能出现新的Hadoop创业公司,因为Hadoop已经是一个相对比较成熟的体系,发展比较好的Hadoop公司都是在Hadoop出现早期就成立,随着Hadoop的技术以及市场越来越成熟,这些公司一起发展起来,现在已经没有新的市场增量给新的创业公司了。

问题:除了Hadoop发行版之外,是否还有其他分布式数据库?

童小军:这肯定是有的,比如像TiDB、巨杉等。他们在分布式数据库领域做的也都很好,但是与Hadoop相比,这些数据库的数据处理量还是比较小的,没有一种像Hadoop一样能扩展到几千上万台服务器的规模。

打开网易新闻 查看精彩图片

问题:很多数据库选择银行作为主要切入行业,您怎么看?

童小军:银行本身在IT投入上占市场总IT投入的一大部分,并且银行自身的技术实力相对较弱,这就需求要产品特别完善,并且是面向企业的。

同时,银行由于涉及财产交易,对于产品的选择也是非常谨慎的,所以往往会采用已经通过银行系统测试的产品。

大多数数据库产品,最初进入银行还是以边缘系统为主,之后才会逐渐的向核心系统延伸。

问题:您认为未来云厂商是否会进入大数据基础软件领域?

童小军:云厂商肯定会进入到这个行业中,但是云厂商肯定不能满足客户的全部需求。因为如果是互联网客户,那么可以自己利用开源软件搭建一套Hadoop生态,不需要云厂商提供;如果是企业用户,那么企业就需要应用来使用Hadoop,但是云厂商在云计算上已经有很大的竞争压力了,肯定就不能提供特别完善的应用。

问题:您认为数据库市场集中度在未来会是什么样的?

童小军:我认为会是一个极度碎片化的市场,在每个行业中可能会出现一两个巨头,但是不会出现像Oracle这样一家通吃整个市场的巨头。

现在来看,虽然Cloudera和Hortonworks是两家体量最大公司,但是还是有很大的发展空间。