TEDxZhichunRd秉承TED理念“Ideas worth spreading”,传播科技创新成果,以TEDx演讲为核心价值,通过多种衍生形态为汽车、汽车金融、科技等行业同行、专家学者提供平台。为了打造全国最大的创新者发声平台,TEDxZhichunRd联合爱分析,对行业内创新人物进行采访,了解公司发展,树立品牌形象。

本期采访到的是智易科技创始人李杰,他将就智易科技的产品、经营策略、战略发展目标以及AI行业的发展趋势与各位读者进行交流。(内容转自爱分析)

打开网易新闻 查看精彩图片

以下为访谈实录:

降低AI使用门槛,以通用型AI平台切入市场

问题:为什么选择AI这个行业作为创业方向?

李杰:我博士期间就有云计算和数据挖掘的背景,工作后先在微软总部做了两年多云计算平台研发,之后去了谷歌开始接触AI尤其是深度学习。

当时我所在的项目组为底层云平台系统,管理着Google所有机器集群,可以接触到整个数据中心的核心数据和资源。也正是那时我发起和主导了一个数据中心智能化管理项目的研发,利用AI技术来挖掘数据价值,结果非常成功,当时就被AI的能力所震撼。

这样的一个契机使我认识到,AI作为一个赋能型技术,几乎可以用来服务全行业,挖掘不同场景下大数据的价值,所以很希望在这个方向上做一些深入的探索。

问题:为什么选择以通用型AI平台切入市场?

李杰:AI创业的主流方式是选择一个垂直领域(医疗、零售等等)进入,然后做AI相关的应用等等。

我想做的是通用型AI研发平台,主要有两点因素:

第一, AI本身作为一个赋能型技术,应该是通用的,全行业都存在跟AI结合的机会;目前,AI的商业化落地处于初级阶段,有很多平台级的机会等待我们去开拓。

第二, 在微软和谷歌的工作经历,使我能够站在国际视角看到最为前沿的一些技术趋势,所以希望能结合自身的背景经历做一些更有价值的事情。在云计算、大数据、以及人工智能多年的经验积累,使我能够快速利用自身技术能力搭建这样一个通用型AI研发平台,之后再利用这个工具慢慢进入其他行业,去获得对行业更多的认知。

问题:深思平台的研发周期是多久?

李杰:2017年4月底,我从Google离职,利用1个月左右做行业调研,发现市场上没有很好产品先例,之后2-3个月用来设计系统和原型的迭代开发,8月份开始正式进入开发阶段,12月底1.0版本开发完成。

问题:深思平台的定位是什么?

李杰:我们的产品定位是在一定程度上取代初中级的AI专家,并且将AI使用的低门槛做到极致。

在降低门槛方面我们有两个目标,第一,用户全流程不需要写任何代码;第二,完全不懂AI的用户也能完成相关的AI应用模型开发。

问题:市场上也有一些为了降低AI使用门槛的产品,这些产品有什么不足?

李杰:国内外有很多为了降低AI使用门槛的工具,但是最后的产品并没有达到这个目标,主要原因是,虽然这些工具提供了一定的可视化交互界面,但同时也暴露了大量的技术参数、配置给用户,所以这些产品依然是面对AI专家的。

自研AutoML技术,满足商业化要求

问题:深思平台包括ETL层、数仓吗?

李杰:我们的产品是一个庞大的系统整合。

最底层是分布式集群管理,云基础设施;再往上一层是基于主流的开源框架的核心AI研发层,用于AI模型训练;再往上一层,是基于Hadoop、Spark的大数据引擎,包括数据的存储和处理,以及ETL部分,支持BI、可视化功能;最后是面向用户的,搭建了基于浏览器的可视化操作页面,大幅降低了使用门槛。

问题:用户如何使用深思平台开发AI应用?

李杰:首先,用户可以从不同数据源(本地、云端)导入数据,然后只需要确定训练目标,平台就会自动化完成模型的搜索和迭代,找出最优解。如果模型达到了用户的生产环境要求,我们提供模型托管以及模型API接口,之后用户可以直接调用API使用模型。

打开网易新闻 查看精彩图片

问题:模型的选择是平台自动完成的吗?

李杰:是的,这是利用我们自主研发的AutoML技术。用户只需要选择预测目标,我们的产品就可以完成模型算法的选择、超参数的组合迭代,然后找到最优化模型。

我们跟Google AutoML的技术路线有一些差异。

Google自身有资源优势(TPU硬件),所以采取的是更为依赖算力、近似暴力破解的方式来寻找最优解,我们认为这种模式硬件成本过高,在商业化中并不适用。

我们则是更多的依赖于一些数学优化理论去做更加经济的搜索、迭代,并且结合我们的启发式搜索,对于不同类型的问题,我们会给出某种预判模型,我们把这些人为规则加入到自动化迭代中,达到用更少的迭代次数达到和暴力搜索类似的效果。

问题:模型由平台直接给出,大型客户对于模型的可解释性是否有顾虑?

李杰:有的用户会有可解释性需求。现在这也是AI领域需要突破的难点,从效果来讲,神经网络往往能达到最佳的效果,但是缺少可解释性,如果用户有很强的可解释性需求,我们会选择一些有较强可解释性的算法来服务客户。

问题:模型会根据实时数据不断更新吗?

李杰:模型持续训练已经支持了,按照周期来不断训练模型。但是在实际中,实时训练的需求比较少见。

问题:在建模功能上,Tensorflow和深思平台的区别有哪些?

李杰:我们平台是基于可拓展的架构设计,支持当前主流的AI算法框架,包括Tensorflow、Scikit-learn、Caffe等等。一些Tensorflow支持得并不太完善的模型算法,比如像决策树等等,我们会通过支持其它的一些第三方框架(例如XGBoost和LightGBM)来进行补充。

部署模式灵活,未来加入数据准备模块

问题:用户在使用深思平台时,可以做计算资源调度吗?

李杰:这些都是可以配置的,首先我们的平台是提供两种形式的服务,一种是公有云形式,

SaaS模式,另一种是私有部署,私有部署中就可以根据客户需求来配置计算资源。

其实建模过程中每一个环节都涉及到大量数据处理,需要大量计算资源调度,我们提供两种方式,一种是平台自动化选择,另一种是用户自己制定。

问题:目前,哪种部署方式更加广泛?

李杰:这跟不同行业的属性有关,金融业客户倾向于私有部署,而对于一些追求快速发展、意识更为前沿的客户(如零售、互联网等),公有云模式会较多。

问题:深思平台对于数据准备环节的支持如何?

李杰:在AI应用研发中,占用时间最多的是模型选取迭代以及数据准备工作。现阶段,我们更多资源是投入到优化模型这块,对于数据准备工作,我们已经开始进行研发,未来我们的平台会兼顾到数据前期准备环节。

客户需有良好数据基础,AI平台市场仍处早期

问题:深思平台的客群定位是什么?

李杰:对于客户,我们有两个要求:有良好的数据基础,有明确的需求。

现在我们把客户分为三个阶段:

第一阶段,没有AI使用经验,想做AI尝试,比较初级;

第二阶段,有AI成功使用案列,会尝试更多场景,更加积极去使用AI,会寻求外包解决方案;

第三阶段,相当多的成功AI应用场景,不再满足于第三方提供解决方案,更倾向于自己拥有AI的能力。

我们服务的最佳客户是对AI有比较成熟的理解,并且之前有相关AI使用经验的第二和第三阶段客户。

打开网易新闻 查看精彩图片

问题:目前,智易科技的客户主要分布在哪些行业?

李杰:金融行业,因为跟AI结合很早,不再满足于业务解决方案,想要AI通用型能力;零售行业,有销量预测、库存管理等方面的需求,深思平台可以帮助零售行业的所有环节提升生产力;工业,利用工业视觉开发对于产品缺陷检测的AI应用。

问题:深思平台与客户原有系统的集成性如何?

李杰:深思本身是可以作为一个单独的平台存在的,最后输出的是一个模型,会有一个API接口,用户只需要调用API接口就可以完成应用部署。

问题:客户对平台级产品的接受程度如何?

李杰:现阶段,可能只有少数客户对于平台级产品的接受程度较高,但是随着客户对于AI的认知不断进步, 在未来的几年,会有更大需求爆发。

问题:智易在进入行业之后会向上层应用发展吗?

李杰:目前是以单点切入行业,会不断渗透到其他业务中,我们之后会不断打磨平台产品,并且会向行业应用发展。

问题:您怎么看待目前AI平台领域的竞争?

李杰:我认为目前AI市场处于非常初级的阶段,可以叫做人工智能商业探索的大航海时代,还有很多未探索的领域,AI+行业的机会还非常多,各个厂商都有机会成为AI时代领导者,并且我个人非常看好平台级的AI产品。

问题:开源盛行,技术不再是难点,AI行业的竞争壁垒是什么?

李杰:应该是对不同行业的认知程度吧,现在许多行业对AI的认知仍停留在一个较为初级的阶段,不知道AI能帮助改善生产中的哪些环节,这是我们需要跟不同行业一线业务人员共同去探索的。谁先完成对行业的深入探索,帮助客户解决实际需求,就能建立起该行业的竞争壁垒。

问题:智易科技有哪些对标公司?

李杰:从国际范围来看,在产品理念方面美国的DataRobot跟我们比较相似,但我们的核心竞争力在于把AI低门槛做到极致,比如让一个完全不懂AI的外卖小哥15分钟学会使用我们的产品。

国内目前也有一些公司在往这个方向探索,但在产品的形态理念和AI研发过程的复杂性封装方面都跟我们有较大差距。

问题:智易与微软加速器在哪些方面进行了合作?

李杰:智易是一家非常年轻的初创公司,很荣幸能跟微软加速器合作,同时,我们也确实感受到了微软加速器给予初创企业莫大的扶持和助力,包括技术、资源全方位的帮助。

第一, 微软的Azure云平台计算资源,我们拿到了非常大的一个免费额度,现在,我们平台也在部分往Azure平台迁移。

第二, 媒体资源的获取,也是微软无条件支持的。

第三, 投融资对接方面,微软设置了很多私下以及公开的渠道帮助我们去获取。

第四, 客户方面,微软很愿意将自身的一些大客户资源提供给我们,帮助我们进行针对性的对接。