10月28日,主题为“从运维到运营” 的第一届IT运营新世界大会在北京皇冠丽都假日酒店召开。
到会嘉宾中,天旦网络科技 联合创始人兼CEO杨光辉、优维科技联合创始人兼COO彭鲤航、北京云集智造(灵犀) 创始人兼CEO 朱品燕、广通软件 董事长徐育毅以及日志易CEO陈军联合接受了媒体的专访。
以下为采访实录:
媒体提问:今天我们的大会本身也是来了很多的运维人员,我想因为大家都是在做运维圈子的,这么多的创新企业,基于运维这样一个领域组合起来,形成一个联盟。我想了解一下,我们这样基于做创新技术的公司在今天的市场到底给运维这个领域的用户带来什么样新的价值,经济价值还是技术也好,希望大家各自谈一下吧。
彭鲤航:我自己做运维技术出身的,我两千零几年就是做运维,做运维的人经常开玩笑,说有一天我们坐在咖啡厅喝咖啡,这个是最高、最享受的状态,这个是很平凡,工作量很大的岗位,需要实时的24小时关注业务,压力很大,但是其实成就感很低,我们总说现在比较流行说背锅,它是出于生态末端,但是岗位重要性很大,因为决定这个业务是不是可以正常开展,是很关键的岗位。以前的传统模式下,其实我们要做很多事情,我们叫运维,运维运维就是要维护,说白了就是你要做很多的事情。但是这个东西实际上能够传递出来的价值只是你把事情做好,仅此而已,而且是传递出来的价值并不是很大。但是今天我们提IT运营,更多强调经营,强调管理,其实是一个IT运维的升华。我们不但把这个事情要做好,做好我还希望这个东西能够做得很轻松,我同时还可以给我的公司、老板传递出我所做的岗位的价值。这个是我们今天所强调的IT运营的理念,包括我们公司的产品也是一样,我们希望能够把烦琐的任务能够帮技术人员去承担,帮他解脱,他可以更多的从这里面关注一些更上层的,比如我们数据的运营,数据分析,IT的决策。从这种层面上我们才可以真正说把这个岗位的价值传递出来,让他们可以做一些更重要的事情,就是我们老说的,真正我们闲下来喝一杯咖啡,想想我们可以做一些什么样的事,可以传递什么样的价值。
朱品燕:其实我觉得运维人员来说,总体来说是比较辛苦的,刚才提到的背黑锅或者扛服务器等等。现在从IT运维到IT运营一个变化就是从被动式到主动式,我们可以站到舞台之前,提前做规划、做设计。而且我们整个创业团队来自于百度,见证着百度从几十台服务器到几千台服务器的过程。我们在这个过程慢慢也是发现可以提前做一些规划,包括我们数据应该怎么建立,我们自动化的流程该怎么做,把我们整体IT基础设施的数据的价值,目前产品里面包含像后台预测,提前发现问题,不是有问题等着别人找我们,我们在产品里面设计一些东西,这些都是在整个运营里面提出有意思的事情。
另外,我们的工作也遵循一种理念,我们希望能够使运维人有一些成就感,有一些技术创新,除了最本质的保障,效率、成本、质量几点以外,我们要形成运维的创新,我们会涉及到运维的大数据的产品,主要是业务里面做的大数据,我们运维也可以做大数据。刚才提到像预测、节能等等都是大数据的产品。整个我们觉得我们也是希望能够在这个过程中从运维到运营这个变化过程中的实际的有价值的体现把它产品化,解决更多的中小型企业,或者传统行业的运维的问题,让他们有跟BIT对接,这是我们的任务,我们在这个过程当中做产品,帮运维人员带来一些价值。
徐育毅:像运维的重要性,现在特别是像IT架构互联网化之后,运维的重要性越来越显著。前两天说云计算拼的就是运维,也是非常有道理的。在这种参与下面我们怎么把运维人员能够解放出来,他们一方面工作量很大,任务很重,责任也很大,我们的使命就是要让运维人员不再苦逼,我们要提供一些技术手段,帮他们来减轻这些方面的压力、负担,让他有精力能够做一些运营方面的事情。
同时,我们运维软件、运维工具不要又成为新的坑,让用户耗费更多精力花在软件的维护上面。我们要帮用户解决问题,提供更好的工具,不给用户添很多麻烦,自动化把这个运维的工作尽量让自动化工作用自动化的手段解决掉,用互联网的思维和技术,让整个智能管理和运维管理更加有效。
陈军:前面几位讲了很多,运维确实已经有很多年历史的行业了,因为我原来在谷歌美国总部的时候,我是2006-2009年在那里,那时候谷歌有100万台服务器了,当时一个数据中心就有20万台服务器。2009年加上腾讯,当时腾讯已经有几十万台服务器了,滨海数据服务中心就有八万台服务器。因为越来越多的信息电子化,越来越多的数据需要服务器处理、存储,规模是越来越大。也变得越来越艰难,越来越艰巨,运维要保证7×24小时提供服务。原来ITOM叫IT运营管理,近年来又出现大数据的技术,大数据的技术用在分析IT运维产生的数据上,产生一个新的领域叫ITOA,IT运维分析,要分析这些数据。这个规模越来越大,运营越来越精细化,要做更多精细化的分析。日志是从日志这个角度分析的,但是还有其它的厂家他们从网络抓包,从代码这一级来分析,有不的角度做这个东西。所以做这个东西把大数据跟运维结合起来,就产生叫ITOA,光是大数据还不行,要把机器学习要引进来,通过机器学习分析这个数据,才能真正的产价值。机器学习用的地方主要是用在异常的自动发现,原来的运维出异常,其实是工程师凭经验看,这个是不是异常,异常的根源在哪儿。现在的运维数据太大,靠人脑看、人脑处理不够了,我们希望机器自动发现异常。另外就是预测,原来这个工程师看到,CPU的负债从30%升到50%了,下一步可能是100%了,这个也是预测,可能要扩容或者负载迁移。我们现在这个可能自动来预测,下一步到多少,或者做容量规划,但是预测的工作也不容易做,这个可能就是一个毛刺,上到50%可能很快就快下来,就像预测天气、股票都不容易预测。运维领域是从大数据还有机器学习不断有新的技术注入到这个已经有几十年历史的行业里面去。
媒体提问:我想问一下彭总,您是以前做跟运维相关的产品,作为背锅感同身受过的人,做这个产品的时候定位和考虑和过去您做运维的时候解决自己最不想做,或者最垃圾的工作,最苦的工作的过程有什么相互对应的地方?或者你们真的觉得哪些做运维的时候的痛苦?
彭鲤航:因为你问的比较具体,我讲一个具体的例子。我记得印象很深的,我以前当时负责互联网业务的团队,当时我们接了从搜搜(音)过来的新业务,当时我印象很深,有一次做变更的时候,直接误操作把数据全部给删干净了,就一条命令,有的时候这个写代码就是敲命令很快的,敲敲,脑袋没反应,一下子一条命令下去就没了,所有的数据都没了。这种时候人有很慌,因为这个东西对应的就是你的生产系统的数据的丢失。当时我们业务是刚接进来的,没有任何的备份,也没有任何的还原的手段,当时就直接找研发工程师去从代码库里找这个东西。那个时候印象很深,当时比较好是什么的,我们误删掉并不是数据库,只是接入的程序,我们当时恢复配置用了几个小时的时间。但是这个过程是很惊慌、很惊悚的,你做这种事情没办法说不去做,因为你承担了这个责任你要做这个事情,但是你做这个事情的过程当中很多时候你是没有太充分的把握,说这个事情是不是完全的安全和可控。其实很多时候是没有的。这种情况下,在我们自身做这个产品的过程中,其实我们公司其实主要是做自动化的解决方案,我们首先我们的理念是什么?就是你人要去做这个事情,其实很多时候很难完全把人的一些操作层面的风险规避掉,这个很困难,有的时候我确实状态不太好,这个很困难。但是我们是不是可以换一个思路,就是我人在做的事情,我有没有可能通过我的机器、程序去替代我去执行。这个替代之后,机器的逻辑是非常严禁的,我可以通过反复的测试和认证,我能够实现一个很严谨的交互的过程,我能够确保这个操作是不是可逆,是不是有时前的备份和安全评估,我们通过自动化的交互过程,把人工操作风险,通过机器可控的操作替代,我可以解放我们在很多运维过程中所存在的风险的问题。其实对于我们运维人员也是有很大的一个帮助。我在做一些事情的时候,我会变得更可控,更有安全感。因为我知道我的平台能够帮我把这个锅背起来,真要出问题可以快速恢复。这个是我们整个产品希望能够传递出来的,我们确实希望能够解放初我们运维的所需要承担的风险,让它能够快速的把这个任务实现和完成,谁个我们做产品的过程当中希望传递出来的理念。
媒体提问:我想问一下日志易和优维,我们觉得运营需求下的运营管理有什么技术层面的东西是必不可少的?
陈军:我觉得原来那些都是必不可少的,原来IT监管这块,像CEBB(音)、自动化运维、分析都是必不可少的。ITOM整个体系架构里面各中模块都非常重要,缺一不可。这些不会减少,只会越来越多,IT运维,IT运营只会越来越复杂。
彭鲤航:整个互联网技术的发展非常快,我印象很深,我2006年进腾讯的时候,当时我的面试官还问我ITOA是什么东西,当时我没听过这个东西,我以前是传统企业的,我觉得完全没听过这个东西。后来发现IT管理这个东西是非常火的。但是你看这几年,其实技术,开源的新技术的发展非常快,包括我们的阿法狗的人工智能、大数据的智能非常快,很多新的技术会突然涌现出来。包括我们现在您刚才问有哪些是必不可少的,比如比较火的,云计算、大数据、人工智能、深度计算,我们现在说运营的DOCKER的东西,很多新的技术上来,目前可能我们觉得我有一些技术是不可少的,可能半年甚至一年之后我们再来看,这个技术完全就不一样了,这个可能我们认为IT领域里面更核心的,一个是我们把握这个技术的发展方向,一个更多可能是我们的学习能力,当有一些新的技术来的时候,我们是不是能够快速掌握这个新的技术,把新技术应用在我们的产品和我公司的IT的里面,这个可能会比这种现有的一两个技术更重要一些。
杨光辉:我加入一下这个对话,我们号召从IT运维走向IT运营本身就是为了打破运维人员从技术出发考虑问题。IT技术本身存在的意义就是为了企业发展,为了社会的推动,如果本身专著在技术本身的话,就会绕不开原来IT运维的话题。对我们来说,数据是不可缺少的,过去大家去集中看待任何数据都是可控的,但是数据不像人,数据天生是不平等的,每一种数据背后,数据不等于是信心,信息不等于是知识,知识不等于是理解。美中数据背后都有不同的意义和价值。我们看到我今天上午打过一个比方,你看到IT运维到运营有点像保姆带小孩到父母带小孩,数据也是有类似的概念,你看待数据的时候,大多数的运维角度看到什么数据多就用哪种数据,比如基础架构里面数据产生的量非常大,大家先看那些数据。但是如果你是家长的话,你在让小孩出去玩儿,你会让他玩儿更多多的东西吗?比如广场舞多,你会让小孩跳吗?不会,你会考虑给他更多的更好的教育机会,比如绘画、体育锻炼。数据也是一样,越贴近业务本身的数据是最有价值的,这是必不可少的,这是现在最最缺乏的。
媒体提问:我有两个问题想请教,看各位老大谁方便回答。
整个IT架构往互联网转,还有很大一部分还是传统的IT架构,所以我的问题是传统的IT架构跟基于互联网的IT架构之间的运维上到底有哪些区别?这是第一个。
第二,现在很多公司现在在传统的IT架构上有多业务也在往互联网架构转,所谓的联想提出的概念叫双IT,或者什么双模IT。在这种情况下,怎么把传统的和互联网的IT架构从运维的角度看,有没有有机的结合,或者是一个平滑的过度,这是一个。
刚才提到的所谓的整个运维的大数据的改变,刚才谈到比如说日志层面的,还有很多刚才像杨总的公司做实时数据分析的,这方面能够挖掘的潜力到底有多大?另外这种数据的挖掘对客户的层面,比如有没有具体的数据提前预测,或者提前分析也好,能对他客户本身的业务提供多大的帮助,有没有具体的案例,说这个提前数据分析出来之后帮他省钱或者干嘛,有一些案例的支撑。
徐育毅:这个问题可能天旦可能专业一些。企业IT架构互联网化很严重,现在基本上用户没有用虚拟化的,很多还是用很多云架构平台和大数据的。像这种管理这两种不太一样,像刚才说双模IT,一种是像银行一样,有一块系统是可预期的,这个是非常重要的、稳定的核心系统,这个注重的是稳定,有像银行的核心系统。还有一块是探索型的业务,这类业务对稳定性的要求不那么强,探索性就是你不可预期的。比如双十一,12306的买票等等的业务,或者其它的业务。像这些可能需要快速相应需求,快速发布产品,快速迭代。这两种架构运维管理的模式也不太一样,从咱们传统架构走ITOA的路线,主要关注系统的稳定性。走互联网架构、互联网应用这一块,更多是DovPs的路线,产品开发进行发布,快速迭代,这个是比较理想的情况下,现在还是要融合的,企业没那么多人,不可能为不同的架构部署不同的,毕竟稳态(音)架构会迁移到敏(音)态架构去,云计算,稳定性等等不断在增强,还有业务也发展得很快,就像虚拟化,等等,包括那些东西都很快。业务还是一样的业务,只不过是业务的分类可能有的是注重稳定一点,有的跑得快一点。还是要融合起来。我们的想法,针对两种IT环境,联想上的双态IT,还是要把这个稳定起来。这个要比较多的进行互联网的思维和工具,互联网的技术的另外也要兼顾传统的运维的理念,ITOA这些方法论,进行一个整合。
像今天陈傲寒一开始讲的一样,上面是各种各样的监控工具层,右边自动化有IAAS 、PAAS、SAAS和配置自动化,上面还有运营分析等等,还是有服务目录ITOA流程,但是综合起来给企业用户,提供一个比较完整的解决方案,把这几种运维,几种IT环境融合起来。
媒体提问:谁对这个问题还有新的看法吗?
杨光辉:实际上可能对于联想提供的双态,因为双模已经推了很久。推这个概念的时候已经承认了,最早的运营叫做整体IT升级尝试失败了,原先希望所有的传统IT都变成像类似互联网那样的模式,但是事实证明互联网的模式只是其中的一种状态,有点像家里装修有硬装有软装,有一段时间是全部交付毛坯房你自己全部装修,那是互联网状态。有一种是提法是提供精装修,自己装修软装,现在选择IT的建设进入到一种平衡的状态,大家发现由于速度的差异,变化的迭代的速度的差别,以及业务本身的变化的差异,造成不同的实现方式,达到最后的结果。从用户来说,所有的驱动力其实你会发现,并不是简单的节省人力或者提高效率这一类的说法,在所谓的互联网所谓的敏态里面消耗的人力比原来手工量更大,原先的IT管理里面虽然技术人员水平不那么高,但是已经成熟了,消耗人力反而是更好的,在一定程度上,所有的动力都来自于业务本身,所以你说这里面两者有一个结合点的话及业务的评估和业务的判断是其中最重要的结合点,到底业务本身是需要剧烈变化的,还是业务需要持续改善的,这样的一些业务目标被融合到IT里边。这样的话IT从运维走向运营,用业务的指导思想来指导IT本身应该怎么建。最终有点像太极一样,有些企业里面双模里面的互联网模的或者刚才到敏态的方式会比较多,有些是固态比较多,但是有的是固态比较少,稳态比较少,不同企业根据自己业务进行不同的调整,分水岭就是业务的特征。
朱品燕:我说一下自己的看法。关于硬件架构本身的变化我谈一下,刚才提到从传统的到互联网发生变化到底有什么样的问题,运营该怎么做。首先一点,确实就是这里面去LE很重要的典型,X86服务器占有率直接上升,大型机的概念慢慢在减少,这个东西最大的问题就是X86成本非常低,但是缺少配套的管理软件,其实以前大型机成本非常贵,因为辅助了一套很贵的管理软件,所以在这个过程当中,我们其实出来专注于IT基础架构运营管理也是看重这个空白,我们怎么通过我们一套软件权衡这个问题。第二,我这边来自百度,想讲一个具体的案例,就是怎么探寻运营的数据。就节能的看法,大家在运营服务器的时候只会看到内存啊、空间等等的指标,但是很重要的就是我们的功耗信息,我们看这个东西的时候发现服务器三年之后就定位等于这个服务器单买的钱,我们在大量定位输入,这个其实有更多的事情,我们看功耗的信息跟负载的情况做对比,最后通过动态调配的方式起到降低成本的效果,这其实就是在百度里面做这个事情的事,收益是非常明显的,尤其是超大型的公司,基础大的时候,规模效益是非常明显的。
媒体提问:刚才提到的运维的大数据化,这方面可拓展的空间刚才提到是很大的,所以我现在想知道这块有没有具体的不管是分析还是预测的角度,帮助客户省钱或者做到一些什么样的增强效果的东西。有没有具体的案例?
陈军:我举一个我们的案例,原来从日志这个角度,原来其实是一种叫做石器时代,就是日志本身就是分散、散落在各台生产服务器上,只做事后的筛查,这个是非常大的金融综合客户有保密协议,不能随便讲名字,其实是非常大的,大家可能每天都跟他打交道的。他日志原来散落在各台生产服务器上。通常出了问题之后运维工程师登录到生产服务器上查看日志。用一些命令或者写一些脚本程序,效率就非常低,第二,非常危险,这些都是生产服务器,万一做了误操作可能导致新的故障,而且也没有事中的监控,也没有统计分析,从日志里面每天使用情况怎么样,鼓掌出来多少。后来用我们的日志建起内部的大的金融集团的日志云,就要求所有业务部门的日志全都要接进来,不允许工程师登陆生产服务器察看日志,都在日志云里面看。首先第一步就是集中管理,日志的量也非常大,每天可能都形成的日志量都是每天几十TB,用一些技术也能处理,但是实时性比较差,经常是今天看昨天的分析的结果。但是用在运维上面,运维要求实时性是非常强的,我们希望做到秒级,几秒中之前的状况要马上能够看到。原来大数据的架构都是要用,我们需要用到流式的大数据技术进行秒级的分析。这样出来之后我们可以看到几秒钟之前整个IT运营状况可以看到,把机器学习放进去可以做异常的自动发现,包括还有预测,还有扩容,下一步明亮要多少,是不是要加服务器,都通过积极学习可以自动做这个事情,效率也会提升很多。这些都属于ITOA这个范畴。
GANER有一个报告,这个基于欧美的发达国家,IT化程度非常高的。2014年的时候使用ITOA的企业有5%,2017年也就是15%,这个是处于比较早期阶段的。
媒体提问:其它在运维到数据化方面有哪些可探索的方向?
彭鲤航:大数据这个方向,感觉这个东西很悬,很难理解,可以换一个思路,其是就是智能决策。比如阿法狗就是代替下棋,这个行为其实很简单,在哪个格子里面下一颗旗子,很简单,其实你可以很简单的理解,就是智能决策。这种智能决策其实在IT的运维和管理过程中,很多细节的东西都可以用得到,其实就是代替你,他通过所采集到的数据,根据这些数据进行分析,分析之后产生一个结论,让这个结论代替你人去判断,因为人去判断,可能你的数据并没有这么周全,其实你可以简单来说,任何需要决策的地方,其实都可以用到大数据的决策。我举一个简单的例子,比如我们运维过程中常见的,比如我的鼓掌的告警的识别,我一个告警,是不是一个误告警,我们每天会受到很多信息,CPU会有毛刺,我收到CPU告警是不是属于一个毛刺,是不是我的业务活动所导致的一个CPU的突发,还是什么样的情况,这些信息我有没有可能通过我所采集回来的日志信息帮我识别和帮我做决策,这是我们大数据可以用的一个简单好理解的场景。
第二,我们经常遇到我要维护我的业务,可能我需要游服务器,我需要对服务器了解,我业务增长有一个增长的趋势,我需要定时提前采购我的设备,或者即使是云的情况下,我要准备双十一,也要做一些提前的准备,虽然现在弹性计算很灵活,还是要做提前的准备。这种准备是不是可以通过我的业务,过去的发展趋势,我能够去做智能的识别,比如我过去有没有做过这个火堆,过去用户特征是不是能够帮我做出一些要准备资源的决策,其实这些就是一些大数据的应用的场景。从这个层面来理解,我们任何需要决策的地方其实都可以用到我们这些大数据的信息,都可以用到这种技术。
杨光辉:两位说得都挺有道理的,我们认为所谓大数据,大数据本身跟过去的相比之下叫小数据,其实最大的差别在于成本,就是现在大数据的很多技术能够帮助我们用很低的成本实现过去大量的非常昂贵的小型的大型机数据库才能完成任务,我们用很低的成本可以完成工作。现在维度可以分成历史、实时和未来的,对照一个企业,对照IT可以分成技术和业务这两个倾向。可以组合这些维度你可以看到,比如我看待一种实时的偏业务的场景,和实时的偏技术的场景,或者是未来的偏业务的场景和未来的偏技术的场景,可以组合出很多实际的使用的效果。能量规划,比如是一个有点更偏业务,但有一些技术的对未来的使用场景。刚才两位都提到,能量规划是非常有用的使用范围,因为当年在有这些数据支撑之前,大家只能拍脑袋做决策。直线我们做双十一规划的时候他就做了一些规划,但是有了数据以后可以精确度量出翻8.7倍,他做保守的10倍左右就可以达到与其的投入。同时又的时候他们拿数据做业务决策,刚才也提到业务决策实时的业务决策,之前我们有一些用户看到互联网带来的快速迭代,敏捷开发带来很多好处,内部自己现有的开发组织液推行,说我们要进行抢滩头,要学习互联网快速交付和更新版本,通过实时的监控可以发现,成功率、相应时间,交付的产品质量,自己内部的产品质量大幅度下降了,他们知道抢滩头的策略有问题,可以快速调整组织的行为。这个可能省了多少钱,这个可能是不可计价的。
现在最大的挑战是算法,就是到底我们能不能用到算法去支撑我们现在的那些数据的广泛利用。这条道路,可能早上谈的爬山、登山,可能是五到十年的道路,真的有好的做法,可以做预测,我们很多人可以转行做证券分析。目前为止我们认为算法在有限的时间里面真正起到革命性的作用的时间可能还没有到。
媒体提问:刚刚开始而已。
陈军:对。
媒体提问:但是是一个非常有潜力的方向
陈军:还有机器学习对运维的影响未来是巨大的,我们现在之前那么多年一直讲自动化运维,讲了那么久,最终还是一个工具,只是一些批处理,一些把原来的手工的操作变成用程序做,但是实际上还是得人来决策,人想要做什么。未来这个机器学习如果真的做得好,很多东西就可以机器自己决策,自己做。对运维来讲风险也很大,不像炒股票,像程序化交易,华尔街十几年前就做,做错做反向交易就可以,但是运维做一个操作,有没有这样反向操作可以回滚?这个需要多长时间修整这个东西?风险比证券交易还要大如果技术成熟之后,我们可以把未来程序化交易的东西用在程序化运维,这个运维完全是程序来做的。这样运维工程师的时间真的大大节省,以前讲的运维工程师什么时候能够坐下来咖啡,或者一直在救火。
媒体提问:因为我们很多年前就说IT运营是一个特别特别复杂的工作,这个复杂性是怎么怎么样的,现在十年过去了,复杂性是依然存在的,好像越来越复杂了。我想问的是,是不是IT运维这种复杂性如果通过技术创新能够短时间内或者一定时间内是没法消失的?现在的技术创新的迭代速度是非常快的,我们看到DOCKER现在容器的角度可能在一年之内有非常大的变化,伴随着谷歌的进入,我们如果要是驾驭容器,挑战非常大。这种复杂性我们通过自主创新博弈,或者我们有什么样的思路在这个里面尽量在自动化说了很多年,但是目前还是没有实现自动化,我们的技术方向或者运营的思路是什么?
彭鲤航:我来自深圳,深圳现在房价很贵,很多年前,就说就是你们这帮搞IT的把房价炒起来的。我是这么看,这个东西肯定是复杂,因为这个是为什么大家可以搞IT的人可以拿高薪的理由,这是我个人的理解。这个行业或者这个岗位肯定是很复杂,因为这个实际上是我们为什么依赖,为什么我们需要创造这个岗位的一些背景的原因,一定是技术化的岗位,会有不断新的技术进来。但是实际上我们做的更多时候我们包括我们做产品也是一样,我们希望这个技术化的东西有分重要的技术和并没有那么重要的技术,或者会有一些应用领域的不一样,这个会有一定的趋势。其实我们只是帮大家把传统的技术转移道更有价值的一些技术的范畴,包括我们运维,我们公司是传递这种自动化运维的理念,并不是代表我们大家没有饭碗或者怎么样。我们只是说把没有这么高价值的技术我们通过产品化承担了。现在比如大数据,大数据现在很火,大数据需要大量的人制造算法、创造产生,产生新的算法,这会产生数据分析师的岗位,这种岗位其实是稀缺的,我们希望运维坐在自己最熟悉的位置上,是不是更多可以学习这种方式,产生智能化的决策的算法出来,帮我把这个事情做得更科学,更高效。我们希望更多是从这个角度,是一个发展趋势。但是这个岗位,我的理解,一定是复杂的,否则我们怎么可能拿到高薪?
杨光辉:从我们的角度来讲我们推行IT运维到运营,最主要是增强IT本身的作用,不让IT被边缘化。欧很大的问题,像刚才提到的容器的问题,将来再发展出容器二代虚拟化等等这种叫什么名字的东西,就变成IT行业自己内部的自娱自乐的情绪,因为本身带来技术价值和效率价值。但是没有办法让业务的人员真正理解和发挥你的作用。所以当我们现在在希望进入到IT运营的时代的时候,我们是认为在十年前,加入到IT领域的最聪明的人通常是读当年是高考或者是班上是名列前茅的。这些人的才智理论上可以创造成就应该不仅仅载机书本深,可以对业务产生推动作用,这才符合IT本身发展的一个特点,IT的架构里面包含着数据,包含着信息,跟之前的比如上一代的工业革命,里面的电力发明不一样,电力只是提供支撑,IT并不是仅仅提供支撑的,可以帮助我们重新转换对业务的理解,甚至是发现更多业务创新的机会。所以IT运营的话,我们会更加高兴看到技术创新,产生更多技术创新的可能性,我们想更多的问题到底怎么能够帮助我们业务发展,帮助我们业务获得它的成功。所以越来越多的技术创新,我们看到是越来越高兴,不是我们找到一种整体的运营管理方法转化到最终的业务价值方面去。
媒体提问:站在客户的角度,我们一直在强调从运维到运营带来更多的价值,但是在客户中间是不是形成了这样的需求,普及度是怎么样?哪些行业的客户会更高一点?
杨光辉:IT本身处在巨大的变革阶段,其原因也是用户对现状不满意。如果那些传统的用户对现状是满意的,就不需要引入互联网的技术,不需要引入云计算的方式。换言之,原先传统保持很多的IT运维大家已经站在各种角度对它是不满的,这种不满有的表现在你可能对于你的人员水平的太低,有的表现在IT的整个组织里面,在整个的刚才说的整个组织里面是边缘化的,根本没有对业务有发言权或者任何的见解、洞见,大家觉得IT应该是一种创新的能力,实际上在中国的很多企业里没有看到,反而在美国我们看到硅谷里面大量的企业在这十年里面快速发展。用户对这一点非常的不满意,我们在提IT运维到IT运营的口号或者理念,我们最初接触到大量的客户,让客户判断说这样的想法是不是可行。像高总亲身到现场谈到他对于IT运营还不止这样愿望,他是希望从IT运维到IT运营,到IT运赢。用户站在他们的角度,IT部门的领导人更渴望帮助整个组织成功,并不是像过去基础架构稳定运行。我们的视角比较有我们的角度,我们大多数的用户都在银行业、证券、运营商这些传统的看上去比较大型的机构,我们不叫他们传统企业,我们叫主流企业。主流企业是最大的船,他们非常想转向。这次IT运维到运营,我们基本上有百分之三四十,可能甚至是百分之七八十的数量用户都是主流企业。他们迫切的想看到从运维到运营,怎么让IT发挥更大的业务价值。
陈军:我也补充一下,从运维到运营,通常运维工程师可能关注运维,就是具体的问题,越往上关注的就关注运营,运营指标,支出是多少,每一次向老板申请要买服务器,要看为什么又要买服务器,或者又要买一个新的系统,去年刚买一个系统,今年为什么又要买另外的系统。这个系统带来什么好处?所以对于决策者,上层考虑的都是运营的问题,平时运维的东西是看不到的,像IT系统在我们公司内部,像水和电一样,我们想着打开开关就有电,打开水龙头就有水,我们没有关心电和水是怎么来的,修理工在哪儿,只有停电、停水,我们才想这个修理工在哪里,水厂、电厂是不是出问题了。对于公司也是这样,只是停留在运维的角度,老板不需要知道这个部门的存在,只有出了问题老板才知道这个部门的存在。转变思维变成一个运营,每天有报表、运营的指标,老板就会经常关注。这个也是一个思维的转变。
杨光辉:这个很对。对于运营来说,可能掌握内在的是要有成本意识,要有控制的力量,最后还要有业务的创新能力,其实关注点会跟纯粹的业务员的角度不一样。
我们认为在现在的运营这样一个理念下面,更多有点像中国的整体的改革,是顶层设计,自顶向下的推动力量。如果仅仅说容器,仅仅说某一种技术的话,更像是一种革命,通过每一个单点的技术革命引起效率大幅的转变,进入到新时代。这个时代到底应该走向哪条道路?作为一个创业的新的互联网公司,可能新技术对他们的某一个单点的改变是印象巨大的。但是对于那些已经运行在一条比较明显的航线上的一艘船来说,运营、转向的能力对他们至关重要。这对我们来说我们看到不同的企业有不同的需求,我们真正的中国的主流企业现在面临的问题,就是IT部门本身的视角正在走向刚才陈总说的那样,走向更加业务化、更加站在他的领导的角度看待问题的那个视角。
媒体提问:有可能在云端或者在新的互联网架构里面会催生出像ITOA这样非常严谨的方法论吗?还是太快了,可能出现问题。
杨光辉:以前腾讯有经验的有非常好的见解。ITOA是传统领域里面经过非常多年的总结,有三个版本,不断演进这种服务能力。上次我参加一次腾讯的会议上,看到腾讯反而在大谈说怎么引入ITOA建立这种流程。倒过来就是我们有点像当时做的比喻,ITOA有点像硕士的论文,或者硕士学的东西,而互联网精神是叫做实践精神、草根精神,先去实践,然后慢慢摸索。摸索到了一定水平,发现有一些组织把ITOA的东西整理好了。倒过来现在搞学术那些人觉得不落地,结果发现有很多互联网的公司靠自己的摸索也做成了。大家找到很有意思的结合点,所以ITOA是IT运营典型思想的表现,尽管更多的体现在运维的过程的完善程度上面,但是实际上ITOA的核心是面向服务的,这个服务是IT服务,因为服务这个词汇是多意词,翻译成英文最好的是IT业务,作为IT部门提供给业务部门的你自己的业务是什么,是IT服务。所以一定程度上已经站在运营的角度在思考问题了。所以现在我们一定程度上我们会拥抱像ITOA,拥抱更多的基于IT服务的思想和方法论,这其实是互联网公司和主流企业都会努力往运营方向走的明显的一个例证。
陈军:我补充一下,像ITOA这种非常重流程的,很多互联网公司他们原来是比较草根的,就是头痛医头,脚痛医痛的问题,甚至工单系统都没有。逐步都会征管化,现在也是非常中国巨大的互联网公司之一,他们要把机器学习引入到运维的分析里面。结果发现他们很多时候处理鼓掌没有工单系统,喊一声就处理,处理完了也没有记录。等到真的把机器学习要数据分析的时候,发现没有把数据记录下来。数据没有记录下来的时候,原来完全是应急救火式的,根本链分析都没有得分析。ITOA这个流程,重的地方可能要改轻,但是流程还是要有,流程怎么保证这个质量,就是要靠流程保证质量,没有流程怎么保证质量?没有流程靠个人英雄,可能某几个运维工程师特别牛,可能不需要任何流程,什么都在脑子里,需要解决。但是公司大到一定的规模,你要招到普通人呢?靠什么保证质量?只能靠流程保证质量。
媒体提问:这次也成立了一个联盟,这个联盟大家希望有自己的定位或者自己的空间,各位谈一下对联盟的一些希望,或者希望在这个联盟里面起到什么样的作用,这个联盟希望传递一个什么样的声音出去?
杨光辉:我们是属于联盟的积极拥护者,所谓的联盟并不是真的搞一个盟主这种性质,更多的想法是说现在有大量的想法,像IT运维的到运营的想法,分散在各个组织里面。我们接触很多用户的时候发现很多星星之火,我们希望提供这样一个平台,让星星之火可以能够让它闪亮。同时在IT行业里面有跟其它所有的传统行业都有一样的问题,就是很容易在中国形成无序同类的竞争,这种场景我们并不希望这种情况在IT运营这样一个环境里面重演,我们希望我们做的东西对于用户来说非常欧业务价值,对企业是非常有意义的,所以更多是在乎价值,而不是说在乎哪个成本是最低的,哪个是大家都做一样的,这样对用户来说可以很轻松的从其中挑选一个就结束了。实际上那些企业要胜利过程他自己的对手才是需要最关注的目标。如果我们能够帮助他们去获得他们自己的业务成功,这就是IT运营联盟的这样一个本身的传播的意义。所以我们并不是任何企业都会加入到任何开发运维技术、软件技术加入到运营的其中的过程当中,之前的奥涵和我们开会的时候探讨的时候我们希望引入一些在用户的商业价值进行精确的或者精密的频繁的探讨,仔细考虑到底为用户怎么创造长久的价值的企业可以坐在一起,不是简单美国怎么做,我们中国人要怎么做,那个就是别的公司在硅谷里面怎么说,我们要怎么说。我们不希望是这样的模式这是我们对于IT运营的联盟的主要的期望,也是我们对于所有加入企业当中希望最后形成一个非常高质量的交流文化以及我们的产品文化和对用户的价值发现的文化的主要的目标。
彭鲤航:我们是这么理解的,其实IT运营这个东西在中国市场应该是一个比较新兴的管理理念,我们接触到很多客户,他们还停留在传统的ITOA的思维,传统的东西。其实ITOM在国外很流行,但是在国内属于起步的阶段。我们理解,这种起步阶段其实是需要有一种力量传递这种力量,传递这种新兴的技术方法。其实ITOM联盟是一个非常好的机构,我们可以大家凝聚我们其实在这个领域的厂商,我们可以把我们的力量凝聚在一起,我们共同传递新兴的解决方案和管理理念,这个是正像的东西,我们可以把市场做得更加成熟,让客户更加容易理解我们新兴利于所存在的价值,这个是我们优维加入联盟的一些初衷和目的。
朱品燕:之前有人问到IT运营的问题,联盟就代表着有很多不同的点切入做这个事情。其实我们看云操作来看,其实它分为三层,IAAS、PAAS、SAAS,我们作为灵犀加入这个联盟,也是希望针对IT基础架构,希望和其它企业一起在整个IT架构里面做把这个IT运营的理念真正意义落到实处,让大家感受到这种变化,我们希望能够跟大家一起共赢做这个事情,我们灵犀加入这个组织重要的一个考虑。这是一个很大的生态圈。
陈军:这个事情也是奥涵最早提出创意,找我们一起商量。那么多公司基本上大部分都是面对同样的客户,都是在一个领域里面,都是在IT运营、运维的领域里面,我们都有共同的客户。奥涵提出我们互补,面对共同的客户,我们其实可以一起给客户提供一个一揽子的解决方案,这个也是联盟的初衷,站在解决客户问题的角度。
另外我们也都是在这个领域里面这两方面的因素,所以我们成立联盟。
媒体提问:您对联盟有什么希望?
陈军:能有更多类似这样的活动,业界的交流,市场推广,其实我们可以一起联合做一些市场推广。
热门跟贴