智西凯:谢谢林主任!各位专家,大家好!我下面给大家介绍一下深圳证券交易所交易系统灾备及应急处理方面的情况。

首先介绍一下深圳证券交易所,成立于1990年,目前有投资者7060万,针对的是散户市场,开户人数众多,对我们的系统压力很大。上市公司截止3月底的数字,上市公司有689家,上市证券888只。去年深圳证券市场累计股票交易金额超过15万亿,今年的重点工作,准备创业板正式推出。

这是一个介绍投资者、证券公司和证券交易所关系的示意图。

交易系统是深圳证券交易所的核心基础设施,经过这么多年的发展,目前成为功能全面的一体化交易系统,现在每日处理效率可以达到3600万笔委托,这个考虑了结算公司、证券公司等各方面情况算出来的数据。交易系统交易峰值更高,可以达到3万/秒。目前支持2000只证券,5000个席位的交易。交易系统面临的要求非常高,我们系统采用同城异地的灾备中心。在交易应用系统方面,经过多年完善,发展到第四代,委托指令驱动,集中竞价撮合的电子化交易系统,这是我们自主开发的,目前这种模式比较适合中国发展的现状,一是节省成本,二是可以迅速适应市场发展要求,还有一个最重要的,在应急处理方面,也是一个优势,我们的技术人员可以实时修改这些程序,迅速恢复系统运行。

在容灾方面,刚才讲采用(容错)主机,这种方法交易所用的比较多,比如美国纳斯达克,香港交易所、韩国交易所都采用了这种形式,交易所大概90%以上采用这种主机,主要的特点是从设计上采用(容错),硬件、中央处理CPU、磁盘,单个突发故障不影响系统的运转,而且可以带电更换。在容灾方面,建设同城灾备交易主机。在上海建立了异地数据备份中心,因为全国的股东资料,包括持股的情况,都是不可能从市场上买来的,所以很宝贵,我们在上海建立了一个备份中心保存这些数据。

(图)这是目前灾备的大架构图。可以看到有三方面的系统,一个是交易系统,还有一个是通信系统,是由通信公司管理的,相当于交易的通信前端,另外一个是结算系统,每天交易过后清算过户,还有大家的开户、托管,这方面都在结算系统里面。现在有三地进行,交易在深业大厦,结算在中信广场,通信在滨海中心。

(图)券商和通信方面,我们采取卫星和地面两套网互备。

(图)这是刚才3D网络的总体架构,在每个点都放置两台思科交换机,通过光纤构成一个环形结构的城域网。在通信和主交易系统中还建立微波通信系统。

在容灾方面,我们提出的两个指标,RPO这边要求100%,所有的交易数据必须完整,切换以后所有成交要跟原来的主系统情况完全一致,不能有任何丢失,因为证券交易所的特点,如果有一笔出现差错,后面整个会乱掉。RTO这边,提出15分钟完成系统切换,有一些复杂情况,涉及到领导决策,可能会适当延长时间。

灾备切换包括主机房电力中断;主机房发生重大水灾、火灾、爆炸;交易主机操作系统崩溃等。如果一对中央处理器同时出现故障,需要切换到灾备活动。

(图)应急体系方面,要遵照两层,一级是国家级制订的《国家突发公共事件总体应急预案》,另外一级是行业的。

交易运行这边成立交易运行工作小组,这是在领导组下设的,由指定人员组成,还有一些职责。

在预防和预警机制上,采用的是人工和自动双保险的做法,有运行监控人员,24小时监控系统的状况。自动监控采用定制开发的综合报警系统,整合了所有的平台,除了交易还有监察等后台系统,整合这些以后,通过报警终端、电话语音通知、声音报警等多形式的报警方式,及时报告系统出现的异常情况。有些人还没有发现,按照系统自动的消息已经发到手机和电脑上。我经常晚上两、三点的时候受到一些消息和电话,有什么情况及时发现、及时处理。

分级处置方面,根据要求分了级别,针对交易所系统的特点,我们处置原则有一个迅速恢复,由于证券市场要求的特点,迅速恢复市场的运行,这个原则也提到比较重要的地位,对于系统出现的故障,可以事后进行分析。还有一种防止损失、灾害的扩大,刚才几位嘉宾也讲到,不要因为一些小的灾难应急不当,引起扩大,这方面是我们坚持的原则。还有家吃公开、公平、公正的原则,处理的时候主要维护市场公平。比如说有一定比例的证券公司营业部如果不能连接到我们主系统,出现通讯故障,这时候虽然主机系统应能运转,为了保证市场公平期间,会主动暂停一些交易,保证整体的公平性。

制定这些预案,应急演练也是非常重要的,在我们的内部,经常进行一些故障演戏,还有新程序上线,切换演练是必做的项目,每年大概有10、20次内部演练。全网演练每年进行一次,在05、06年每年固定在10月份组织全行业应急演练工作。

应急演练全行业的涉及到动员问题,首先在提前一、两个月发布交易系统演练测试通知,为了鼓励大家参加,我们还设立了应急演练测试的反馈表,因为要动员上百、上千家营业部参加。

(图)这是07年发的正式通知,通知大家一些测试项目、具体安排,制定了测试方案,规定了时间段,给大家明确测试的内容,后面制定了一些要求大家参加的反馈表,有什么问题可以及时获得这方面的信息,进行分析统计。还有测试情况统计表,我们鼓励大家参加,对测试结果都有公告,对积极参加的还有一些鼓励,经常不参加的有一定的通报批评。

07年我们做了模拟,主要有三个,确认通信,以前做火灾,去年做了三个模拟微波通信确实可用;第二是确认灾备主机的可用;第三是整个通信公司的主机出现问题,切换到备份机房的情况。

(图)里面所有的光纤出现故障,主交易系统虽然系统没有问题,但跟外面切断以后,等于完全失去了作用,出现问题以后,先启用微波系统,微波系统中断,我们切断到灾备中心运行。

要制定一些详细的测试报告,每年测试都会发现一些问题,完善我们的程序。达到检验灾备系统可用性、满足行业相关法规制定的要求,还有ISO20000,去年年底我们通过了ISO20000的认真,今年又通过ISO27001的认证。发现问题可以及时完善,促进会员完善灾备通信系统。交易所作为行业主要的服务者和监管者,对券商来说,根据这些记录,交易所按照我们做应急测试、完善系统,可能会增大相应的投入,比如说去申请一些备份通信线路,采购必要的容灾设备等等,也起到相应的促进作用。

因为时间关系,主要给大家介绍我们交易所的情况,谢谢大家!