数据安全保障措施

Posted by Kaka Blog on March 3, 2020

为什么写这篇文章

近期,微盟删库事件上了热搜,删库跑路已成为技术圈的调侃话题,然而产生如此巨大影响的还是首例。写这篇文章的目的是为了提醒大家要提高数据安全防护意识,以及如何保障数据安全。

造成的影响

2月24日晚,微盟的SaaS业务服务突然停摆,而微盟旗下的商户小程序突然性全部处于拓机状态,至此,微盟旗下300万商户的线上业务全部停止。

事故经过

2月23日,因公司员工恶意破坏公司线上生产环境及数据,导致公司系统服务不可用。目前,该犯罪嫌疑人已被上海市公安局宝山分局刑事拘留。

2月25日,微盟紧急恢复了核心业务的线上生产环境,新用户使用不受影响,并提供老用户临时过渡方案,确保商家在数据暂时没有恢复的情况下可以正常经营。

2月28日,微盟恢复了所有业务的线上生产环境,并且开放了老用户登录,以及恢复了微站产品的所有数据。

截止到3月1日晚8点,在腾讯云团队的协助下,经过7*24小时的努力,微盟已经全面找回数据。由于此次数据量规模非常大,为了保证数据一致性和线上体验,微盟将于3月2日凌晨2点至8点,进行数据恢复上线演练,在此期间微盟的系统将会停止服务,演练完成后系统数据回滚到3月2日的数据。

微盟将于3月2晚上10点至3月3日上午9点,正式进行数据恢复上线,微盟将恢复2月23日之前的数据,同时将2月23日与3月2日的数据进行合并,届时微盟所有的数据恢复完成。

付出的代价

  • 微盟准备了1.5亿元人民币赔付拨备金,其中公司承担1亿元,管理层承担5000万元。其中公司董事会主席兼首席执行官孙涛勇承担3500万元,公司执行董事兼首席技术官黄骏伟承担500万元,公司执行董事兼智慧商业事业群总裁方桐舒承担500万元,公司执行董事兼智慧营销事业群总裁游凤椿承担500万元。
  • 微盟的股价下跌了22%,市值缩水了超30亿港元。

反思

数据是企业最为重要的资产,直接关系到企业的生死。

当互联网时代的发展红利见顶,我们开始越来越多地把关注的目光聚焦在了大数据、AI、云计算和区块链为代表的新技术身上。尽管行业的发展趋势是这样的,但是,这种新技术真正发挥出重要的作用却少之又少。微盟事件则是让我们真真切切地感受到了数据,特别是大数据正在成为一个企业非常重要的资产,甚至在某种程度上直接决定着企业的生死存亡。这一点,我们可以在微盟的市值缩水和后续微盟对商家的补贴中看出一些端倪。

决定企业发展的不再是资本和流量,而是对客户的服务水平和能力。

在互联网时代,资本和流量在延续企业的发展扮演着重要的作用,从某种程度上来讲,资本和流量是企业发展的命脉所在。所以我们看到几乎所有的企业都在把资本和流量看成是终极目标来追求。透过此次微盟事件,试想一下,如果我们有很多流量,有雄厚的资金,但是,我们却不能给用户提供他们想要的产品和服务,那么,到最后企业的发展或许只能依靠资本输血和收割用户来维系,而无法通过产品和服务来进行自我造血。因此,如何优化和提升企业的产品和服务才是后互联网时代真正决定行业发展的关键因素。

数据保障措施

事故分析

此次事故暴露出微盟在数据安全方面出现了管理漏洞。需要解决几方面的问题:

1、该运维人员的权限太大。 2、为什么删掉数据库就造成系统瘫痪,难道数据库没有备份吗? 3、如何规范操作生产环境流程。

据了解,微盟的底层架构采用的是混合云模式,部分自建部分上云,而微盟被删的数据恰好是没有上云的自建部分。

数据安全保障措施

措施一:数据安全管理机制全面加固与整改,加强运维平台治理

1、完善数据安全管理制度(涵盖权限、监控、审计方面),严格执行授权审批制度;

2、使用权限系统进行云资源管理,严格执行分级授权和最小集权限制度,对高危险动作执行二次授权制度;(切勿将所有的权限归于某单一人员手里)

3、建立科学、高效、安全的网络策略,对开发环境、测试环境和生产环境进行严格隔离;使用云堡垒机替换自建堡垒机,进行细粒度权限分级和授权管理,同时严格审计堡垒机操作日志,发送安全审计报表;

4、加强运维安全流程学习,职业道德学习,法律学习等。

5、员工调岗或离职,也一定要清理该员工的各项权限;而公司在平时的运行中,也一定要多注意员工的心理健康问题。

措施二:加强灾备体系的建设,做到多云异地冷备

1、建立多云灾备体系,在北京、上海、南京等地区建立全备份的冷备系统架构;

2、借助云的IAAS的底层服务能力,建立高可用的同城双活架构;

3、云上所有的云主机,启用每天的快照策略,保证全量和增量备份;

4、所有非结构化数据,使用COS对象存储系统进行归档保存,启用COS的多异地复制功能,数据存放多地,并且COS 冷存储,确保数据只增不减;

5、建立月、季度级别的定期演练机制和制度。类似阿里的混沌工程、奈飞(Netflix)的Chaos Monkey等,通过随机制造的故障,检验系统的高可用性,暴露结构性风险。

措施三:基础设施全力上云

1、借助云数据库MySQL的数据高可用和安全体系,逐步放弃自建数据库服务 ,迁移到云数据库,快速具备数据库跨可用区和异地灾备的能力。