程序员人生 网站导航

专访多备份CTO陈元强:全面开启企业数据云端永生之路

栏目:互联网时间:2014-09-16 10:25:06

4G时代来临,企业数据面临爆炸式增长,动则上TB;与此同时,人为因素、软件缺陷、不可控的自然灾害等带来的安全问题也频繁发生,如何让企业数据安全可靠、且低成本高效率的长期保存下来,已经成为任何一家企业亟需考虑的问题。所幸的是,云时代伴随4G时代一起出现,云计算的核心优势:高性价比、资源按需分配、基础设施的柔性扩展、业务的平滑切换、带宽和存储无限扩容等特性。

多备份的云备份、云恢复、云归档等特性可以充分利用这些优质的云基础设施实现企业的数据管理服务;多备份是国内首家专注于企业数据云端备份、恢复、归档、存储和迁移的互联网公司,经过10个月的持续迭代,围绕着企业数据安全管理的服务已经陆续上线,得到了超过4万的中小企业客户认可,同时也引入了国际知名的资本投资。这次我们联系到了多备份的联合创始人兼CTO 陈元强,让我们来看看多备份是如何解决数据在云端可靠存储备份。以下为采访实录:


CSDN:数据存储备份领域实际已经有很多强劲的大腕,多备份是如何考虑要去做存储备份的?

陈元强:非常好的问题!大家都知道,最近继续出现了多起大型故障,这里面不乏有钱的主包括银行和云巨头等。我们都知道一些关键系统的容灾备份方案实际上是相当的贵,方案动则上亿,每年的维护费也是高得吓人,前段时间在网上讨论提到的宁夏银行就是因为费用太高,而放弃了一些维保计划,最后导致出现灾难故障。所以问题的根源还是费用问题。而恰恰超低的投入就可以解决问题,这就是多备份的核心优势之一。除此之外,传统的方案在使用上极其复杂,一般需要极强的专业能力才能上手,而极简设计也是多备份变革传统存储备份的关键,用户只需要3步就可以完成备份。

CSDN:目前包括亚马逊,阿里云,EMC,微软云,电信,移动等巨头都有自己的存储备份方案,多备份与这些云存储备份服务比起来,有哪些特点?

陈元强:首先,我们和这些云平台或者存储巨头是合作关系,我们是架构在这些平台上的一个SaaS应用,我们既是他们的客户,又是他们平台众多应用的核心应用。只有足够多的应用衍生在这些平台上,才有利于巨头构建云生态链产业,所以多备份是云生态链的一个核心环节。

从一开始我们的方向就放在了在这些巨型平台上做好服务,并不自己研发最底层的存储,真正通过多备份的整合式计算、存储、备份等服务,让这些平台的潜力发挥出来。用户可以根据自己的需要选择合适的或我们推荐的底层云计算和存储平台,其中一个关键技术就是Cloud 5,也就是对数据进行分块,并分散冗余存储在不同的云平台上,避免单云故障引起数据丢失。

EMC是一家非常厉害的数据管理服务公司,在大数据管理方面的经验是我们必须学习的;同时,EMC在云计算领域很早就布局了,在超大规模存储备份方案方面一直是他的强项。多备份更多是在学习EMC的大数据管理实践经验,并很好得和我们的创新方向融合在一起。

CSDN:多备份定位非常清晰:整合平台,形成强大聚合能力,变成一个可以根据用户需要,按需自由调度的全球性云计算平台。

陈元强:是的:-),的确是这样。对于创业企业来说,做自己擅长的事,与广泛的平台形成强有力的合作关系,是最容易出效果的路!

CSDN:整合这些云平台,多备份用了多长时间,投入资源情况如何?

陈元强:网站从去年10月上线,目前历时10个月,在研发上投入13人,我们的技术团队都是资深的人员,在系统,网络,存储,安全等平均都有7+年的经验,主要来自腾讯,盛大,迅雷等国内一线互联网企业。产品每天迭代统上线,用户发现的问题或缺陷,基本是当天立即修改;每周会有大的特性或优化上线;累计下来差不上万次的小细节修改,上百处大的优化和新功能开发。目前产品已经成熟,无论是大到上TB的企业核心应用数据,还是小到几MB的小网站的数据存储备份,用多备份都很easy的完成备份任务。


CSDN:一般的存储备份企业在研发上投入的资源相当大,多备份投入13人10个月的资源,具体的思路上有一些可以分享的么?

陈元强:的确,现有的一些传统的设备或软件投入资源相当大,动则数百人。实际上,我们的想法很简单,绝大部分产品要么是功能的罗列,要么就是过度设计。就拿现在的CDP(持续数据保护)产品来说,一般都宣称是实时,0恢复窗口,但最近有一种观点是说,实际绝大部分企业是在15分钟内的能恢复数据就可以满足要求了。有些时候,为了减少1分钟,你可能投入的资源和时间会是现有的数倍,所以把资源投入到最必须的特性上,这样其实可以解决99%的场景。这也是互联网作产品服务的“少即是多“思想的一个应用。所以,多备份的想法很简单,就是聚焦在企业核心数据,如各类业务(网站,OA,邮件系统,文件共享系统等)服务器(Linux,Windows,Aix)上的文件系统备份存储,以及常见的数据库(如:Mysql,Oracle,MSSQL等)数据的备份存储,具体应用上可以支持不同数据量级的场景。

CSDN:能否分享一些多备份实现多个云存储平台数据整合存储备份的一些具体思路?

陈元强:这个问题分成几个点来回答

1.  现有云计算平台的发展情况

国外公有云基本上形成了AWS称雄,Google,微软一线云服务并存的局面;同时包括Rackspace,HP,IBM,EMC等传统IT厂商,混合云平台并存的态势。国内的阿里云,电信,腾讯云,UCLOUD、七牛、华云以及各大老牌IDC厂家如西部数据,新网,万网,美橙等推出的云平台,非常多。所以来说,国外和国内云平台的数量都相当多,国内更多;云计算目前在国内时间还只有3-4年时间,各方面都在不断进步,性能、稳定性、服务等参差不齐。

2.  企业到底需要什么样的云平台能力

随着信息化技术深入到每个角落,企业从高利润中心,变成了薄利多销的模型,绝大部分企业需要的是容易解决业务需求,容易与外部进行沟通的成本低的方案。云计算平台的出现刚好符合这一趋势。同时也对云平台提出了更高的要求:高的性价比,稳定且易扩展,业务适应灵活,数据可靠安全。企业可以专注于自身业务,整合利用优质IT资源为业务服务。

3.  多备份是如何整合这些平台,并提供这些能力的

基本上来说这些云平台都有各自的特点,多备份最直接的情况就是结合各自特点,整合其优势,提供简单直接的数据存储备份使用入口。

就国外来说:AWS是最早的公有云平台,业务范围覆盖除了中国以外的其他地区,平台成熟度很高。但其实如果国内的朋友直接去用,实际会遇到不少的习惯问题,包括计费,存储和主机的使用。 Google主要是个人和GAE,企业级IAAS平台最近一段时间才开始发力,和微软的平台相对比较新一点,包括个人和企业,稳定性相对没有AWS稳定,另外一些限制也是各有特色。RackeSpace这类二线的云计算企业,在基础的产品体验上相对比较更困难一点。国外相对比较好的优势是基础配置比较好,特别是网络带宽这块。
就国内来说:产品成熟度,特别是可靠性和稳定性方面低于国外的几个主流云平台,相对比较优势的地方在于产品使用习惯更符合国人的习惯,最大的优势在于服务,遇到问题,可以找到人。国外的产品最大的问题在于沟通困难,除了LINODE/DIGITALOCEAN这类专注云主机服务的企业,响应快外,其他几个巨头的产品设置都找不到服务入口。国内的IAAS企业也逐步走向海外,香港是连接东南亚市场的第1站。但国内相对国外,在带宽计费方面是最大的区别,国外的累计流量消耗计费方式,更适合多备份的业务特点。
就整体容错和均衡能力来说,这些平台都没有实现平台物理区之间完全互联,各个服务中心之间都相对割裂。国外产品相对有一些跨地区的容灾能力,加上由于基础网络好,因为割裂而带来的影响相对没有国内大。

所以,其实云平台很多,但在产品设计,计费思路,基础设施,以及主打方向策略上都各有特点。对于企业来说,在抛弃传统的方案同时,希望放在云上的业务和重要数据就如存在银行的钱一样,可以非常放心,而不是因为用上了云,而再花精力来考虑业务之外的兼容性,可用性,可靠性和安全性等问题。

对于多备份,我们最关心云平台的三件事情:一是有没有高性能的主机服务,我们需要对备份的企业数据进行加工,属于I/O运算密集型业务;二是存储的可靠性,这是我们的命根子;三是主机和存储、用户和主机的距离,直接影响用户使用服务的速度体验。

因此我们主要还是聚焦在存储备份的整合,通过整合,提供简单易用界面,6个9(99.9999%)的数据安全可靠性(比如我们研发的Cloud 5技术),以及提供比单一云以及传统异地数据备份的更高的性价比,真正用很少的费用实现数据永不丢失。

CSDN:多备份目前覆盖的区域大体包括哪些国家地区?

陈元强:  多备份目前可以支持北美,国内,东南亚,西欧部分地区,其他地区目前更多是靠这些有云节点区域来覆盖,涉及到AWS、微软Azure、Linode、Rackspace、阿里云、Ucloud、移动云、电信云、Dropbox、微软One Drive、Google drive、百度云等。多备份目前全球区域覆盖分布示意图。


CSDN:前面我们有聊到,多备份既有支持国内,也有支持国外的云平台。目前这些平台是怎么样无缝的整合在多备份平台中,特别是考虑到国际出口的带宽其实非常拥挤。

陈元强:对于国际国内的平台的整合,一开始我们并没有考虑这么多,更多的是把业务模型做出来,所以前期遇到不少问题,跨国际线路控制命令传输丢失,国内国外的数据相互绕着传递,调度也没有考虑任务区域的分配情况,加上各类云平台其实稳定性都存在这样或那样的问题,所以一开始挑战很大,任务时常卡,或存储失败率比较高。互联网在架构设计上有个说法是,架构从来不是设计出来的,是不断结合运营优化出来的;经过近10个月的不断优化迭代,产品体验上了一个大的台阶,在用户界面上突出启发式引导,功能聚焦在备份与恢复这两个的核心体验上,基础资源方面做了大量的体系化的优化和区域路由平衡,对于任务进行分级分区调度,速度更快,任务执行更稳定。

CSDN:有1个安全方面的话题,我们前几期对其他云服务的采访,都提到过云平台的安全问题,企业也是非常关心这个话题。这块多备份有一些具体的措施么?

陈元强:的确,安全是多备份运转的基础,但安全永远是1个没有完结的话题,多备份在安全方面一直非常重视,体现在如下几个基础事情方面:

  • 保护用户数据的承诺从法律和内部规章上进行明确。
  • 系统管理权限由专人负责,减少因为权限分散带来的潜在风险。
  • 所有的服务定期安全检测和风险评估,并定期进行安全策略调整。
  • 系统运转数据实时热备和冷备,系统自身具备自恢复能力。
  • 所有用户的敏感数据用AES算法加密;对于用户备份的数据,在流出用户主机前,就已经做了高强度加密;同时用户相关的行为操作会自动进行安全审计。
  • 对于采用了Cloud 5的任务,会无序打散在不同的云和存储设施
  • 基于主流云平台,多备份本身会启用云平台自身的安全保障服务,进一步增强系统的风险发现和预测能力

尽管如此,我们还是希望整个行业有更多的正能量叠加,真正的把团队的精力用在不断推动行业效率提升和应对自然灾害、软件缺陷或人为误操作引起的故障应对的方向上来。

CSDN:我们之前聊到一些数据规模的问题,多备份可以在全球范围内,流畅支持从几MB,到数TB的数据存储备份,这块能否介绍一下?

陈元强:先说一下多备份的高效智能化的备份网络架构模型,整体借鉴Linux内核的设计模型,是一个分层大异步与小同步驱动设计的模型,每一层都为上一层提供核心的能力协议。


为了实现TB/MB各种量级的数据能在备份网络中混合快速备份,具体来说从几个环节入手:

数据接入层

数据接入层的设计目的很简单,就是用最容易,最通用的接入数据的技术,让各类场景的数据,很轻松接入到备份系统中,同时保持每次尽可能少的数据传输。所以,除了常规的分块,压缩,去重等常规技术外,还结合互联网的带宽小的特点,支持多级缓存加速技术,用最快速的差异分析技术,使得每一次备份都保持最小的数据量流入到数据传输层。

第1次:蓝色区块表示对数据最小化起主要作用的功能块,图中示意从10GB 变成1-5GB,最后输出的数据还同数据本身的特征相关。


第2次以后:在第1次的基础上,本地缓存相关加速比对和差异分析开始运转,实际变化的数据可能会非常小,图中示意虽然新增了1GB,但实际变化的数据只有0.1GB不到。


目前具体部署形态上,我们支持插件,托管,以及客户端代理模式,插件主要针对中小型(1GB以下的)网站,托管支持规模稍大一点的1-30GB,而客户端模式支持30GB以上的数据备份。

目前我们在Linux(32,64位),Windows(32,64),以及Aix上都已经完整支持。数据库目前我们支持主流的MySQL,Oracle,MSSQL,PostgreSQL。在具体的应用场景上,我们有一套对应的场景识别能力,同时可以结合API,把控制面板嵌入到云平台,虚拟主机厂家,以及在线SAAS服务等。

数据传输层

目前备份网络工作策略:基本是采用传输和控制分离的方式来设计整体传输网络,类似目前SDN的思想:通过对目标类型识别,服务器进行分区编码,资源状态以及网络状态动态分析,支持全球范围的智能化的调度能力,对于不同规模,不同区域的对象,我们会自动调度到最合适的节点和线路,确保最优化配置网络节点和带宽资源,优化备份恢复体验。


具体分为几个要点来考虑:

节点:直接采用优化过的OS底层协议栈,快速启动传输窗口,加快数据传输速度。

网络:在具体的网络部署上,通过采用优质的节点,建立核心传输通道;同时对根据数据特点,设定节点优先级分区,隔离大、小数据和VIP通道;同时启动就近接入和链路聚合策略,提高节点之间的带宽利用率;对于一些要求比较高的场景,比如超大规模的数据,我们同时会启动区域加速策略完成分段数据快速传输。

数据存储层

目前多备份支持企业级和个人云盘存储接入;并支持完全冗余分组组合和Cloud 5分块跨云冗余模式。数据原则上就进存储,对于启用组合合Cloud 5模式的会进入区域加速模式传输。

提高数据存储效率。另外,在云存储这里,我们已经与几家平台有深入的合作,比一般接入商开放的API能力会更加强大。


存储为多级索引设计,支持跨地区分布,支持多云存储,同时存储对象分为区块和文件对象组合的方式,提供高速的存储,下载,搜索等能力。

优化永远没有结束,目前我们正在与国内的顶级加速厂商以及更多的云计算与云存储企业合作,在不久后,就会全面启动全球范围内的的数据传输通道加速,预计在目前备份网络目前的基础上会提升3-5倍的传输能力,对于超过TB级的数据的备份和恢复、迁移等动作响应时间会大大缩短。

CSDN:最近几年,云计算相关的平台和服务发展非常快,据说多备份已经有超过4万家企业在使用,祝福多备份在此浪潮中顺势建立起口碑,不断推出云上惊喜的数据管理功能,为上云的企业提供更多亲民的数据安全保障服务,让数据永生!

陈元强:感谢,这也是我们确定的目标,必须努力!

(责编/魏伟)

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐