CN102541693A - 数据的多副本存储管理方法和系统 - Google Patents
数据的多副本存储管理方法和系统 Download PDFInfo
- Publication number
- CN102541693A CN102541693A CN2011104598627A CN201110459862A CN102541693A CN 102541693 A CN102541693 A CN 102541693A CN 2011104598627 A CN2011104598627 A CN 2011104598627A CN 201110459862 A CN201110459862 A CN 201110459862A CN 102541693 A CN102541693 A CN 102541693A
- Authority
- CN
- China
- Prior art keywords
- server
- master server
- data
- servers
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种数据的多副本存储管理方法和系统,该方法包括:多个服务器在各自的存储器中保存需要保存的全部数据,并且多个服务器之间实现数据存储的同步;在多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器利用保存的数据代替主服务器提供数据处理服务,其中,主服务器之外的其他服务器被禁止提供数据处理服务。本发明通过在每个数据服务器上保存所有需要保存的数据并在服务器之间实现数据同步和主备切换,能够有效实现数据的多副本保存,同时实现多服务器彼此间的备份和替换,提高系统的稳定性和可靠性。
Description
技术领域
本发明涉及计算机领域,并且特别地,涉及一种数据的多副本存储管理方法和系统。
背景技术
目前,在大规模高性能计算集群中,由于存在着用户众多、作业量巨大、整体IO吞吐量要求高的情况,因此现在基于单个服务器端的网络文件系统已经大大不能满足用户的需求,特别是大型数据中心和并发数量大、IO量大的需求。这时,并行存储系统(分布式存储系统)的概念就应用而生了。
目前已经出现了一些并行存储系统,这些存储系统能够实现元数据和一般数据(是指原数据之外的数据,例如,文件数据,这些一般数据在本文中被统称为数据)分别存储,以便在读写的时候提高性能;数据服务器的数量为多个,从几个达到数百甚至数千个,从而构成了大规模的网络文件系统。
虽然存储数据的多个服务器可以实现相互之间的备份,从而提高整个系统的稳定性和可靠性,但是,这多个服务器访问的存储器只有一个,在该存储器出现故障的情况下,所有的服务器均无法提供与数据处理相关的服务器,从而导致整个系统出现故障。
针对相关技术中存储数据的服务器无法实现有效的彼此替换和数据备份的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中存储数据的服务器无法实现有效的彼此替换和数据备份的问题,本发明提出一种数据的多副本存储管理方法和系统,能够有效实现数据的多副本保存,同时实现多服务器彼此间的备份和替换,提高系统的稳定性和可靠性。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种数据的多副本存储管理方法。
该方法包括:多个服务器在各自的存储器中保存需要保存的全部数据,并且多个服务器之间实现数据存储的同步;在多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器利用保存的数据代替主服务器提供数据处理服务,其中,主服务器之外的其他服务器被禁止提供数据处理服务。
其中,在多个服务器中未确定主服务器、或者已经确定的主服务器无法继续提供数据处理服务的情况下,通过以下方式确定主服务器:多个服务器彼此之间进行协商,根据各个服务器的当前状态确定作为主服务器的服务器;或者根据操作人员的指示,确定需要作为主服务器的服务器。
并且,服务器的当前状态包括以下至少之一:该服务器的存储器访问是否正常,该服务器的负载,该服务器的网络连接状态。
此外,在指定的主服务器满足以下条件中的至少之一时,确定该主服务器无法继续提供数据处理服务:该主服务器的网络连接出现异常、该主服务器的存储器访问出现异常、该主服务器的负载超过预定负载阈值。
此外,其他服务器中的一个服务器利用保存的数据代替主服务器提供数据处理服务包括:确定原主服务器之外的一个服务器作为新的主服务器,并将该服务器的存储器激活,使激活的存储器能够提供数据处理服务;新的主服务器利用其存储器中存储的数据,响应于数据处理服务的指令提供数据处理服务。
根据本发明的另一方面,提供了一种数据的多副本存储管理系统。
该系统包括多个服务器,其中,每个服务器包括:存储器,用于保存需要保存的全部数据;同步模块,用于实现所在服务器与其他服务器之间的数据存储同步;服务提供模块,用于在所在的服务器被确定为主服务器的情况下,利用所在服务器的存储器中保存的数据提供数据处理服务,其中,在一时间多个服务器中仅存在一主服务器,且仅由该主服务器提供数据处理服务;其中,在多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器代替当前的主服务器提供数据处理服务。
其中,在多个服务器中指定的主服务器满足以下条件中的至少之一时,该主服务器触发重新选择主服务器:该主服务器的网络连接出现异常、该主服务器的存储器访问出现异常、该主服务器的负载超过预定负载阈值。
此外,多个服务器中的主服务器的存储器处于激活状态,在激活状态下,该主服务器能够利用其存储器中存储的数据提供数据处理服务器,其他服务器则被禁止提供数据处理服务。
其中,每个服务器进一步包括信息交互模块,用于与其他服务器实现信息的交互,交互的信息包括服务器状态信息,在当前的主服务器无法继续提供数据处理服务的情况下,每个服务器根据各自与其他服务器的状态信息确定能够作为新的主服务器的服务器。
本发明通过在每个数据服务器上保存所有需要保存的数据并在服务器之间实现数据同步和主备切换,能够有效实现数据的多副本保存,同时实现多服务器彼此间的备份和替换,提高系统的稳定性和可靠性。
附图说明
图1是根据本发明实施例的数据的多副本存储管理方法的流程图;
图2是根据本发明实施例的数据的多副本存储管理系统的框图。
具体实施方式
根据本发明的实施例,提供了一种数据的多副本存储管理方法。
如图1所示,根据本发明实施例的数据的多副本存储管理方法包括:
步骤S101,多个服务器在各自的存储器中保存需要保存的全部数据,并且多个服务器之间实现数据存储的同步,其中,主服务器之外的其他服务器被禁止提供数据处理服务;
步骤S103,在多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器利用保存的数据代替主服务器提供数据处理服务。
其中,在多个服务器中未确定主服务器、或者已经确定的主服务器无法继续提供数据处理服务的情况下,可以通过以下方式确定主服务器:
多个服务器彼此之间进行协商,根据各个服务器的当前状态确定作为主服务器的服务器;或者
根据操作人员的指示,确定需要作为主服务器的服务器。
也就是说,不论在什么情况下确定主服务器,既可以采用服务器之间协商的方式,也可以又管理员发出指令指定主服务器。
在服务器进行协商时,可以彼此传输各自的状态,每个服务器传输的该服务器的当前状态可以包括以下至少之一:该服务器的存储器访问是否正常,该服务器的负载,该服务器的网络连接状态。每个服务器可以先判断自身的状态是否能够作为主服务器,之后可以将其他服务器传输的状态与自身的状态进行比较(可选地,只有自身状态满足作为主服务器要求的服务器会进行该比较步骤),根据一定的策略确定本身相比于其他服务器是否更适合作为主服务器(例如,上述策略可以是将状态最好的服务器确定为主服务器),最后,被确定为主服务器的服务器会将其被确定为主服务器的信息通知给其他服务器。
具体如何选择主服务器的方法有很多,并不局限于上述方法,本文不再一一列举。
在指定的主服务器网络连接出现异常、和/或该主服务器的存储器访问出现异常、和/或该主服务器的负载超过预定负载阈值的情况下,该主服务器就会确定其无法继续提供数据处理服务,此时需要出发主服务器的重选,该服务器可以不作为候选对象。
在当前主服务器之外的一个服务器作为新的主服务器代替原主服务器提供数据处理服务时,可以将该服务器的存储器激活,使激活的存储器能够提供数据处理服务,并且使得对原主服务器的访问转移到新的主服务器;新的主服务器利用其存储器中存储的数据,响应于数据处理服务的指令提供数据处理服务,由于每个服务器保存的数据是相同的,因此,新的主服务器能够正常提供数据处理服务,包括对数据的读取、写入、修改、删除等操作。
本发明可以用于多种并行存储系统,例如,可以用于parastor并行存储系统避免某个数据服务器出现故障而造成数据丢失、进而使整个并行存储系统的文件全部不可用的问题。本发明能够在并行存储系统的数据服务器上增加功能,使其能够将文件的数据同时存储在两个或多个地方,从而避免单点故障导致整个文件系统不可用的情况。
根据本法明的实施例,还提供了一种数据的多副本存储管理系统。
如图2所示,该系统包括多个服务器(出于清楚的目的,图2中仅示出了2个服务器,在实际应用中,服务器的数量可以更多,根据实际需要,可能会达到成百上千甚至更多),每个服务器包括(出于清楚的目的,图2中仅详细示出了一个服务器的结构,实际上,其他的服务器同样具备类似结构):
存储器21,用于保存需要保存的全部数据;
同步模块22,连接至存储器21,用于实现所在服务器与其他服务器之间的数据存储同步;
服务提供模块23,连接至存储器21和同步模块22,用于在所在的服务器被确定为主服务器的情况下,利用所在服务器的存储器中保存的数据提供数据处理服务,其中,在一时间多个服务器中仅存在一主服务器,且仅由该主服务器提供数据处理服务;
其中,在多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器代替当前的主服务器提供数据处理服务。
其中,在多个服务器中指定的主服务器满足以下条件中的至少之一时,该主服务器触发重新选择主服务器:该主服务器的网络连接出现异常、该主服务器的存储器访问出现异常、该主服务器的负载超过预定负载阈值。
每个服务器都会与其他服务器进行通信,该通信可以实时进行,传递数据同步或各自的状态等多种信息。每个服务器可以进一步包括信息交互模块,用于与其他服务器实现上述通信,交互的信息包括服务器状态信息,在当前的主服务器无法继续提供数据处理服务的情况下,每个服务器根据各自的状态信息与其他服务器的状态信息确定能够作为新的主服务器的服务器。该交互模块可以与同步模块集成在一起。
此外,多个服务器中的主服务器的存储器处于激活状态,在激活状态下,该主服务器能够利用其存储器中存储的数据提供数据处理服务器,其他服务器则被禁止提供数据处理服务。
通过本发明的上述技术方案,允许在同一并行存储系统内有两个或多个数据服务器存在,但当前正在服务的数据服务器只有一个,其他服务器不对外提供服务;不同数据服务器均有自己的存储空间来存储整个文件系统的数据信息,相互之间没有依赖关系,从而保证主服务器的数据损坏之后,其他服务器保存的数据仍旧正常;其他服务器的数据信息能够和主服务器间实现实时、无缝的同步,当新的数据写入时,能够保证在各个数据服务器的数据信息完成同步以后,写入操作才返回。此外,主服务器和其他服务器能够实现高可用的关系(例如,可以通过第三方控制平台或软件来实现),即当主服务器不能提供服务时,能够由其他服务器自动接管主服务器的资源,为整个文件系统提供服务。
综上所述,借助于本发明的上述技术方案,通过在每个数据服务器上保存所有需要保存的数据并在服务器之间实现数据同步和主备切换,能够有效实现数据的多副本保存,同时实现多服务器彼此间的备份和替换,提高系统的稳定性和可靠性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种数据的多副本存储管理方法,其特征在于,包括:
多个服务器在各自的存储器中保存需要保存的全部数据,并且所述多个服务器之间实现数据存储的同步;
在所述多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器利用保存的数据代替所述主服务器提供数据处理服务,其中,主服务器之外的其他服务器被禁止提供数据处理服务。
2.根据权利要求1所述的多副本存储管理方法,其特征在于,在所述多个服务器中未确定主服务器、或者已经确定的主服务器无法继续提供数据处理服务的情况下,通过以下方式确定主服务器:
多个服务器彼此之间进行协商,根据各个服务器的当前状态确定作为主服务器的服务器;或者
根据操作人员的指示,确定需要作为主服务器的服务器。
3.根据权利要求2所述的多副本存储管理方法,其特征在于,服务器的当前状态包括以下至少之一:
该服务器的存储器访问是否正常,该服务器的负载,该服务器的网络连接状态。
4.根据权利要求1所述的多副本存储管理方法,其特征在于,在指定的所述主服务器满足以下条件中的至少之一时,确定该主服务器无法继续提供数据处理服务:
该主服务器的网络连接出现异常、该主服务器的存储器访问出现异常、该主服务器的负载超过预定负载阈值。
5.根据权利要求1所述的多副本存储管理方法,其特征在于,其他服务器中的一个服务器利用保存的数据代替所述主服务器提供数据处理服务包括:
确定原主服务器之外的一个服务器作为新的主服务器,并将该服务器的存储器激活,使激活的存储器能够提供数据处理服务;
新的主服务器利用其存储器中存储的数据,响应于数据处理服务的指令提供数据处理服务。
6.一种数据的多副本存储管理系统,其特征在于,包括多个服务器,每个服务器包括:
存储器,用于保存需要保存的全部数据;
同步模块,用于实现所在服务器与其他服务器之间的数据存储同步;
服务提供模块,用于在所在的服务器被确定为主服务器的情况下,利用所在服务器的存储器中保存的数据提供数据处理服务,其中,在一时间所述多个服务器中仅存在一主服务器,且仅由该主服务器提供数据处理服务;
其中,在所述多个服务器中预先指定的主服务器无法继续提供数据处理服务的情况下,其他服务器中的一个服务器代替当前的主服务器提供数据处理服务。
7.根据权利要求6所述的多副本存储管理系统,其特征在于,在所述多个服务器中指定的所述主服务器满足以下条件中的至少之一时,该主服务器触发重新选择主服务器:
该主服务器的网络连接出现异常、该主服务器的存储器访问出现异常、该主服务器的负载超过预定负载阈值。
8.根据权利要求6所述的多副本存储管理系统,其特征在于,所述多个服务器中的主服务器的存储器处于激活状态,在所述激活状态下,该主服务器能够利用其存储器中存储的数据提供数据处理服务器,其他服务器则被禁止提供数据处理服务。
9.根据权利要求6所述的多副本存储管理系统,其特征在于,每个服务器进一步包括信息交互模块,用于与其他服务器实现信息的交互,交互的信息包括服务器状态信息,在当前的主服务器无法继续提供数据处理服务的情况下,每个服务器根据各自与其他服务器的状态信息确定能够作为新的主服务器的服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104598627A CN102541693A (zh) | 2011-12-31 | 2011-12-31 | 数据的多副本存储管理方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104598627A CN102541693A (zh) | 2011-12-31 | 2011-12-31 | 数据的多副本存储管理方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102541693A true CN102541693A (zh) | 2012-07-04 |
Family
ID=46348643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011104598627A Pending CN102541693A (zh) | 2011-12-31 | 2011-12-31 | 数据的多副本存储管理方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102541693A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102970350A (zh) * | 2012-11-05 | 2013-03-13 | 曙光信息产业(北京)有限公司 | 在存储系统中维护副本一致性的方法 |
CN103369051A (zh) * | 2013-07-22 | 2013-10-23 | 中安消技术有限公司 | 一种数据服务器集群系统及数据同步方法 |
CN104104648A (zh) * | 2013-04-02 | 2014-10-15 | 杭州信核数据科技有限公司 | 一种访问存储设备中的数据的方法、应用服务器和网络 |
CN104753994A (zh) * | 2013-12-27 | 2015-07-01 | 杭州海康威视系统技术有限公司 | 基于集群服务器系统的数据同步方法及其装置 |
CN108243209A (zh) * | 2016-12-23 | 2018-07-03 | 深圳市优朋普乐传媒发展有限公司 | 一种数据同步方法及装置 |
CN109766218A (zh) * | 2018-12-21 | 2019-05-17 | 中信百信银行股份有限公司 | 基于分布式存储的数据备份方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1493031A (zh) * | 2001-02-24 | 2004-04-28 | 国际商业机器公司 | 用于在故障出现时维持全部性能的文件服务器的双尾故障终止 |
CN101557320A (zh) * | 2009-05-25 | 2009-10-14 | 杭州华三通信技术有限公司 | 容灾的实现方法及其通信设备 |
CN101876924A (zh) * | 2009-04-30 | 2010-11-03 | 升东网络科技发展(上海)有限公司 | 数据库故障自动检测及转移方法 |
CN101903864A (zh) * | 2007-12-21 | 2010-12-01 | 日本电气株式会社 | 节点系统、服务器切换方法、服务器装置和数据接管方法 |
CN102122306A (zh) * | 2011-03-28 | 2011-07-13 | 中国人民解放军国防科学技术大学 | 一种数据处理方法及应用该方法的分布式文件系统 |
-
2011
- 2011-12-31 CN CN2011104598627A patent/CN102541693A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1493031A (zh) * | 2001-02-24 | 2004-04-28 | 国际商业机器公司 | 用于在故障出现时维持全部性能的文件服务器的双尾故障终止 |
CN101903864A (zh) * | 2007-12-21 | 2010-12-01 | 日本电气株式会社 | 节点系统、服务器切换方法、服务器装置和数据接管方法 |
CN101876924A (zh) * | 2009-04-30 | 2010-11-03 | 升东网络科技发展(上海)有限公司 | 数据库故障自动检测及转移方法 |
CN101557320A (zh) * | 2009-05-25 | 2009-10-14 | 杭州华三通信技术有限公司 | 容灾的实现方法及其通信设备 |
CN102122306A (zh) * | 2011-03-28 | 2011-07-13 | 中国人民解放军国防科学技术大学 | 一种数据处理方法及应用该方法的分布式文件系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102970350A (zh) * | 2012-11-05 | 2013-03-13 | 曙光信息产业(北京)有限公司 | 在存储系统中维护副本一致性的方法 |
CN104104648A (zh) * | 2013-04-02 | 2014-10-15 | 杭州信核数据科技有限公司 | 一种访问存储设备中的数据的方法、应用服务器和网络 |
CN103369051A (zh) * | 2013-07-22 | 2013-10-23 | 中安消技术有限公司 | 一种数据服务器集群系统及数据同步方法 |
CN103369051B (zh) * | 2013-07-22 | 2016-04-27 | 中安消技术有限公司 | 一种数据服务器集群系统及数据同步方法 |
CN104753994A (zh) * | 2013-12-27 | 2015-07-01 | 杭州海康威视系统技术有限公司 | 基于集群服务器系统的数据同步方法及其装置 |
CN104753994B (zh) * | 2013-12-27 | 2019-04-02 | 杭州海康威视系统技术有限公司 | 基于集群服务器系统的数据同步方法及其装置 |
CN108243209A (zh) * | 2016-12-23 | 2018-07-03 | 深圳市优朋普乐传媒发展有限公司 | 一种数据同步方法及装置 |
CN109766218A (zh) * | 2018-12-21 | 2019-05-17 | 中信百信银行股份有限公司 | 基于分布式存储的数据备份方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102411639B (zh) | 元数据的多副本存储管理方法和系统 | |
CN102043686B (zh) | 一种内存数据库的容灾方法、备用服务器及系统 | |
CN102411637B (zh) | 分布式文件系统的元数据管理方法 | |
CN104679772B (zh) | 分布式数据仓库中删除文件的方法、装置、设备及系统 | |
CN101577735B (zh) | 一种接管故障元数据服务器的方法、装置及系统 | |
CN103780638B (zh) | 数据同步方法及系统 | |
CN103116661B (zh) | 一种数据库的数据处理方法 | |
CN100452046C (zh) | 一种海量文件的存储方法及系统 | |
US9201747B2 (en) | Real time database system | |
CN104391930A (zh) | 分布式文件存储装置和方法 | |
CN102541693A (zh) | 数据的多副本存储管理方法和系统 | |
US8930501B2 (en) | Distributed data storage system and method | |
CN102158540A (zh) | 分布式数据库实现系统及方法 | |
CN103294167B (zh) | 一种基于数据行为的低能耗集群存储复制装置和方法 | |
CN101808012A (zh) | 一种云环境下的数据备份方法 | |
CN102982182A (zh) | 一种数据存储规划方法及装置 | |
CN106919473A (zh) | 一种数据灾备系统及业务处理方法 | |
CN104424052A (zh) | 一种自动冗余的分布式存储系统及方法 | |
CN109639773A (zh) | 一种动态构建的分布式数据集群控制系统及其方法 | |
CN102937964A (zh) | 基于分布式系统的智能数据服务方法 | |
CN107135097A (zh) | 基于簿记建档的容灾系统及容灾方法 | |
CN114900532A (zh) | 电力数据容灾方法、系统、装置、计算机设备和存储介质 | |
CN109859068B (zh) | 一种基于资源池技术的电网数据实时同步系统 | |
CN110278222A (zh) | 分布式文件存储系统中数据管理的方法、系统以及相关设备 | |
CN105760398A (zh) | 一种日志记录系统及日志记录操作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120704 |