CN100413261C - 数据恢复的方法和系统 - Google Patents
数据恢复的方法和系统 Download PDFInfo
- Publication number
- CN100413261C CN100413261C CNB2006100326270A CN200610032627A CN100413261C CN 100413261 C CN100413261 C CN 100413261C CN B2006100326270 A CNB2006100326270 A CN B2006100326270A CN 200610032627 A CN200610032627 A CN 200610032627A CN 100413261 C CN100413261 C CN 100413261C
- Authority
- CN
- China
- Prior art keywords
- application module
- module
- message
- detect
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000001514 detection method Methods 0.000 claims abstract description 31
- 230000004044 response Effects 0.000 claims abstract description 27
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 230000005144 thermotropism Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 9
- 238000011084 recovery Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明提供了一种数据恢复的方法,该方法应用于包含有热备份模块及至少一个应用模块的系统中,包括步骤:热备份模块发送第一检测消息到所述每一应用模块;每个应用模块接收所述第一检测消息,并根据所述第一检测消息使该应用模块内部的信息一致,然后发送第一响应消息到所述热备份模块;所述热备份模块接收所述第一响应信息后,发送第二检测消息;所述每个应用模块接收所述第二检测消息,并根据所述的第二检测消息使各应用模块间的信息一致;同时本发明还提供一种数据恢复的系统。使用本发明的方法和系统,保证每一应用模块的模块内和模块间的数据一致,提高通信系统的可靠性,保证通信业务的正常运行。
Description
技术领域
本发明涉及数据通信领域中的恢复技术,具体地说,涉及一种数据恢复的方法和系统。
背景技术
主用板是路由器的控制中心,CPU和存储器就在主用板中。主用板负责整个路由器的管理和控制,IP路由协议在主用板上运行。主用板直接接收来自网管中心的指令,并下发到各接口板执行指令,同时各接口板把运行状态和统计数据传送到主用板,由主用板进行必要的处理,需要时发给网管中心。网络管理员配置的静态路由以及通过运行路由协议生成的动态路由主用板进行管理,并下发到各接口板,使各接口板可以独立地进行数据包的转发工作。
主用板的作用举足轻重,一旦它发生故障,整个路由器将不能正常工作。对于电信网的核心网络设备来说,无论系统任何一个部分出现故障时总能在客户需要时及时提供服务,其要求可用率达到99.999%,即1年的停机时间不能超过5min,增加系统的可用性就表现出尤为重要。
冗余是增加系统可用性的一个关键技术。路由器通过配备两个路由处理器板来提供高可用性,其中一个为主路由处理器,叫做主用板,处于活动状态;另一个的备份路由处理器,叫备用板,处于被动状态。
在备用板被插入或主用板上数据更新时,在主用板中运行的模块(软件程序,路由协议等)将数据备份到备用板上,保证主用板上的数据与被控板上的数据保持一致。在正常的工作过程中,主备板周期性地交换握手信号,如果主用板由于硬件或软件错误发生故障,备用板收不到主用板的握手信号,则会启动倒换流程,备用板接替主用板工作,成为主用板,而原先的主用板成为备用板,保证路由器的正常运行。
主备板组成如图1所示:
主用板中的应用模块1、应用模块2、应用模块3:提供需要备份到备用板应用模块的数据;
备用板中的应用模块1、应用模块2、应用模块3:接收主用板中的备份数据并将其存储到备用板的相应应用中模块中;
热备份模块:协调主用板到备用板数据备份的模块,并在主用板故障时将备用板切换到主动状态。
主备板在备份过程中发生故障,新主用板中的备份数据不完整,进而导致备用板中的数据不一致,即:应用模块内部备份的运行的数据和正常运行时需要使用的数据不一致;
如果新主用板在当前状态下运行,从而导致有些应用模块中的内部数据不一致;
同时具有依赖关系的应用模块,由于被依赖模块的数据不一致,导致应用模块间关联的数据不一致。
例如在备用板上接口管理模块和路由模块(应用模块)正常运行时,接口管理模块获取路由模块的相关信息,当主用板出现问题时,主备板切换的时候,备用板的路由模块获取备份的数据出现问题的时候,路由模块上的数据和正常运行需要的数据不一致,从而接口管理模块上获取的数据不正确,即和正常所需的数据不一致。
从而导致整个系统不能恢复正常运行。
发明内容
本发明的目的在于提供一种数据恢复的方法和系统,避免在主用板出现故障的时候,备用板切换为新的主用板时,保证备用板的每一个应用模块内部和应用模块间数据的一致,提高通信系统的可靠性。
一种数据恢复的方法,该方法应用于包含有热备份模块及至少一个应用模块的系统中,包括步骤:
热备份模块发送第一检测消息到所述每一应用模块;
每个应用模块接收所述第一检测消息,并根据所述第一检测消息使该应用模块内部的信息一致,然后发送第一响应消息到所述热备份模块;
所述热备份模块接收所述第一响应信息后,发送第二检测消息;
所述每个应用模块接收所述第二检测消息,并根据所述的第二检测消息使各应用模块间的信息一致。
所述热备份模块发送第一检测消息具体为:
所述热备份模块获取所述应用模块的优先级,并按照应用模块优先级由高到低的顺序向所述每个应用模块下发第一检测消息。
根据所述第一检测消息使该应用模块内部的信息一致具体为:执行内部信息一致性检测为对应用模块内部具有依赖关系的数据进行一致性检测,并修改不一致的信息。
所述修改不一致的信息具体为:把具有依赖关系的不一致数据恢复为默认的安全值或初始化为零。
所述发送第二检测消息具体为:
所述热备份模块按照所述应用模块的优先级依次下发第二检测消息到所述每个应用模块。
所述根据所述的第二检测消息使各应用模块间的信息一致具体为:对应用模块之间的具有依赖关系的数据进行检测,并修改所述应用模块间不一致的信息。
所述修改所述应用模块间不一致的信息具体为:
在该应用模块的被依赖应用模块完成内部一致性修改后,执行依赖的应用模块和被依赖的应用模块之间的数据同步操作。
所述根据所述的第二检测消息使各应用模块间的信息一致之后还包括:
所述应用模块发送第二响应信息到所述热备份模块。
一种数据恢复的系统,包括:一热备份模块、与所述热备份模块相连的至少一个应用模块,
所述热备份模块进一步包括有消息收发单元:用于发送第一、第二检测消息至所述每个应用模块,并接收所述每个应用模块的响应信息;
所述每个应用模块:接收所述第一、第二检测消息;执行内部信息一致性检测,并使每个应用模块内部信息一致,发送第一响应信息到所述热备份模块;执行应用模块间一致性检测,并使所述每个应用模块间的信息一致。
所述每个应用模块包括:
模块内部检测单元:接收所述第一检测消息,对应用模块内部具有依赖关系的数据进行一致性检测,把具有依赖关系的数据恢复为默认的安全值或初始化为零;
模块间检测单元:接收所述第二检测消息,对应用模块间具有依赖关系的数据进行一致性检测,使应用模块间的数据一致。
所述每个应用模块还包括:
注册单元:向热备份模块注册所述每个应用模块的优先级。
所述消息收发单元包括:
消息顺序发送单元:获取所述每个应用模块的优先级,按照优先级由高到低的顺序向所述每个应用模块发送第一或第二检测消息。
所述应用模块还包括:
响应单元:发送第一、第二响应消息到热备份模块间检测模块。
本发明中,保证每一应用模块的模块内和模块间的数据一致,提高通信系统的可靠性,保证通信业务的正常运行。
附图说明
图1为现有技术中主备板的组成。
图2为本发明实施例的方法流程图。
图3为本发明实施例的系统的结构图。
图4为本发明实施例中应用模块结构图。
图5为本发明实施例中热备份模块结构图。
图6为本发明实施例中具体的一次实施过程。
具体实施方式
本发明提供一种数据恢复的方法和系统,在硬件上设置主用板和备用板,主备板上都包括:多个应用模块和一热备份模块,本发明的核心思想为:在主备板切换时,备用板升为主用板,新的主用板热备份模块发送检测消息,通知每一应用模块进行应用模块内部和应用模块间的数据一致性检测,修改每一应用模块内部和模块间不一致的信息。
下面结合附图详细说明本发明,本发明中的方法的具体步骤如图2所示,包括步骤:
步骤201:热备份模块发送第一检测消息。
每一应用模块向所述热备份模块注册其优先级,并按照每一应用模块优先级由高到低的顺序向所述应用模块下发第一检测消息。
每一应用模块的优先级为根据应用模块的数据依赖性预先设定的,例如在数据传输操作中,应用模块1的数据从应用模块2中得到的,应用模块1的优先级低于应用模块2的优先级。
步骤202:每一应用模块检测模块内部信息一致性,修改每一应用模块内部不一致信息。
内部数据不一致性为在数据备份时,应用模块内部处理单元具有依赖关系由于故障,导致内部数据不一致;例如应用模块的内部中第一数据处理单元需要使用第二数据处理单元处理完输出的数据,从而形成第一数据处理单元依赖与第二数据处理单元;当第二数据处理单元出现故障时,导致第一数据处理单元运行不正常,从而导致应用模块内部数据不一致。
每一应用模块接收第一检测消息,按照应用模块接收到第一检测消息的顺序,依次对应用模块内部具有依赖关系的数据进行一致性检测,并把模块内部具有依赖关系的不一致数据恢复为默认的安全值或初始化为零。
默认安全值为发生故障前一次的实现完整热备份所存储的安全数值。
步骤203、每一应用模块发送响应信息到热备份模块。
每一应用模块发送响应信息通知热备份模块完成模块内部不一致的数据修改。
步骤204、热备份模块发送第二检测信息。
热备份模块按照应用模块注册的优先级依次下发第二检测消息到所述每一应用模块。
步骤205、每一应用模块检测模块间信息,修改应用模块间不一致信息。
具有数据依赖关系的应用模块,第一应用模块必须等待所依赖的第二应用模块完成内部一致性修改后,执行第一应用模块和第二应用模块之间的数据同步操作,达到第一应用模块与第二应用模块数据的一致性。
在执行了以上的步骤之后还包括:
所述应用模块发送响应信息到热备份模块,通知热备份模块完成对模块之间数据一致恢复。
一种数据恢复的系统,如图3所示,包括:一热备份模块、与所述热备份模块相连的至少一个应用模块:
所述热备份模块进一步包括有消息收发单元:用于发送第一、第二检测消息至所述每个应用模块,并接收所述每个应用模块的响应信息;
所述每个应用模块:接收所述第一、第二检测消息;执行内部信息一致性检测,并使每个应用模块内部信息一致,发送第一响应信息到所述热备份模块;执行应用模块间一致性检测,并使所述每个应用模块间的信息一致。
所述应用模块如图4所示,包括:
模块内部检测单元:接收第一检测消息,对应用模块内部具有依赖关系的数据进行一致性检测,把具有依赖关系的数据恢复为默认的安全值或初始化为零;
模块间检测单元:接收第二检测消息,对应用模块间具有依赖关系的数据进行一致性检测,使应用模块之间的数据一致;
注册单元:向热备份模块注册每个应用模块的优先级。响应单元:发送第一、第二响应消息到热备份模块。
所述热备份模块如图5所示,包括:
消息顺序发送单元:获取每个应用模块的优先级,按照优先级由高到低的顺序向所述每个应用模块发送第一或第二检测消息。
响应信息接收单元:接收应用模块发送过来的第一、第二响应信息。
一种数据恢复的方法,具体实施过程中包括的模块如图6所示:三个应用模块:应用模块1、应用模块2、应用模块3;一个热备份模块。
应用模块3传输数据到应用模2,而应用模块2传输数据到应用模块1,应用模块1依赖于应用模块2,应用模块2依赖于应用模块3,因此应用模块3的优先级最高,应用模块2的优先级次之,应用模块3的优先级最低。
具体步骤如下所示:
步骤701、热备份模块向三个应用模块发送模块内检测消息。
热备份模块获取三个应用模块的优先级,首先向应用模块3发送模块内检测消息,然后向应用模块2发送模块检测消息,最后向应用模块1发送模块内检测消息。
702、应用模块1,应用模块2和应用模块3检测模块内信息,修改不一致信息。
应用模块1,应用模块2,应用模块3按照收到模块内检测信息顺序,依次检测模块内一致性,如果应用模块内部信息不一致,就把应用模块的内部数据初始化为零或恢复为设定的安全值。
步骤703、应用模块1、应用模块2和应用模块3分别发送响应信息到应用模块。
步骤704、热备份模块在接收到应用模块1,应用模块2和应用模块3响应信息后,按照优先级向依次应用模块3,应用模块2,应用模块2发送模块间检测消息。
步骤705、应用模块根据其依赖关系,执行应用模块间的一致性检测,修改模块间不一致性信息。
应用模块3接收到模块间检测消息,检测到应用模块3没有依赖关系,完成对模块3的模块间检测。
应用模块2接收到模块间检测消息,检测到应用模块2的数据依赖应用模块3的数据,应用模块2根据应用模块3的数据执行数据同步,实现应用模块2的数据一致性。
应用模块1接收到模块间检测消息,检测到应用模块1的数据依赖应用模块2的数据,应用模块1根据应用模块2的数据执行数据同步,实现应用模块1的数据一致性。
由以上的步骤完成了三个应用模块的模块间和模块内的数据的一致过程。
本发明的效果是:在主用板发生死机或复位等情况时,备用板升为新的主用板,此时保证备用板的每一应用模块的模块内和模块间的数据一致,保证了通信系统中的数据一致,并保证通信业务正常运行,提高通信系统的可靠性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (13)
1. 一种数据恢复的方法,该方法应用于包含有热备份模块及至少一个应用模块的系统中,其特征在于,包括步骤:
热备份模块发送第一检测消息到所述每一应用模块;
每个应用模块接收所述第一检测消息,并根据所述第一检测消息使该应用模块内部的信息一致,然后发送第一响应消息到所述热备份模块;
所述热备份模块接收所述第一响应信息后,发送第二检测消息;
所述每个应用模块接收所述第二检测消息,并根据所述的第二检测消息使各应用模块间的信息一致。
2. 根据权利要求1所述的方法,其特征在于,所述热备份模块发送第一检测消息具体为:
所述热备份模块获取所述应用模块的优先级,并按照应用模块优先级由高到低的顺序向所述每个应用模块下发第一检测消息。
3. 根据权利要求1所述的方法,其特征在于,根据所述第一检测消息使该应用模块内部的信息一致具体为:执行内部信息一致性检测为对应用模块内部具有依赖关系的数据进行一致性检测,并修改不一致的信息。
4. 根据权利要求3所述的方法,其特征在于,所述修改不一致的信息具体为:把具有依赖关系的不一致数据恢复为默认的安全值或初始化为零。
5. 根据权利要求1所述的方法,其特征在于,所述发送第二检测消息具体为:
所述热备份模块按照所述应用模块的优先级依次下发第二检测消息到所述每个应用模块。
6. 根据权利要求1所述的方法,其特征在于,所述根据所述的第二检测消息使各应用模块间的信息一致具体为:对应用模块之间的具有依赖关系的数据进行检测,并修改所述应用模块间不一致的信息。
7. 根据权利要求6所述的方法,其特征在于,所述修改所述应用模块间不一致的信息具体为:
在该应用模块所依赖的应用模块完成内部一致性修改后,执行该应用模块和其所依赖的应用模块之间的数据同步操作。
8. 根据权利要求1所述的方法,其特征在于,所述根据所述的第二检测消息使各应用模块间的信息一致之后还包括:
所述应用模块发送第二响应信息到所述热备份模块。
9. 一种数据恢复的系统,包括:一热备份模块、与所述热备份模块相连的至少一个应用模块,其特征在于,
所述热备份模块进一步包括有消息收发单元:用于发送第一、第二检测消息至所述的每个应用模块,并接收所述每个应用模块的响应信息;
所述每个应用模块:接收所述第一、第二检测消息;执行内部信息一致性检测,并使每个应用模块内部信息一致,发送第一响应信息到所述热备份模块;执行应用模块间一致性检测,并使所述每个应用模块间的信息一致。
10. 根据权利要求9所述的系统,其特征在于,所述每个应用模块包括:
模块内部检测单元:接收所述第一检测消息,对应用模块内部具有依赖关系的数据进行一致性检测,把具有依赖关系的数据恢复为默认的安全值或初始化为零;
模块间检测单元:接收所述第二检测消息,对应用模块间具有依赖关系的数据进行一致性检测,使应用模块间的数据一致。
11. 根据权利要求9所述的系统,其特征在于,所述应用模块还包括:
注册单元:向热备份模块注册所述应用模块的优先级。
12. 根据权利要求11所述的系统,其特征在于,所述消息收发单元包括:
消息顺序发送单元:获取所述每个应用模块的优先级,按照优先级由高到低的顺序向所述每个应用模块发送第一或第二检测消息。
13. 根据权利要求9所述的系统,其特征在于,所述应用模块还包括:
响应单元:发送第一、第二响应消息到热备份模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100326270A CN100413261C (zh) | 2006-01-04 | 2006-01-04 | 数据恢复的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100326270A CN100413261C (zh) | 2006-01-04 | 2006-01-04 | 数据恢复的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1870533A CN1870533A (zh) | 2006-11-29 |
CN100413261C true CN100413261C (zh) | 2008-08-20 |
Family
ID=37444090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006100326270A Expired - Fee Related CN100413261C (zh) | 2006-01-04 | 2006-01-04 | 数据恢复的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100413261C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101123506B (zh) * | 2007-09-24 | 2011-07-20 | 北京飞天诚信科技有限公司 | 敏感信息监控及自动恢复的系统和方法 |
CN101404594B (zh) * | 2008-07-10 | 2010-12-15 | 北京星网锐捷网络技术有限公司 | 热备份性能的测试方法与装置、通信设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1213651A2 (en) * | 2000-11-12 | 2002-06-12 | Lightscape Networks Ltd. | Data mirroring restoration in a distributed system |
US20030028554A1 (en) * | 2001-06-15 | 2003-02-06 | Oskari Koskimies | Selecting data for synchronization |
CN1571369A (zh) * | 2003-07-16 | 2005-01-26 | 华为技术有限公司 | 保证监听网络侧和监听触发侧被控用户一致性的方法 |
CN1642030A (zh) * | 2004-01-05 | 2005-07-20 | 华为技术有限公司 | 一种网管双机容灾备份的实现方法 |
-
2006
- 2006-01-04 CN CNB2006100326270A patent/CN100413261C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1213651A2 (en) * | 2000-11-12 | 2002-06-12 | Lightscape Networks Ltd. | Data mirroring restoration in a distributed system |
US20030028554A1 (en) * | 2001-06-15 | 2003-02-06 | Oskari Koskimies | Selecting data for synchronization |
CN1571369A (zh) * | 2003-07-16 | 2005-01-26 | 华为技术有限公司 | 保证监听网络侧和监听触发侧被控用户一致性的方法 |
CN1642030A (zh) * | 2004-01-05 | 2005-07-20 | 华为技术有限公司 | 一种网管双机容灾备份的实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1870533A (zh) | 2006-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN201075870Y (zh) | 多机架路由器 | |
CN102098201B (zh) | 一种实现l2tp用户接入备份的方法及网络系统 | |
EP1110148A1 (en) | Fault tolerant computer system | |
CN101483540A (zh) | 一种高端数据通信设备中的主备倒换方法 | |
CN100438362C (zh) | 一种实现软件上主备双机热备份的方法 | |
WO2014067324A1 (zh) | 一种补丁软件升级方法及系统 | |
CN101247568A (zh) | 数据容灾系统和方法及中间设备 | |
WO2014067335A1 (zh) | 一种分布式通信设备软件升级方法及系统 | |
WO2014067330A1 (zh) | 一种分布式通信设备软件升级方法及系统 | |
WO2016095344A1 (zh) | 链路切换方法、装置及线卡 | |
CN105577444A (zh) | 一种无线控制器管理方法及无线控制器 | |
CN102045187B (zh) | 一种利用检查点实现高可用性系统的方法和设备 | |
CN100461646C (zh) | 通信设备中主备板倒换的方法 | |
CN100413261C (zh) | 数据恢复的方法和系统 | |
CN102307113B (zh) | 一种系统升级方法、系统及装置 | |
WO2019216210A1 (ja) | サービス継続システムおよびサービス継続方法 | |
CN111083074A (zh) | 主备双ospf状态机的高可用性方法和系统 | |
JP5767309B2 (ja) | 緊急時用切り替え方法及びそのシステム | |
CN112491633B (zh) | 一种多节点集群的故障恢复方法、系统及相关组件 | |
CN105391565A (zh) | 备份业务配置实现同步的方法 | |
JP2006333077A (ja) | 回線冗長化方法およびこれに用いる中継装置 | |
JP2009246475A (ja) | 冗長構成を有する通信システム及び該システムによる系切り替え方法 | |
JP3541337B2 (ja) | ネットワーク管理システム及びネットワーク構成情報管理方法 | |
CN101895980B (zh) | 任务同步的方法和设备 | |
JPH09288589A (ja) | システム・バックアップ方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080820 Termination date: 20180104 |
|
CF01 | Termination of patent right due to non-payment of annual fee |