DE10253037B4 - Method for the functional maintenance of a data processing network after the occurrence of a hardware and / or software error - Google Patents
Method for the functional maintenance of a data processing network after the occurrence of a hardware and / or software error Download PDFInfo
- Publication number
- DE10253037B4 DE10253037B4 DE10253037A DE10253037A DE10253037B4 DE 10253037 B4 DE10253037 B4 DE 10253037B4 DE 10253037 A DE10253037 A DE 10253037A DE 10253037 A DE10253037 A DE 10253037A DE 10253037 B4 DE10253037 B4 DE 10253037B4
- Authority
- DE
- Germany
- Prior art keywords
- productive
- emergency server
- data processing
- processing network
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Hardware Redundancy (AREA)
Abstract
Verfahren zur funktionellen Aufrechterhaltung eines mehrere über ein Telekommunikationsnetz (12) miteinander verbundene Rechner (14 bis 20) – Produktivsysteme – aufweisendes Datenverarbeitungsnetzwerkes (10) nach Auftreten eines Hardware- und/oder Softwarefehlers, bei dem das Datenverarbeitungsnetzwerk (10) neben den Produktivsystemen (14 bis 20) mindestens einen weiteren Rechner (30) – Notfallserver – umfasst, der nach Aktivierung selbsttätig die Funktion eines ausgewählten Produktivsystems (14 bis 20) übernimmt, dadurch gekennzeichnet, dass in regelmäßigen Zeitabständen von jedem Produktivsystem (14 bis 20) im Datenverarbeitungsnetzwerk (10) dessen spezielle Verzeichnisstruktur einschließlich sämtlicher System- und Anwendungsdaten über das Telekommunikationsnetz (12) auf ein Speichermedium des Notfallservers (30) selbsttätig übertragen werden.method to functionally maintain a multiple over one Telecommunications network (12) interconnected computer (14 to 20) - productive systems - having Data processing network (10) after a hardware and / or software failure has occurred; in which the data processing network (10) in addition to the productive systems (14 to 20) comprises at least one further computer (30) - emergency server - the self-activation after activation the function of a selected one Productive system (14 to 20) takes over, characterized in that at regular intervals of every productive system (14 to 20) in the data processing network (10) its specific directory structure including all System and application data via the telecommunications network (12) on a storage medium of the emergency server (30) transmitted automatically become.
Description
Die Erfindung betrifft ein Verfahren zur funktionellen Aufrechterhaltung eines Datenverarbeitungsnetzwerkes nach Auftreten eines Hardware- und/oder Softwarefehlers gemäß der im Oberbegriff des Anspruches 1 angegebenen Art und eine Vorrichtung zur Durchführung des Verfahrens gemäß dem Anspruch 10.The The invention relates to a process for functional maintenance a data processing network after the occurrence of a hardware and / or Software error according to the im Preamble of claim 1 specified type and a device to carry out the method according to the claim 10th
Funktionierende Datenverarbeitungsnetzwerke sind für Unternehmen, beispielsweise aus dem Finanzwesen und der Telekommunikation, existenziell unabdingbar. Störungen des Betriebs des Datenverarbeitungsnetzwerkes werden in der Regel durch Hard- und/oder Softwarefehler verursacht. Um derart bedingte Ausfälle abzusichern, existieren bereits diverse hinreichend bekannte Verfahren, wie beispielsweise so genannte Standard Datensicherungen auf verschiedene Speichermedien oder so genannte Cluster- und Spiegelungsverfahren.functioning Data processing networks are for businesses, for example from finance and telecommunications, existentially indispensable. disorders the operation of the data processing network are usually through Hard and / or software error caused. To hedge such contingent losses, already exist various well-known methods, such as so-called standard data backups on various storage media or so-called clustering and mirroring methods.
Die oben genannten Verfahren weisen je nach Einsatzziel jedoch zwei wesentliche Nachteile auf. Diese sind bei der Standard Datensicherung im Wesentlichen die Wiederverfügbarkeitsdauer und bei dem Cluster- und Spiegelungsverfahren die Anwendungsabhängigkeit sowie das für kleinere und heterogene Netzumgebungen ungünstige Preis/Leistungsverhältnis.The however, the above methods have two, depending on the purpose significant disadvantages. These are in the standard data backup essentially the re-availability period and in the clustering and mirroring process the application dependency as well as for smaller ones and heterogeneous network environments unfavorable price / performance ratio.
Ein
gattungsgemäßes Verfahren
zur funktionellen Aufrechterhaltung eines Datenverarbeitungsnetzwerkes
nach Auftreten eines Hard- oder Softwarefehlers ist aus der
Der Erfindung liegt die Aufgabe zugrunde, unter Vermeidung der eingangs genannten Nachteile nicht nur bei Vorliegen eines Hard- und/oder Softwarefehlers in einem Datenverarbeitungsnetzwerkes einen Ausfall des Datenverarbeitungsnetzwerkes auszuschließen, sondern auch die Funktionalität des Datenverarbeitungssystems aufrecht zu erhalten.Of the Invention is based on the object, while avoiding the beginning mentioned disadvantages not only in the presence of a hard and / or Software error in a data processing network a failure of the data processing network, but also the functionality of the data processing system to maintain.
Diese Aufgabe wird für das Verfahren durch die kennzeichnenden Merkmale des Anspruches 1 in Verbindung mit seinen Oberbegriffsmerkmalen und für die Vorrichtung durch die Merkmale des Anspruches 10 gelöst.These Task is for the method by the characterizing features of the claim 1 in conjunction with its generic features and for the device solved by the features of claim 10.
Weitere Merkmale der Erfindung ergeben sich aus den Unteransprüchen.Further Features of the invention will become apparent from the dependent claims.
Der Erfindung liegt die Erkenntnis zugrunde, dass die Betriebssicherheit eines Datenverarbeitungsnetzwerkes u. a. mit der im Datenverarbeitungsnetz vorhandenen Rechnerkapazität gesteuert werden kann.Of the Invention is based on the finding that the reliability a data processing network u. a. with the in the data processing network existing computer capacity can be controlled.
Nach der Erfindung werden in regelmäßigen Zeitabständen von jedem Produktivsystem im Datenverarbeitungsnetzwerk dessen spezielle Verzeichnisstruktur einschließlich sämtlicher System- und Anwendungsdaten über das Telekommunikationsnetz auf ein Speichermedium des Notfallservers selbsttätig übertragen. Das Speichermedium kann hierbei auch mehrere Festplattenlaufwerke, Bandlaufwerke etc. umfassen. Hierdurch kann im Katastrophenfall und nach Inbetriebnahme des Notfallservers auf aktuelle Datenbestände zurückgegriffen werden.To The invention are at regular intervals of each production system in the data processing network whose special Directory structure including all System and application data via the telecommunications network to a storage medium of the emergency server transferred automatically. The storage medium can also be several hard disk drives, Tape drives, etc. include. This can be in case of disaster and after putting the emergency server into operation, the system relies on the latest data become.
Auf einfache Art und Weise ist es nunmehr möglich im so genannten Katastrophenfall, beispielsweise hervorgerufen durch einen Hard- und/oder Softwarefehler bei einem Produktivsystems des Datenverarbeitungsnetzwerkes, durch Aktivierung des Notfallservers den Ausfall des betroffen Produktivsystems zu kompensieren und somit die Funktionalität des Datenverarbeitungsnetzwerkes zu gewährleisten.On simple way, it is now possible in the so-called disaster, for example, caused by a hardware and / or software error in a productive system of the data processing network, by Activation of the emergency server the failure of the affected productive system to compensate and thus the functionality of the data processing network to ensure.
Als besonders Vorteilhaft erweist sich hierbei der Kosten/Nutzen-Faktor, da nur ein Notfallserver notwendig ist, um die Funktion einer Ausfallsicherung für mehrere Produktivsysteme zu übernehmen. Zwar kann im Katastrophenfall der Notfallserver nur die Funktion eines Produktivsystems übernehmen aber zum einem ist der gleichzeitige Ausfall mehrere Produktivsystems äußerst unwahrscheinlich und zum anderen kann dieser Umstand durch Vorsehen mehrere Notfallserver abgedeckt werden.When Particularly advantageous here proves the cost / benefit factor, Because only one emergency server is necessary to perform the function of a failover for multiple To take over productive systems. Although in case of disaster the emergency server can only function of a productive system but on the one hand the simultaneous failure of several productive systems is extremely unlikely and second, this circumstance can be achieved by providing multiple emergency servers be covered.
Vorzugsweise betragen die regelmäßigen Zeitabstände in denen ein Datentransfer von den Produktivsystemen zu dem Notfallserver durchgeführt wird zwei bis drei Stun den. Durch dieses relativ kurze Sicherungsintervall ist gewährleistet, dass im Katastrophenfall der in Kauf zu nehmende Datenverlust begrenzt ist.Preferably are the regular intervals in those a data transfer from the productive systems to the emergency server carried out will be two to three hours. Through this relatively short backup interval is guaranteed that, in the event of a disaster, the data loss to be accepted is limited is.
Für jedes Produktivsystem des Datenverarbeitungsnetzwerks ist auf dem Speichermedium des Notfallservers ein separates Unterverzeichnis vorhanden, in das die speziellen Verzeichnisstrukturen einschließlich sämtlicher System- und Anwendungsdaten der jeweiligen Produktivsysteme übertragen werden. Einzige Voraussetzung hierfür ist, dass auf dem Speichermedium ausreichend Speichervolumen vorhanden ist.For each Production system of the data processing network is on the storage medium the emergency server has a separate subdirectory, in that the special directory structures including all System and application data of the respective production systems are transmitted. Only requirement for this is that on the storage medium sufficient storage volume available is.
Da die Hardware der Produktivsysteme, wie beispielsweise Grafikkarten, Netzwerkkarte etc., in der Regel nicht der Hardware des Notfallservers entspricht werden nach Übertragung der speziellen Verzeichnisstrukturen der Produktivsysteme über das Telekommunikationsnetz in die jeweiligen Unterverzeichnisse auf dem Speichermedium des Notfallservers die Systemdaten, insbesondere die Konfigurationsdateien, der Produktivsysteme selbsttätig an die Hardwarekonfiguration des Notfallserver angepasst.Since the hardware of the productive systems, such as graphics cards, network cards, etc., usually does not correspond to the hardware of the emergency server after transmission of the special directory structures of the productive systems over the Telecommunications network in the respective subdirectories on the storage medium of the emergency server, the system data, in particular the configuration files, the production systems automatically adapted to the hardware configuration of the emergency server.
Im Katastrophenfall und anschließender Aktivierung des Notfallservers wird dessen ursprüngliche Verzeichnisstruktur einschließlich sämtlicher System- und Anwendungsdaten durch die spezielle Verzeichnisstruktur einschließlich sämtlicher System- und Anwendungsdaten des ausgewählten Produktivsystems ersetzt und der Notfallserver startet anschließend selbsttätig als das ausgewählte Produktivsystem. Aufgrund der angepassten Konfigurationsdateien des ausgewählten Produktivsystems ist der Start des Notfallservers problemlos durchführbar.in the Disaster case and subsequent Activation of the emergency server becomes its original directory structure including all system and application data through the special directory structure including all System and application data of the selected production system replaced and the emergency server then starts automatically as the selected one Production system. Due to custom configuration files of the selected Productive system, the start of the emergency server is easily feasible.
Vorzugsweise wird die Verzeichnisstruktur einschließlich sämtlicher System- und Anwendungsdaten des Notfallservers in einem weiteren Unterverzeichnis gespeichert.Preferably becomes the directory structure including all system and application data of the emergency server stored in another subdirectory.
Die Funktionsübernahme durch den Notfallserver ist ausschließlich von der Systemstartzeit des ausgewählten Produktivsystems bestimmt und erfolgt nach 5 bis 30 Minuten. Nach Start des Notfallservers und Funktionsübernahme des ausgewählten Produktivsystems ist die Betriebssicherheit des Datenverarbeitungsnetzwerkes nunmehr gewährleistet. Während der Notfallserver die Funktion des ausgewählten Produktivsystems übernimmt, kann das durch einen Software- und/oder Hardwarefehler beschädigte Produktivsystem einer Reparatur unterzogen werden.The Failover through the emergency server is exclusive of the system startup time of the selected Productive system determines and takes place after 5 to 30 minutes. To Start of the emergency server and failover of the selected productive system is the reliability of the data processing network now guaranteed. During the Emergency server assumes the function of the selected productive system, may be the productive system damaged by a software and / or hardware failure to undergo a repair.
Um nach erfolgter Reparatur des betroffenen Produktivsystems eine einfache Daten-Wiederherstellung des Produktivsystems zu gewährleisten, erfolgt eine Datenrückübertragung vom Notfallserver über das Telekommunikationsnetz zu dem ausgewählten Produktivsystem. Das instandgesetzte Produktivsystem kann nun seine reguläre Tätigkeit wieder aufnehmen.Around After the repair of the affected productive system a simple To ensure data recovery of the productive system a data retransmission takes place from the emergency server via the telecommunications network to the selected productive system. The repaired productive system can now its regular activity resume.
Nach Abschluss der Funktionsübernahme durch den Notfallserver und Wiederinbetriebnahme des ausgewählten Produktivsystems wird die ursprüngliche Verzeichnisstruktur des Notfallservers durch Kopieren der entsprechenden System- und Anwendungsdaten aus dem weiteren Unterverzeichnis selbsttätig wieder hergestellt. Der Notfallserver steht nunmehr als Ausfallsicherung im Datenverarbeitungsnetzwerk wieder zur Verfügung, um bei Ausfall eines Produktivsystems die Betriebssicherheit des Datenverarbeitungsnetzwerkes zu gewährleisten.To Completion of the failover by the emergency server and restarting the selected productive system becomes the original one Directory structure of the emergency server by copying the corresponding System and application data from the other subdirectory automatically again produced. The emergency server is now available as a failover available again in the data processing network, in case of failure of a Productive system the operational security of the data processing network to ensure.
Weitere Vorteile und Anwendungsmöglichkeiten der vorliegenden Erfindung ergeben sich aus der nachfolgenden Beschreibung in Verbindung mit dem in der Zeichnung dargestellten Ausführungsbeispiel.Further Advantages and applications The present invention will become apparent from the following description in connection with the embodiment shown in the drawing.
Die Erfindung ist im Folgenden mehr oder minder schematisch anhand eines in der Zeichnung dargestellten Ausführungsbeispiels beschrieben.The Invention is hereinafter more or less schematically with reference to a described in the drawing embodiment.
Im Einzelnen zeigen:in the Show individual:
In
Das
Datenverarbeitungsnetzwerk
Neben
den Produktivsystemen
Zur
Gewährleistung
der Betriebssicherheit des Datenverarbeitungsnetzwerkes
Ein
hier aus Gründen
der Übersichtlichkeit nicht
weiter dargestelltes Speichermedium des Notfallservers
Im
Normalfall fungiert der Notfallserver
Nach Übertragung
der speziellen Verzeichnisstrukturen der einzelnen Produktivsysteme
Der
Notfall-Betrieb des Datenverarbeitungsnetzwerkes
Nach
Feststellung eines solchen auch als Katastrophenfall bezeichneten
Serverausfalls ist die Betriebsicherheit des Datenverarbeitungsnetzwerkes
Nach
Aktivierung des Notfallservers
Die
ursprüngliche
Verzeichnisstruktur des Notfallservers
Die
Startzeit des Notfallservers
Nach
Durchführung
der erforderlichen Reparatur am Datenbank-Server
Hierzu
erfolgt zunächst
eine entsprechende Datenrückübertragung
der zwischenzeitlich auf dem als Datenbank-Server betriebenen Notfallserver
Durch
Deaktivierung des Notfallservers
- 1010
- DatenverarbeitungsnetzwerkData processing network
- 1212
- Telekommunikationsnetztelecommunications network
- 1414
- Produktivsystem, Applikations-ServerProduction system, Application server
- 1616
- Produktivsystem, Datenbank-ServerProduction system, Database server
- 1818
- Produktivsystem, File-ServerProduction system, File server
- 2020
- Produktivsystem, Server zur Steuerung unternehmensspezifischer PeripheriegeräteProduction system, Server for controlling company-specific peripheral devices
- 2222
- erste Arbeitsstationfirst workstation
- 2424
- zweite Arbeitsstationsecond workstation
- 2626
- erstes unternehmensspezifische Peripheriegerätfirst company-specific peripheral device
- 2828
- zweites unternehmensspezifische Peripheriegerätsecond company-specific peripheral device
- 3030
- Notfallserveremergency server
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10253037A DE10253037B4 (en) | 2002-11-14 | 2002-11-14 | Method for the functional maintenance of a data processing network after the occurrence of a hardware and / or software error |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10253037A DE10253037B4 (en) | 2002-11-14 | 2002-11-14 | Method for the functional maintenance of a data processing network after the occurrence of a hardware and / or software error |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10253037A1 DE10253037A1 (en) | 2004-05-27 |
DE10253037B4 true DE10253037B4 (en) | 2007-07-12 |
Family
ID=32185642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10253037A Expired - Fee Related DE10253037B4 (en) | 2002-11-14 | 2002-11-14 | Method for the functional maintenance of a data processing network after the occurrence of a hardware and / or software error |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE10253037B4 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987621A (en) * | 1997-04-25 | 1999-11-16 | Emc Corporation | Hardware and software failover services for a file server |
US6185695B1 (en) * | 1998-04-09 | 2001-02-06 | Sun Microsystems, Inc. | Method and apparatus for transparent server failover for highly available objects |
US6247141B1 (en) * | 1998-09-24 | 2001-06-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Protocol for providing replicated servers in a client-server system |
-
2002
- 2002-11-14 DE DE10253037A patent/DE10253037B4/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987621A (en) * | 1997-04-25 | 1999-11-16 | Emc Corporation | Hardware and software failover services for a file server |
US6185695B1 (en) * | 1998-04-09 | 2001-02-06 | Sun Microsystems, Inc. | Method and apparatus for transparent server failover for highly available objects |
US6247141B1 (en) * | 1998-09-24 | 2001-06-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Protocol for providing replicated servers in a client-server system |
Also Published As
Publication number | Publication date |
---|---|
DE10253037A1 (en) | 2004-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69231873T2 (en) | Method for synchronizing reserved areas in a redundant memory arrangement | |
DE69428400T2 (en) | Configuration management procedures | |
DE69712689T2 (en) | Prüfpunktrechnersystem | |
DE60112462T2 (en) | RESTORING FILE SYSTEM DATA IN FILE SERVER WITH MIRRORED FILE SYSTEM VOLUMES | |
DE112011100112B4 (en) | BUFFER MEMORY PLATE IN FLASH COPY CASCADE | |
DE69502125T2 (en) | Synchronous remote data duplication | |
DE60212125T2 (en) | COPY PROCEDURES WITH VERIFICATION IN DATA NETWORKS | |
DE69629444T2 (en) | Data processing device and method for replacing failed storage units | |
DE112011100534B4 (en) | Multi-stage backup process | |
DE69119222T2 (en) | Data backup and elimination in a data processing system | |
DE69703181T2 (en) | Registration file optimization in a client / server computer system | |
DE10112941B4 (en) | System and method for parallel reading of primary and secondary backups to restore multiple shared database files | |
DE69522255T2 (en) | Computer system with high availability | |
DE60201139T2 (en) | Method for storing information data and matching storage device | |
DE69533854T2 (en) | Device and method for fault-tolerant key management | |
DE69907709T2 (en) | PROCESS MONITORING IN A COMPUTER SYSTEM | |
DE112016001295T5 (en) | Resynchronizing to a first storage system by mirroring the first storage system after a failover to a second storage system | |
DE19964236C2 (en) | Product for fast data backup and data transfer | |
DE602005003490T2 (en) | Distributed system with quorum redundancy and method for it | |
DE69508288T2 (en) | REDUCTION OF LOGGING PROCESSES IN DISTRIBUTED SYSTEMS | |
WO1994019739A1 (en) | Device for automatically generating a knowledgebase for an expert diagnostic system | |
DE112010004530T5 (en) | Transaction Update on Dynamic Distributed Workloads | |
DE69927223T2 (en) | Resilience of a multi-computer system | |
DE602004003327T2 (en) | Computer system and method of restarting by means of remote copying | |
WO2002065289A1 (en) | Automatic startup of a cluster system after occurrence of a recoverable error |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |