[go: up one dir, main page]

KR100938676B1 - 운영시스템의 장애 등급 판단방법 - Google Patents

운영시스템의 장애 등급 판단방법 Download PDF

Info

Publication number
KR100938676B1
KR100938676B1 KR1020080073644A KR20080073644A KR100938676B1 KR 100938676 B1 KR100938676 B1 KR 100938676B1 KR 1020080073644 A KR1020080073644 A KR 1020080073644A KR 20080073644 A KR20080073644 A KR 20080073644A KR 100938676 B1 KR100938676 B1 KR 100938676B1
Authority
KR
South Korea
Prior art keywords
event
failure
type
importance
level
Prior art date
Application number
KR1020080073644A
Other languages
English (en)
Inventor
임태환
Original Assignee
임태환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 임태환 filed Critical 임태환
Priority to KR1020080073644A priority Critical patent/KR100938676B1/ko
Application granted granted Critical
Publication of KR100938676B1 publication Critical patent/KR100938676B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

IT시스템 관리분야 또는 산업분야에 걸쳐 운영을 담당하는 운영 시스템(업무처리기기, 소프트웨어, 시스템, 업무처리 프로세스, 기타 등등)의 장애 발생시 장애 등급(중요도)을 정확하게 판단하기 위한 운영시스템의 장애 등급 판단방법이 개시된다.
개시된 운영시스템의 장애 등급 판단 방법은, 운영시스템과의 연결 설정을 수행한 후, 상기 운영시스템에서 발생한 이벤트 정보를 수신하여 장애 이벤트 여부를 확인하는 제1단계와; 상기 확인결과 장애 이벤트일 경우, 장애 이벤트 구성 요소를 세분화하는 제2단계와; 상기 구성 요소에 적합한 분야별 환경 변수를 설정하고, 상기 장애 이벤트의 유형을 정의하는 제3단계; 및 상기 정의한 유형에 상기 환경 변수를 적용하여 최종 장애 등급을 판단하는 제4단계를 포함한다.
Figure R1020080073644
운영시스템, 장애등급 판단시스템, 이벤트 유형, 환경 변수, 세분화

Description

운영시스템의 장애 등급 판단방법{Event Priority Level Setting Method}
본 발명은 IT(정보기술) 시스템 관리분야 또는 산업분야에 걸쳐 운영을 담당하는 운영 시스템(업무처리기기, 소프트웨어, 시스템, 업무처리 프로세스, 기타 등등)의 장애 발생시 장애 등급(중요도)을 정확하게 판단하기 위한 운영시스템의 장애 등급 판단방법에 관한 것이다.
일반적으로, IT 시스템 관리 분야는 소정의 운영체제를 구비한 컴퓨터 시스템과 같은 운영 시스템을 이용하여 운영을 하는 것이 대부분이며, 이러한 운영 시스템은 내부의 소프트웨어 장애라든지 업무처리 프로세스의 장애, 또는 하드웨어의 장애가 발생한 경우 전체 시스템의 운영에 막대한 지장을 초래하게 되므로, 장애를 조속히 검출하고 해당 장애등급을 정확하게 판단하는 것이 매우 중요하다.
또한, 제품을 대량 생산하는 산업 분야, 특히 공장 등의 생산 설비 시설은 그 정상 가동 상태를 지속함으로써 제품의 양산이 가능하고, 생산되는 제품의 품질을 일정하게 지속적으로 유지하는 것이 매우 중요하다. 따라서 이러한 산업 분야에서도 지속적인 제품 양산과 품질 유지를 위해 각 장비의 장애 여부를 신속하게 판단하는 것, 또는 소프트웨어나 운영체제 등의 장애 여부를 신속하게 판단하는 것이 중요하다.
아울러 장애 이벤트가 발생할 시 장애 이벤트에 대한 정확한 장애등급(중요도)의 판단은 장애처리를 위해 매우 중요한 요소이다. 예컨대, 장애 등급에 따라서 경보등급, 처리 우선순위, 예상 피해상황 도출작업 등의 후속 조치가 결정되므로, 장애 발생시 장애 등급(중요도)을 정확하게 판단하는 것이 매우 중요하다.
이러한 IT 시스템 관리 분야나 모든 산업 분야에서 운영 기기의 오작동이나 이상상황으로 장애 이벤트가 발생한 경우 장애 등급을 판단하기 위한 종래의 운영시스템 장애 등급 판단방법은, 운영시스템으로부터 장애 이벤트(Event)를 수신함으로써 장애 발생 여부를 판단하고, 장애 이벤트가 발생한 경우 장애 이벤트 종류(Event_id)별로 미리 지정된 중요도(장애 등급)를 부여하는 방법을 사용한다.
즉, 이벤트 종류(Event_ID) 및 이벤트_묘사(Event_description) 정보에 따라 미리 이벤트 종류별로 중요도를 1:1 대응하게 규정하고, 장애 이벤트가 발생하면 대응하는 중요도를 바로 부여하는 방법으로 장애 등급을 판단하게 된다.
그러나 이러한 종래의 장애 등급 판단기술은 실제 시스템 운영자의 복합적인 주변 상황(이벤트 발생 시점, 장애자원, 운영시간, 계획휴지 여부 등)을 감안하지 않은 상태이므로, 실제 운영상의 중요도와는 매우 상이한 결과를 초래하는 경우가 발생하였다.
또한, 종래의 기술은 시스템에 의해 도출되는 장애등급이 사람의 판단 기준으로 도출된 결과와 상이한 경우가 많아, 사람에 의한 중요도 재확인 작업이 수시로 필요한 단점이 있으며, 사람에 의한 중요도 재확인 작업이 생략되었을 경우에는 중요 장애 이벤트의 간과로 인해 대형 사고를 유발시키는 경우도 발생하였다.
이에 본 발명은 상기와 같은 종래 장애 등급 판단방법에서 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서,
본 발명이 해결하고자 하는 과제는, IT(정보기술) 시스템 관리분야 또는 산업분야에 걸쳐 운영을 담당하는 운영 시스템(업무처리기기, 소프트웨어, 시스템, 업무처리 프로세스, 기타 등등)의 장애 발생시 장애 등급(중요도)을 정확하게 판단하기 위한 운영시스템의 장애 등급 판단방법을 제공하는 데 있다.
본 발명이 해결하고자 하는 다른 과제는, 운영 시스템에서 발생한 장애 이벤트의 정확한 등급을 판정함으로써, 그에 적절한 처리를 유도함으로써 시스템 가동의 안정성을 확보하도록 한 운영시스템의 장애 등급 판단방법을 제공하는 데 있다.
상기와 같은 과제들을 해결하기 위한 본 발명에 따른 "운영시스템의 장애 등급 판단방법"의 바람직한 실시 예는,
운영시스템과 연결되어 상기 운영시스템에서 장애 발생시 장애 등급을 판단하는 방법에 있어서,
상기 운영시스템과의 연결 설정을 수행한 후, 상기 운영시스템에서 발생한 이벤트 정보를 수신하여 장애 이벤트 여부를 확인하는 제1단계와;
상기 확인결과 장애 이벤트일 경우, 장애 이벤트 구성 요소를 세분화하는 제2단계와;
상기 구성 요소에 적합한 분야별 환경 변수를 설정하고, 상기 장애 이벤트의 유형을 정의하는 제3단계와;
상기 정의한 유형에 상기 환경 변수를 적용하여 최종 장애 등급을 판단하는 제4단계를 포함하는 것을 특징으로 한다.
여기서 본 발명은,
장애 이벤트 구성 요소 중 이벤트-묘사 부분을 자원, 수치필드, 일반필드로 세분화하는 것이 바람직하며,
구성 요소별 환경 변수는 주중_운영시작_시각, 주중_운영종료_시각, 주중_운영시간_중요도, 주중_비 운영시간_중요도, 주말_운영시작_시각, 주말_운영종료_시각, 주말_운영시간_중요도, 주말_비 운영시간_중요도, 공휴일_운영시작_시각, 공휴일_운영종료_시각, 공휴일_운영시간_중요도, 공휴일_비 운영시간_중요도, 계획휴지 일정을 포함한다.
또한, 장애 이벤트의 유형은, 모든 경우 적용 가능한 유형인 유형"M", 중요도 고려대상 "자원"이 1개 존재하는 경우에 적용 가능한 유형인 유형"R","S", 중요도 고려대상 "자원"이 복수 존재하는 경우의 유형인 유형"T","U", 중요도 고려대상 "수치필드"가 존재하는 경우에 적용 가능한 유형인 유형"N", 기타 특수처리가 필요한 유형을 나타내는 유형"X"인 것을 특징으로 한다.
또한, 장애 이벤트의 유형에 따른 최종 장애 등급 판단은,
장애 이벤트 유형이 "M"인 경우 해당 이벤트 종류의 환경 변수를 고려하여 최종등급을 판단하고, 장애 이벤트 유형이 "R"인 경우 해당 자원의 환경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 해당 이벤트 종류의 환경변수를 고려하여 최종등급을 판단하며, 장애 이벤트 유형이 "S"인 경우 해당 자원의 환경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 최종 등급은 최하등급을 적용하고, 장애 이벤트 유형이 "T"인 경우 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원을 우선 적용하고, 자원이 없을 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "U"인 경우 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원 우선 적용하고, 자원이 없을 경우에는 최하등급으로 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "N"인 경우 해당 이벤트 종류별 또는 이벤트 종류와 장애자원별 수치필드의 값에 따라 중요도를 판정하되, 발생 수치 값이 지정 범위 밖인 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "X"인 경우 해당 이벤트 종류를 위한 특별처리 프로그램을 수행하여 장애 등급을 판단하되, 특별처리 프로그램이 지정되지 않은 경우에는 최하등급으로 장애 등급을 판정하는 것을 특징으로 한다.
본 발명에 따르면, IT(정보기술) 시스템 관리분야 또는 산업분야에 걸쳐 운영을 담당하는 운영 시스템(업무처리기기, 소프트웨어, 시스템, 업무처리 프로세스, 기타 등등)에서 장애 이벤트가 발생한 경우, 환경 변수를 고려함으로써 정확한 장애 등급을 판단할 수 있는 장점이 있다.
또한, 운영 시스템에서 발생한 장애 이벤트의 정확한 등급을 판정할 수 있으므로, 장애 이벤트 발생시 그에 적절한 처리를 유도할 수 있어, 시스템 가동의 안정성을 확보해주는 장점도 있다.
이하 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다. 본 발명을 설명하기에 앞서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다.
도 1은 본 발명이 적용되는 장애 등급 판단 시스템의 개략 구성도로서, 운영 시스템(100)과 장애 등급 판단 시스템(200)으로 구성된다.
운영 시스템(100)은 업무처리기기, 소프트웨어, 시스템, 업무처리 프로세스 등을 통칭한 것으로서, 장치 또는 시스템 전체 동작을 제어 및 운영하는 기능을 수행하며, 장애를 감지한 경우 장애 이벤트를 실시간 또는 주기적으로 발생하는 기능을 수행한다.
장애 등급 판단 시스템(200)은 상기 운영 시스템(100)과 연결되어, 상기 운영 시스템(100)으로부터 전송된 장애 이벤트를 수신하면 장애 이벤트 정보를 분석하여 장애 등급을 판단하고, 장애 등급을 표시해주는 기능을 수행한다.
이러한 장애 등급 판단 시스템(200)은 상기 운영 시스템(100)과 연결 설정을 수행한 후 이벤트 정보를 요청하거나 전송된 이벤트 정보를 수신하기 위한 데이터 인터페이스기(210), 상기 수신한 이벤트 정보를 저장하며, 발생한 장애 이벤트의 등급을 판단하기 위한 다양한 정보(예를 들어, 장애 이벤트의 구성 요소 중 이벤트 -묘사 부분을 세분화하기 위한 정보, 분야별 환경변수 정보, 이벤트 유형을 정의하기 위한 유형 정의 정보, 최종 장애 등급을 판단하기 위한 정보, 기타 등)가 저장된 데이터베이스(220), 상기 데이터 인터페이스기(210)를 통해 수신한 이벤트 정보를 분석하여 장애 발생 여부를 판단하는 장애 발생 판단부(230), 상기 데이터 인터페이스기(210)를 통해 이벤트 정보가 수신되면 상기 데이터베이스(220)에 저장된 다양한 정보를 통해 발생한 장애 이벤트의 등급을 판단하고, 그 장애 등급의 표시를 제어하는 장애 등급 판단부(240), 상기 장애 등급 판단부(240)와 연동하여 상기 운영 시스템(100)의 장애 발생시 장애 등급을 표시해주는 장애 등급 표시부(250)를 포함한다.
주지한 바와 같이 구성되는 장애 등급 판단 시스템(200)은 하나의 모듈로 구현하는 것이 바람직하다. 하나의 모듈로 구현한 경우, 특정 운영 시스템에 연결만 설정하면 그 연결된 운영 시스템에서 장애 이벤트 발생시 장애 등급을 판단하는 장치로 사용할 수 있다.
도 2는 본 발명에 따른 "운영시스템의 장애 등급 판단방법"의 바람직한 실시 예를 보인 흐름도로서, 상기 장애 등급 판단 시스템(200) 내의 장애 등급 판단부(240)에서 소프트웨어적으로 장애 등급을 판단하는 프로세스로서, S는 단계(Step)를 나타낸다.
이에 도시된 바와 같이, 본 발명에 따른 "운영시스템의 장애 등급 판단방법"은, 상기 운영시스템(100)과의 연결 설정을 수행한 후, 상기 운영시스템(100)에서 발생한 이벤트 정보를 수신하여 장애 이벤트 여부를 확인하는 제1단계(S101 ~ S107)와; 상기 확인결과 장애 이벤트일 경우, 장애 이벤트 구성 요소를 세분화하는 제2단계(S109)와; 상기 구성 요소에 적합한 분야별 환경 변수를 설정하고, 상기 장애 이벤트의 유형을 정의하는 제3단계(S111 ~ S113)와; 상기 정의한 유형에 상기 환경 변수를 적용하여 최종 장애 등급을 판단하는 제4단계(S117 ~ S119)로 이루어진다.
이와 같이 이루어지는 본 발명에 따른 "운영시스템의 장애 등급 판단 방법"은, 운영 시스템(100)과 장애 등급 판단 시스템(200)을 물리적(예를 들어, 통신 라인)으로 연결한 상태에서, 단계 S101에서와 같이 통신을 통해 운영 시스템(100)과 연결 설정을 시도한다.
이후 운영 시스템(100)으로부터 연결 설정에 대한 응답이 수신되면 정상적인 연결로 판단을 하게 되며, 상기 운영 시스템(100)으로부터 연결 설정에 대한 응답이 수신되지 않으면 전술한 단계 S101로 이동하여 운영 시스템과의 연결 설정을 재 시도하게 된다.
운영 시스템(100)과의 연결 설정이 정상적으로 이루어진 후에는, 단계 S103에서 상기 운영 시스템(100)에 이벤트(Event) 정보를 요청하게 되고, 상기 운영 시스템(100)으로부터 전송된 이벤트 정보를 수신하게 된다.
이벤트 정보가 수신되면 단계 S105 및 S107에서 수신한 이벤트 정보를 분석하여 장애 이벤트 여부를 판단하게 되고, 이 판단 결과 장애 이벤트로 판단되면, 단계 S109로 이동하여 이벤트의 구성 요소 중 이벤트-묘사 부분을 세분화하게 된다. 여기서 수신한 이벤트를 분석하여 장애 이벤트 여부를 판단하는 방법은 이벤트를 감시하는 분야에서 널리 알려진 공지의 이벤트 발생 판단 방법을 그대로 채택하게 되므로, 그의 자세한 설명은 생략한다.
상기 이벤트_묘사 부분을 세분화하는 방법은 다음과 같다.
일반적인 시스템에서 운영 중 발생하는 이벤트는 아래의 [표1]과 같은 구조를 갖는다.
일반적인 운영시스템에서 이벤트 구조
발생 시각 발생(감지)시스템 이벤트_종류(Event_id) 이벤트_묘사(Event_description)
2008.3.24 13:45:32 SYS1 IEF 4501 JOBA ABEND S037 REASON=OC
2008.3.24 13:46:21 TEC1 Ora_down_RDB_50 Oracle database Instance ORADVE down
2008.3.24 13:47:47 NMS22 nw_node_down21 Router NR5334 is unavailable now
2008.3.24 13:49:15 APM3 perf_degrad_35 response time for BIZ3 is 6.4sec(over5)
이러한 이벤트의 구성요소 중 묘사 부분을 "자원(Resource)", "수치필드(Numeric Field)", "일반 필드"로 세분화하게 된다. 아래의 [표2]는 구성요소 중 묘사 부분을 세분화한 예를 나타낸 것이다.
이벤트 구성요소 중 묘사 부분을 세분화 예
발생 시각 발생(감지)시스템 이벤트_종류(Event_id) 이벤트_묘사(Event_description)
2008.3.24 13:45:32 SYS1 IEF4501 JOBA (자원) ABEND S037 REASON=OC
2008.3.24 13:46:21 TEC1 Ora_down_RDB_50 Oracle database Instance ORADVE (자원) down
2008.3.24 13:47:47 NMS22 nw_node_down21 Router NR5334 (자원) is unavailable now
2008.3.24 13:49:15 APM3 perf_degrad_35 response time for BIZ3 (자원) is 6.4(수치) sec(over5)
다음으로, 단계 S111에서 상기 각 구성요소에 적절한 분야별 환경 변수를 설정한다. 아래의 [표3]은 각 구성요소에 대응하는 적절한 분야별 환경 변수를 나타낸 것이다.
구성요소별 환경변수
구성 요소 환경변수(환경에 따른 중요도)
발생(감지)시스템 주중_운영시작_시각, 주중_운영종료_시각, 주중_운영시간_중요도, 주중_비 운영시간_중요도, 주말_운영시작_시각, 주말_운영종료_시각, 주말_운영시간_중요도, 주말_비 운영시간_중요도, 공휴일_운영시작_시각, 공휴일_운영종료_시각, 공휴일_운영시간_중요도, 공휴일_비 운영시간_중요도, 계획휴지 일정
Event_id 주중_운영시작_시각, 주중_운영종료_시각, 주중_운영시간_중요도, 주중_비 운영시간_중요도, 주말_운영시작_시각, 주말_운영종료_시각, 주말_운영시간_중요도, 주말_비 운영시간_중요도, 공휴일_운영시작_시각, 공휴일_운영종료_시각, 공휴일_운영시간_중요도, 공휴일_비 운영시간_중요도, 계획휴지 일정
자원 주중_운영시작_시각, 주중_운영종료_시각, 주중_운영시간_중요도, 주중_비 운영시간_중요도, 주말_운영시작_시각, 주말_운영종료_시각, 주말_운영시간_중요도, 주말_비 운영시간_중요도, 공휴일_운영시작_시각, 공휴일_운영종료_시각, 공휴일_운영시간_중요도, 공휴일_비 운영시간_중요도, 계획휴지 일정
Event_id별 수치필드 "Event_id별" 또는 "Event_id와 장애자원별" 수치 구간의 중요도 구분
다음으로, 단계 S113에서는 상기 발생한 장애 이벤트 종류별로 이벤트 종류 유형을 정의한다. 아래의 [표4]는 이벤트 종류별 이벤트 종류 유형을 정의한 것을 나타낸 것이다.
이벤트 유형
이벤트 종류 유형 내용 중요도 처리방법
M 모든 경우 적용 가능 Event_id 중요도를 최종 중요도로 지정
R 중요도 고려대상 "자원"이 1개 존재하는 경우 자원 존재시, 자원의 중요도를 적용. 해당 자원 없을 시 이벤트 종류 중요도 적용
S 자원 존재시 자원의 중요도를 적용. 자원 없을 시 최종 중요도는 "최하등급(등급 없음)"적용
T 중요도 고려대상 "자원"이 복수 존재하는 경우 자원 존재시 가능 높은 중요도를 갖는 자원의 중요도 적용. 최상위 자원이 복수 존재시 선행 자원 우선. 자원 없을 시 이벤트 종류 중요도 적용.
U 자원 존재시 가능 높은 중요도를 갖는 자원의 중요도 적용. 최상위 자원이 복수 존재시 선행 자원 우선. 자원 없을 시 최종 중요도는 "최하등급(등급 없음)" 적용.
N 중요도 고려대상 "수치필드"가 존재하는 경우 이벤트 종류별 또는 이벤트 종류와 장애자원별 수치구간별 중요도 판정 예) 50 이상 80 미만: 중요도 3 80 이상 95 미만: 중요도2 95 이상 101 미만: 중요도1 그 외의 경우: 이벤트 종류별 중요도 적용
X 기타 특수처리 필요 이벤트 종류별 특수처리 프로그램 지정
발생한 장애 이벤트에 대해서 이벤트 유형의 정의가 종료되면, 다음으로 단계 S115 및 단계 S117에서 이벤트 유형별 환경 변수를 적용하여 최종 장애 등급을 판단하게 된다.
즉, 장애 이벤트 유형이 "M"인 경우에는 해당 이벤트 종류의 환경 변수를 고려하여 최종등급을 판단하고, 장애 이벤트 유형이 "R"인 경우에는 해당 자원의 환경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 해당 이벤트 종류의 환경변수를 고려하여 최종등급을 판단하게 된다.
아울러 장애 이벤트 유형이 "S"인 경우에는 해당 자원의 환경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 최종 등급은 최하등급을 적용하게 되며, 장애 이벤트 유형이 "T"인 경우에는 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원을 우선 적용하고, 자원이 없을 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하게 된다.
여기서 장애 이벤트 유형이 "M", "R", "S" 및 "T"일 경우에는, 이벤트 발생 시스템의 환경 변수를 고려하고, 앞에서 도출된 최종 중요도가 환경 변수가 고려된 이벤트 발생 시스템의 중요도보다 높은 경우에는 이벤트 발생 시스템의 중요도를 최종 중요도로 결정하게 된다. 최종 중요도는 환경변수가 고려된 이벤트 발생 시스템의 중요도를 넘을 수 없다.
또한, 장애 이벤트 유형이 "U"인 경우에는 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원 우선 적용하고, 자원이 없을 경우에는 최하등급으로 최종 장애 등급을 판단한다.
또한, 장애 이벤트 유형이 "N"인 경우에는 해당 이벤트 종류별 또는 이벤트 종류와 장애자원별 수치필드의 값에 따라 중요도를 판정하되, 발생 수치 값이 지정 범위 밖인 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하게 된다.
마지막으로, 장애 이벤트 유형이 "X"인 경우에는 해당 이벤트 종류를 위한 특별처리 프로그램을 수행하여 장애 등급을 판단하되, 특별처리 프로그램이 지정되지 않은 경우에는 최하등급으로 장애 등급을 판정하게 되는 것이다.
이후 단계 S119에서는 판단한 장애 등급을 관리자에게 통보해주어 사후 대책을 수립하도록 도모해주며, 아울러 장애 등급을 표시해주게 된다.
종래 장애 등급 판단 방법에 의한 장애 등급과 본 발명에 따른 장애 등급의 판단 방법을 이용한 장애 등급을 실제 운영시스템에서 발생한 장애 이벤트에 적용하면 아래의 [표5]와 같다.
중요도 판정 사례
발생이벤트 종래 중요도판정 본 발명의 중요도 판정
RAD017 SEOUL21 rader detected a flying object at 56km ahead, in latitude 37°92' North and in longitude 126°70' East 2등급: 레이더에 미확인 물체가 감지되었습니다. 1등급: 서울 레이더 56km 전방, 북위 37°92', 동경 126°70'에 미확인 물체가 감지되었습니다.
RAD017 DAIGU47 rader detected a flying object at 96km ahead, in latitude 36°50' North and in longitude 128°00' East 2등급: 레이더에 미확인 물체가 감지되었습니다. 3등급: 대구 레이더 96km 전방, 북위 36°50', 동경 128°00'에 미확인 물체가 감지되었습니다.
결론적으로, 종래의 장애 등급 판단 방법은 미리 정해진 중요도에 이벤트 종류만을 대입하는 방식이므로, 상기[표5]와 같이 사안이 다른 사항에서도 일률적인 장애 등급을 부여하게 되므로, 중요 이벤트의 간과로 인해 대형 사고를 유발할 수 있다.
반면, 본 발명은 환경 변수(예를 들어, 서울, 대구)를 고려하게 되므로, 동일 사안에 대해서도 환경을 고려하여 최적으로 장애 등급을 부여하게 되므로, 주지한 바와 같이 동일 이벤트에 대해서도 최적의 장애 등급을 부여하게 된다. 따라서 중요 이벤트를 놓쳐 대형 사고를 유발하는 문제를 사전에 예방할 수 있게 되는 것이다.
본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
이상 상술한 본 발명은 IT 관련 분야나 산업 분야의 운영 시스템에 적용하여 장애 등급을 정확하게 판단할 수 있음은 물론, 데이터 인터페이스만 되면 해당 시스템의 장애 등급을 정확하게 판단할 수 있으므로, 운영시스템을 이용하는 방위산업, 환경산업 등의 모든 분야에 확대 적용이 가능하다.
도 1은 본 발명이 적용되는 장애발생 판단시스템의 개략적인 구성을 보인 블록도.
도 2는 본 발명에 따른 운영시스템의 장애 등급 판단 방법을 보인 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
100… 운영 시스템
200… 장애 등급 판단시스템
210… 데이터 인터페이스기
220… 데이터베이스
230… 장애발생 판단부
240… 장애등급 판단부
250… 장애등급 표시부

Claims (6)

  1. 삭제
  2. 삭제
  3. 장비 또는 기기 등을 운영하는 운영시스템과 연결되어 상기 운영시스템의 장애 발생시 장애 등급을 판단하는 방법에 있어서,
    상기 운영시스템과의 연결 설정을 수행한 후, 상기 운영시스템에서 발생한 이벤트 정보를 수신하여 장애 이벤트 여부를 확인하는 제1단계와;
    상기 확인결과 장애 이벤트일 경우, 장애 이벤트 구성 요소를 세분화하는 제2단계와;
    상기 구성 요소에 적합한 분야별 환경 변수를 설정하고, 상기 장애 이벤트의 유형을 정의하는 제3단계와;
    상기 정의한 유형에 상기 환경 변수를 적용하여 최종 장애 등급을 판단하는 제4단계를 포함하되,
    상기 구성 요소별 환경 변수는 주중_운영시작_시각, 주중_운영종료_시각, 주중_운영시간_중요도, 주중_비 운영시간_중요도, 주말_운영시작_시각, 주말_운영종료_시각, 주말_운영시간_중요도, 주말_비 운영시간_중요도, 공휴일_운영시작_시각, 공휴일_운영종료_시각, 공휴일_운영시간_중요도, 공휴일_비 운영시간_중요도, 계획휴지 일정을 포함하는 것을 특징으로 하는 운영시스템의 장애 등급 판단방법.
  4. 장비 또는 기기 등을 운영하는 운영시스템과 연결되어 상기 운영시스템의 장애 발생시 장애 등급을 판단하는 방법에 있어서,
    상기 운영시스템과의 연결 설정을 수행한 후, 상기 운영시스템에서 발생한 이벤트 정보를 수신하여 장애 이벤트 여부를 확인하는 제1단계와;
    상기 확인결과 장애 이벤트일 경우, 장애 이벤트 구성 요소를 세분화하는 제2단계와;
    상기 구성 요소에 적합한 분야별 환경 변수를 설정하고, 상기 장애 이벤트의 유형을 정의하는 제3단계와;
    상기 정의한 유형에 상기 환경 변수를 적용하여 최종 장애 등급을 판단하는 제4단계를 포함하되,
    상기 장애 이벤트의 유형은,
    모든 경우 적용 가능한 유형인 유형"M", 중요도 고려대상 "자원"이 1개 존재하는 경우에 적용 가능한 유형인 유형"R" 및 "S", 중요도 고려대상 "자원"이 복수 존재하는 경우의 유형인 유형"T" 및 "U", 중요도 고려대상 "수치필드"가 존재하는 경우에 적용 가능한 유형인 유형"N", 기타 특수처리가 필요한 유형을 나타내는 유형"X"인 것을 특징으로 하는 운영시스템의 장애 등급 판단방법.
  5. 제4항에 있어서, 상기 장애 이벤트의 유형에 따른 최종 장애 등급 판단은,
    장애 이벤트 유형이 "M"인 경우 해당 이벤트 종류의 환경 변수를 고려하여 최종등급을 판단하고, 장애 이벤트 유형이 "R"인 경우 해당 자원의 환경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 해당 이벤트 종류의 환경변수를 고려하여 최종등급을 판단하며, 장애 이벤트 유형이 "S"인 경우 해당 자원의 환 경변수를 고려하여 최종등급을 판단하되, 자원이 없을 경우에는 최종 등급은 최하등급을 적용하고, 장애 이벤트 유형이 "T"인 경우 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원을 우선 적용하고, 자원이 없을 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "U"인 경우 해당 자원의 환경변수를 고려하여 가장 높은 중요도를 갖는 자원의 중요도를 적용하되, 최상위 자원이 복수 존재할 경우에는 선행 자원 우선 적용하고, 자원이 없을 경우에는 최하등급으로 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "N"인 경우 해당 이벤트 종류별 또는 이벤트 종류와 장애자원별 수치필드의 값에 따라 중요도를 판정하되, 발생 수치 값이 지정 범위 밖인 경우에는 이벤트 종류 중요도를 적용하여 최종 장애 등급을 판단하며, 장애 이벤트 유형이 "X"인 경우 해당 이벤트 종류를 위한 특별처리 프로그램을 수행하여 장애 등급을 판단하되, 특별처리 프로그램이 지정되지 않은 경우에는 최하등급으로 장애 등급을 판정하는 것을 특징으로 하는 운영시스템의 장애 등급 판단방법.
  6. 제5항에 있어서, 상기 장애 이벤트 유형이 "M", "R", "S" 및 "T"일 경우에는, 이벤트 발생 시스템의 환경 변수를 고려하고, 앞에서 도출된 최종 중요도가 환경 변수가 고려된 이벤트 발생 시스템의 중요도보다 높은 경우에는 이벤트 발생 시스템의 중요도를 최종 중요도로 결정하는 것을 특징으로 하는 운영시스템의 장애 등급 판단방법.
KR1020080073644A 2008-07-28 2008-07-28 운영시스템의 장애 등급 판단방법 KR100938676B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080073644A KR100938676B1 (ko) 2008-07-28 2008-07-28 운영시스템의 장애 등급 판단방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080073644A KR100938676B1 (ko) 2008-07-28 2008-07-28 운영시스템의 장애 등급 판단방법

Publications (1)

Publication Number Publication Date
KR100938676B1 true KR100938676B1 (ko) 2010-01-25

Family

ID=41810225

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080073644A KR100938676B1 (ko) 2008-07-28 2008-07-28 운영시스템의 장애 등급 판단방법

Country Status (1)

Country Link
KR (1) KR100938676B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011087169A1 (ko) * 2010-01-15 2011-07-21 Lim Tae-Hwan 운영시스템의 장애 등급 판단방법
KR101637458B1 (ko) * 2015-03-19 2016-07-08 주식회사 위엠비 데이터센터 통합 관제 방법 및 이를 실행하는 통합 관제 시스템, 컴퓨터 프로그램, 그 기록매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060241A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 액세스 라우터 시스템에서의 라인 카드 장애 처리방법
JP2007096796A (ja) 2005-09-29 2007-04-12 Fujitsu Ltd ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
KR20080050195A (ko) * 2006-12-01 2008-06-05 한국전자통신연구원 가입자 망 관리 시스템에서의 고장관리 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060241A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 액세스 라우터 시스템에서의 라인 카드 장애 처리방법
JP2007096796A (ja) 2005-09-29 2007-04-12 Fujitsu Ltd ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
KR20080050195A (ko) * 2006-12-01 2008-06-05 한국전자통신연구원 가입자 망 관리 시스템에서의 고장관리 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011087169A1 (ko) * 2010-01-15 2011-07-21 Lim Tae-Hwan 운영시스템의 장애 등급 판단방법
KR101637458B1 (ko) * 2015-03-19 2016-07-08 주식회사 위엠비 데이터센터 통합 관제 방법 및 이를 실행하는 통합 관제 시스템, 컴퓨터 프로그램, 그 기록매체

Similar Documents

Publication Publication Date Title
CN108710544B (zh) 一种数据库系统的进程监控方法及轨道交通综合监控系统
US20170199515A1 (en) A method for controlling a process plant using a redundant local supervisory controller
CN106469098A (zh) 一种设备的故障处理方法和装置
CN111865682B (zh) 用于处理故障的方法和装置
CN106776243A (zh) 一种针对监控软件的监控方法及装置
RU2667032C2 (ru) Информационно-поисковые система и способ
CN114095522A (zh) 车辆监控方法、服务系统、管理终端、车辆及存储介质
CN101876828A (zh) 一种管理飞机警报的方法以及实现所述方法的设备
CN110752944B (zh) 告警派单方法及装置
KR100938676B1 (ko) 운영시스템의 장애 등급 판단방법
CN104219087A (zh) 一种故障定位的方法
CN112749183A (zh) 用于现场设备维护请求管理的装置、方法和计算机程序产品
US11860611B2 (en) Method for identifying a limited operator control and monitoring of a technical plant, operator control and monitoring system and process control system
CN103811367A (zh) 产品缺陷检测方法
US10880151B2 (en) Notification control device, notification control system, notification control method, and storage medium
WO2011087169A1 (ko) 운영시스템의 장애 등급 판단방법
US20200073777A1 (en) Method for Automatically Evaluating Alarm Clusters
CN117608904A (zh) 一种故障定位方法、装置、电子设备和存储介质
CN115309717A (zh) 数据库加载方法、装置、设备、介质和计算机程序产品
CN107315953B (zh) 设备安全检测系统及检测方法
CN110192196B (zh) 攻击/异常检测装置、攻击/异常检测方法和存储介质
CN106156627B (zh) 自动化信息系统漏洞风险的处理方法和装置
CN115879697A (zh) 一种工业互联网的数据处理方法、系统、设备及存储介质
US11595409B2 (en) Method for monitoring an industrial network
US20220130227A1 (en) Alarm control device and alarm control method

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20080728

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20091215

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20100112

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20100118

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20100118

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20121031

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20121031

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20140116

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20140116

Start annual number: 5

End annual number: 5

FPAY Annual fee payment

Payment date: 20170216

Year of fee payment: 8

PR1001 Payment of annual fee

Payment date: 20170216

Start annual number: 8

End annual number: 8

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20181029