[go: up one dir, main page]

KR100445374B1 - 정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달 - Google Patents

정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달 Download PDF

Info

Publication number
KR100445374B1
KR100445374B1 KR10-2001-0024552A KR20010024552A KR100445374B1 KR 100445374 B1 KR100445374 B1 KR 100445374B1 KR 20010024552 A KR20010024552 A KR 20010024552A KR 100445374 B1 KR100445374 B1 KR 100445374B1
Authority
KR
South Korea
Prior art keywords
group
node
topology
computing environment
distributed computing
Prior art date
Application number
KR10-2001-0024552A
Other languages
English (en)
Other versions
KR20010109080A (ko
Inventor
크놉펠리페
저겐센데니스디.
장춘시
파크호우리사메흐에이.
레이스티모시엘.
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20010109080A publication Critical patent/KR20010109080A/ko
Application granted granted Critical
Publication of KR100445374B1 publication Critical patent/KR100445374B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Environmental & Geological Engineering (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

분산형 컴퓨팅 환경에서의 서로 다른 노드에 공통의 네트워크 토폴로지 데이터베이스를 유지시키기 위하여 토폴로지 전달 기능이 제공된다. 이 기능은 상기 분산형 컴퓨팅 환경이 정상 상태에 있는 경우 메시지 트래픽을 발생시키지 않는다. 이것은 상기 분산형 환경에서 토폴로지 변화가 없는 시간 주기 동안 그룹 접속 메시지의 송신을 중단함으로써 달성된다. 그룹 접속 메시지의 송신은 상기 분산형 컴퓨팅 환경에서 상기 그룹 리더에 의한 적어도 하나의 토폴로지 변화 확인시 적어도 하나의 그룹 리더로부터 재개된다. 그룹 접속 메시지는, 양 노드 그룹에 대해 공통인 노드를 사용하여 제1 네트워크 상의 하나의 노드 그룹으로부터 제2 네트워크 상의 또다른 노드 그룹으로 전송된다. 분산형 컴퓨팅 환경의 네트워크는, 상기 토폴로지 전달기능이 네트워크의 상호 동작 성능을 조성할 수 있도록 이종의 네트워크들(heterogenous networks)을 포함할 수 있다.

Description

정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달{TOPOLOGY PROPAGATION IN A DISTRIBUTED COMPUTING ENVIRONMENT WITH NO TOPOLOGY MESSAGE TRAFFIC IN STEADY STATE}
본 발명은 통신 네트워크에 관한 것으로, 특히 분산된 컴퓨팅 환경이 정상 상태에 있을 경우 토폴로지 전달 기능이 메시지 트래픽을 발생시키지 않는, 분산형 컴퓨팅 환경에서의 서로 다른 노드에서 공통 네트워크 토폴로지 데이터베이스를 유지시키기 위한 기술에 관한 것이다.
일반적으로 통신 네트워크는 통신 링크 또는 전송 그룹들을 통하여 연결된 네트워크 노드 및 엔드 노드의 집합으로서 정의될 수 있다. 네트워크 노드는, 자신과 인접하는 또는 이웃한 노드들 사이에서의 메시지 라우팅, 네트워크 노드 및 엔드 노드 사이에 전송되는 메시지의 라우트 선택, 및 접속된 엔드 노드로의 디렉토리 서비스의 공급 등과 같은, 네트워크 내에서의 임의의 기능을 제공하는 데이터 프로세싱 시스템으로서의 특징이 있다. 노드들 사이의 링크는, 다이얼-업 전화 접속 등과 같이 필요할 때에만 인에이블되는 통상의 케이블 접속 또는 링크 등과 같은 영구 통신 링크일 수 있다. 엔드 노드는, 라우팅 또는 라우트 선택 또는 네트워크에서 다른 노드로의 디렉토리 서비스를 제공하지 않는, 디스플레이 단말, 지능형 워크스테이션, 프린터 등과 같은 장치들에 의해 예증된다. 일괄적으로, 상기 네트워크 노드, 상기 엔드 노드 및 상기 노드들 사이에서의 전송 그룹은 네트워크 자원이라고 한다. 네트워크에서 상기 여러가지 노드 및 링크의 물리적 형상 및 특성 (및 그들의 상태)을 네트워크의 토폴로지(the topology of the network)라고 말한다.
메시지가 임의의 네트워크 내의 임의의 두 노드 사이에서 전송되기 전에, 접속을 형성한 인간 오퍼레이터 또는 데이터 프로세싱 장비는 상기 네트워크 토폴로지에 대한 정확한 최신의 파일 또는 데이터베이스를 필요로 한다.
네트워크 장비가 인간의 개재없이 자체적으로 토폴로지 데이터 베이스를 유지하는 작업을 인수하도록 계속적으로 시도되어 왔다. 예를 들면, 통신 제어 기능을 실행하는 각 프로세서는 그 자원의 상태에서의 변화를 다른 프로세서에 알릴 수 있다. 상기 다른 프로세서들은 상기 토폴로지 네트워크 데이터베이스의 자체 사본을 수정 또는 변화시키는 토폴로지 갱신 메시지를 사용한다.
분산형 컴퓨팅 시스템에서, 수개의 네트워크가 상기 시스템을 포함하는 노드들을 접속시킨다. 노드들 모두가 상기 네트워크 모두에 다 접속되지 않는 것이 가능하며, 다중의 "홉들(hops)"은 동일한 네트워크에 접속되지 않은 임의의 두 노드들 사이에서 메시지를 전송할 것을 필요로 한다. 이를 위하여, 상기 시스템 내의 모든 노드가 현재의 글로벌 네트워크 토폴로지를 인식해야 한다. 상기 토폴로지 정보는, 다운된 어댑터 및 네트워크의 세트 뿐만아니라, 상기 시스템에서 각 네트워크에 접속된 노드 및 네트워크 어댑터의 세트를 포함한다. 상기 토폴로지 정보는, 노드, 네트워크, 또는 네트워크 어댑터가 고장이거나 파워 업될 때마다 변화한다. 글로벌 네트워크 토폴로지를 이용하는 경우, 각 노드는, 도달가능한 노드 및 각 도달가능한 노드에 대한 라우트의 세트를 산정할 수 있다.
이 기술 분야에서, 시스템 내의 모든 노드에 대해 글로벌 토폴로지 정보를 공급하는 것에 대한 개선된 기술이 필요하다. 특히, 상기 시스템이 정상 상태에 있는 경우, 즉 노드나 어댑터가 고장이 아니거나 파워 업되지 않는 경우, 상기 분산형 컴퓨팅 환경 내에서 토폴로지 메시지가 전달되지 않도록 하는 개선된 토폴로지 전달 기술이 필요하다. 바람직하게는, 이 향상된 기술은 명시적 수신 확인 메시지(ACK)을 이용하지 않고 달성된다. 본 발명은 그러한 토폴로지 전달 메커니즘을 제공하고자 한다.
간략히 요약하자면, 본 발명은 한 측면에서 분산형 컴퓨팅 환경에서의 토폴로지 전달 방법을 포함한다. 본 방법은, 상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 노드 그룹 중 확인된 노드까지 그룹 접속 메시지를 송신하고, 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 주기 동안 그룹 접속 메시지의 송신을 중단하고, 그리고 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화 확인시 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 단계를 포함한다.
또다른 측면에서, 본 방법은 분산형 컴퓨팅 환경에서의 토폴로지의 전달을 위한 시스템을 포함한다. 상기 시스템은, 상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 노드 그룹 중 확인된 노드까지 그룹 접속 메시지를 송신하는 수단; 및 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 주기 동안 그룹 접속 메시지의 송신을 중단하는 수단을 포함한다. 상기 시스템은, 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화 확인시 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 수단을 추가로 포함한다.
또다른 측면에서, 본 발명은, 상기 분산형 컴퓨팅 환경 내에서의 토폴로지 전달의 방법을 실행하는 기기에 의해 실행가능한 명령중 적어도 하나의 프로그램을 실현하는, 그러한 기기에 의해 판독가능한 적어도 하나의 프로그램 스토리지 장치를 포함한다. 본 방법은, 상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 노드 그룹 중 확인된 노드까지 그룹 접속 메시지를 송신하고, 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 주기 동안 그룹 접속 메시지의 송신을 중단하고; 그리고 상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화 확인시 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 단계를 포함한다.
다시 말하면, 상기 기능을 적용한 분산형 컴퓨팅 환경이 정상 상태에 있는 경우 메시지 트래픽을 발생시키지 않는 토폴로지 전달 기능이 제공된다. 상기 환경은, 고장난, 노드, 네트워크 어댑터, 또는 네트워크 접속이 없는 경우, 또는 현재 동작 중인, 노드, 네트워크 어댑터 또는 네트워크 접속이 없는 경우, 정상 상태에 있다. 토폴로지 전달 기능은, 토폴로지 메시지의 전송에 대해 명시적 수신 확인 메시지를 이용하지 않고 달성된다. 여기서 상기 토폴로지 전달 방법은, 2-노드 링크를 가정하는 현재 전달 기술에 대해 반대되는 것으로서, 다중 네트워크 및 다중 어댑터를 포함하는 분산형 컴퓨팅 환경에서 작동한다. 또한, 여기서 상기 방법은 비신뢰성 네트워크로 잘 작동한다. 즉, 엔드-투-엔드(end-to-end) 수신 확인의 필요없이 양호하게 작동한다. 또한, 본 방법에 의하면, 분산형 컴퓨팅 환경에서 시작하는 노드로 네트워크 토폴로지를 자동으로 전송할 수 있도록 한다.
본 발명의 기술을 통하여 추가의 구성 및 효과가 실현된다. 본 발명의 다른 실시예 및 측면이 이하에 상세히 기술되며, 이는 상기 청구된 발명의 일부분으로 생각된다.
도 1은 본 발명에 따른 토폴로지 전달 기능을 사용하는 대표적인 통신 네트워크의 개략도면.
도 2A-2f는 분산형 프로세싱 시스템의 다중 노드에 의해 적용되는 JOIN 프로토콜의 일실시예를 도시한 도면. 여기서, 도 2a는 PROCLAIM 메시지를, 도 2b는 JOIN 메시지를, 도 2c는 커미트 준비(a prepare to commit)(PTC) 메시지를, 도 2d는 커미트 준비 수신 확인(PTC_ACK) 메시지를, 도 2e는 커미트 동시전송(COMMIT_BCAST) 메시지를, 그리고 도 2f는 COMMIT 메시지 및 커미트 동시전송 수신 확인(COMMIT_BCAST_ACK) 메시지를 도시한 도면.
도 2g는 도 2a-2f의 JOIN 프로토콜의 완료후 형성된 새로운 그룹의 노드를 도시한 도면.
도 3a-3c는 분산형 프로세싱 시스템의 다중 노드에 의해 적용되는 DEATH 프로토콜의 일실시예를 도시한 도면. 여기서, 도 3a는 하트비트(heartbeat) 링을 도시한 그룹의 초기 상태를 도시한 도면, 도 3b는 노드의 비응답성을 감지하고 그에 응답하는 DEATH 메시지를 전송하는 것을 도시하는 도면, 그리고 도 3c는 그룹 리더로부터 그룹의 살아남은 노드들로 송신되는 새로운 커미트 준비(PTC) 메시지를 도시한 도면.
도 4a-4c는 2개의 네트워크의 노드들을 포함하는 분산형 컴퓨팅 환경에 대한 노드 도달 가능성 프로토콜의 일실시예를 도시한 도면. 여기서, 도 4a는 네트워크 1의 그룹리더로의 NODE_CONNECTIVITY 메시지의 전송을 도시한 도면, 도 4b는 그룹 리더로부터 상기 그룹의 노드로의 GROUP_CONNECTIVITY 메시지의 전송을 도시한 도면, 그리고 도 4c는 노드 2로부터 어댑터를 통하여 상기 분산형 컴퓨팅 환경의 네트워크 2의 노드 4 및 5로의 GROUP_CONNECTIVITY 메시지의 전송을 도시한 도면.
도 5a는 본 발명의 원리에 따른 메시지 전달 기능을 적용하기 위한 초기 분산형 컴퓨팅 환경을 도시한 도면.
도 5b는 도 5a의 상기 분산형 컴퓨팅 환경의 노드 5에서의 초기 네트워크 접속 테이블(NCT)을 도시한 도면.
도 5c는 도 5a의 어댑터 멤버십 그룹(AMG)으로부터 소멸되는 노드 2를 도시하며, 결과적으로 새로운 멤버십 그룹(AMG A_2)을 형성하는 것을 도시한 도면.
도 5d는 노드 5에서의 NCT를 도시하며, 그것은 네트워크 2에 접속되고, 노드 2의 소멸과 동일함을 도시하는 도면.
도 5e는, 새로운 어댑터 멤버십 그룹(A_2)의 그룹 리더로부터 그의 동작 멤버로의 그룹 접속 메시지의 전달, 및 네트워크 2 상의 AMG B_1의 노드 5 및 6으로 노드 3에 의한 이 GCM의 전송을 도시하는, 도 5c의 분산형 컴퓨팅 환경을 도시한 도면.
도 5f는 도 5e에서 노드 3에 의해 전송되는 GCM의 수신 후에 노드 5에서의 수신시 노드 5에서의 NCT를 도시한 도면.
도 6a는 본 발명의 원리에 따른 토폴로지 전달을 적용하기 위한 분산형 컴퓨팅 환경을 도시한 개략도로서, 노드 2가 시작을 기다리고 있는 것을 도시한 도면.
도 6b는 노드 2의 시작을 보류하고 있는 노드 5 및 노드 2에서의 NCT를 도시한 도면.
도 6c는 노드 2의 시작 및 새로운 AMG A_2의 형성 후 도 6a의 분산형 컴퓨팅 환경을 도시한 도면.
도 6d는, 노드 5에서의 NCT 및 노드 2에서의 NCT가, 상기 노드들에서의 NCT의 갱신 전에, 노드 2의 시작과 같은 것을 도시한 도면.
도 6e는 AMG A_2의 그룹 리더에 의한 GCM의 전송 및 노드 5 및 6으로 노드 3에 의한 그의 전송을 도시하는 도면.
도 6f는, 노드 5에서의 NCT 및 노드 2에서의 NCT가 GL1으로부터의 GCM의 전송 다음에 오는 것을 도시한 도면.
도 6g는 GL2로부터의 GCM의 전송 및 노드 2 및 1로 노드 3에 의한 그의 전송을 도시한 도 6e의 분산형 컴퓨팅 환경을 도시한 도면.
도 6h는 노드 5에서의 NCT 및 노드 2에서의 NCT가 GL2에 의한 GCM의 발행 후에 오는 것을 도시한 도면. 및
도 7은 본 발명의 원리에 따른 토폴로지 전달 기능을 실행하는 그룹 리더에 대한 상태 개략도.
<도면의 주요 부분에 대한 부호의 설명>
10 : 분산형 컴퓨팅 환경
12 : 노드
14 : 네트워크
16 : 어댑터
일반적으로 말하면, 다중 통신 네트워크를 포함하는 이종 환경 (heterogenous environment)을 가지는, 분산형 컴퓨팅 환경에서의 모든 노드에 대한 글로벌 토폴로지 정보를 전달하는 기능이 제공된다. 이 메커니즘은, 각 노드가 이 시스템 토폴로지의 글로벌 뷰를 획득할 수 있도록 하며, 그리고 그 네트워크 어댑터가 다운일 것을 포함하며, 노드들이 분할된 네트워크들에 속해 있을 것을 포함한다. 상기 글로벌 토폴로지가 변화하는 것을 중지할 경우, 곧 시스템에서의 모든 노드들이 상기 토폴로지의 상호 일치하는 뷰를 가질 것이다. 상기 시스템이 정상상태에 있는 경우, 즉 어떠한 노드나 네트워크 어댑터도 고장나지 않으며 상기 환경에 추가되지도 않는 경우, 송신된 토폴로지 전달 메시지가 없는 것이 바람직하다. 추가로, 토폴로지 전달은 명시적 토폴로지 수신 확인 메시지를 사용하지 않고 달성된다.
여기 사용된 바와 같이, 각 네트워크는 그룹 리더(GL)로서 선택된 노드와 함께 어댑터 멤버십 그룹(AMG)을 형성한다. GL들 및 그룹 멤버들은 토폴로지 전달 메시지를 주기적으로 상호 송신한다. 이 전달 메시지는 필요하다면 한 네트워크로부터 다른 네트워크로 전송된다. 상기 분산된 컴퓨팅 환경에서 변화가 없는 경우에 메시지가 교환되지 않도록 중지 기준이 적용된다. 상기 분산된 환경에서 변화가 있는 경우에 상기 토폴로지 전달 메시지를 재개하기 위하여 재개 기준이 존재한다.
토폴리지 전달 기능은, International Business Machines'의 "신뢰할 수 있는 클러스터 기술" (RSCT) 토폴로지 서비스 (참조 "RS/6000 High Availability Infrastructure," IBM 공개 제SG24-4838-00 ("RED BOOK") 1996)의 내용과 관련하여 여기에 기술되며, 이것은 분산형 컴퓨팅 시스템에서 노드 및 네트워크 어댑터의 안정을 모니터할 책임이 있는 서브시스템이다. 이 서브시스템은 IBM RS/6000 SP 시스템 또는 네트워크 RS/6000 기기 내에 존재한다. 상기 서브시스템은, 고장 노드 또는 네트워크 토폴로지 내에서의 다른 변화에 반응할 필요가 있는 분산 적용예들에 대한 기초로서 사용된다.
도 1은 분산형 컴퓨팅 환경(도면 부호 10으로 도시됨)의 일 실시예를 도시하며, 다중 네트워크(14)를 횡단하는 복수의 노드들 사이의 물리적 접속을 도시하고 있다. 각 노드(12)는 단일 네트워크 어댑터(16)를 횡단하여 서로 다른 네트워크(14)에 접속된다. 도시된 바와 같이, 서로 다른 노드(12)들은 서로 다른 수의 네트워크 어댑터들을 가질 수 있고 서로 다른 네트워크(14)들에 접속될 수 있다. 분산형 컴퓨팅 환경(10)에서, 각 노드(12)는, 할당된 네트워크를 직접 횡단하거나 아니면 한 네트워크로부터 또다른 네트워크로 양 네트워크에 공통인 노드를 횡단하여 "홉핑(hopping)"함에 의해, 통신할 수 있다. 상기 분산형 컴퓨팅 환경(10)은, 메시지가 전송시 손실될 수 있는 비신뢰성 컴퓨팅 환경을 포함하는 것으로 가정된다.
유의해야 할 점은, 노드는 다중의 어댑터들을 가질 수 있으며, 그 각각은 서로 다른 네트워크에 연결된다는 점이다. (네트워크들은 하나의 또는 다중의 서브-네트들을 포함하며; 네트워크들은 다른 네트워크에 접속되거나 또는 접속되지 않는다.) 노드에서 각 어댑터는, "업(up)"인 경우, 각 어댑터 멤버십 그룹(AMG)이 서로 다른 것과 통신할 수 있는 네트워크 내의 모든 "업" 어댑터 들을 포함하기 때문에, 서로 다른 "어댑터 멤버십 그룹(AMG)"의 일부일 것이다.
이론적으로, 그것은 네트워크의 그룹 리더(GL)인 "어댑터"이다: 노드가, 한 네트워크 내에서 그룹 리더인 어댑터 및 그 네트워크 내에서 그룹 리더가 아닌 또다른 어댑터를 가지는 것이 가능하다. 다른 한편, 프로토콜이 실행되는 곳에서 상기 토폴로지 서비스 데몬을 실행하는 것은 어댑터가 아니라 노드이다. 상기 데몬(daemon)은 어댑터 한대씩(per-adapter basis)에 프로토콜을 실행한다.
설명을 간단하게 하기 위하여, 도 2a-3c에서, 상기 어댑더 멤버십 프로토콜은 단일 네트워크 설정에서 설명된다. 이 설정에서, 상기 "노드"를 그룹 리더로 생각하는 것이 더욱 간단하다. 그러나, 다중 네트워크 환경에서는, "어댑터"를 그룹 리더로 생각하는 것이 더욱 정확하다. 사용하기에 따라, 용어 "노드"는 상기 노드가 그룹 리더로 언급될 경우 그의 "어댑터"를 포함하는 것으로 읽혀진다.
일 실시예에서, 각 노드는 토폴로지 서비스 "데몬" 프로세스를 실행시키도록 한다. 이 프로세스는 본 발명의 토폴로지 전달 기능의 임의 측면들을 취급하며, 그것은: (1) 프로토콜 메시지를 송신 및 수신하는 것; 및 (2) 모든 노드의 네트워크 어댑터들이 접속되는 네트워크들에 대한 접속 관련 정보 및 글로벌 네트워크 토폴로지를 저장하는 것을 포함한다.
각 네트워크에서 어댑터들의 안정성 및 접속을 모니터하기 위하여, 네트워크에서 모든 어댑터가 "어댑터 멤버십 그룹(AMG)" 을 형성하도록 해야 하며, 그것은 네트워크에서 서로에 대해 통신할 수 있는 모든 네트워크 어댑터를 포함하는 하나의 그룹이다.
각 노드가 수개의 AMG에 속해 있으며, 그것은 그의 네트워크 어댑터 각각에 대하여 속한 것임을 유의한다.
각 네트워크에서 동작하는 어댑터의 세트를 결정하기 위하여, 어댑터 멤버십 프로토콜이 각 네트워크 내에서 실행된다.
이하에 추가로 설명된 바와 같이, 동작하는 어댑터들이 어댑터 멤버십 그룹(AMG)을 형성하며, 여기서 멤버는 가상의 링 토폴로지 내에 (실시예만에 의해) 구성된다. 모든 그룹 멤버가 동작하도록 보장하기 위하여, 각각은 그의 "다운스트림 이웃"으로 "HEART BEAT" 메시지를 주기적으로 송신하고, "업스트림 이웃"으로부터 "HEART BEAT" 메시지를 모니터한다. 프로토콜은, 어댑터가 고장난 경우 또는 새로운 어댑터가 기능적으로 되는 경우 실행된다. 그러한 프로토콜의 목적은, 상기 멤버십 그룹이 각 순간에 서로 통신할 수 있는 모든 어댑터를 포함할 것을 보장하고자 하는 것이다.
각 그룹은 "그룹 리더"(GL) 및 "백업 그룹 리더"를 가진다. 상기 그룹 리더는 그룹 프로토콜을 정렬할 책임이 있으며, 백업 그룹 리더는 그룹 리더 어댑터가 고장일 때 그룹 리더십을 인수할 책임이 있다. 그룹 리더 및 백업 그룹 리더의 선택 및 링에서의 어댑터들 위치는 소정의 어댑터 우선순위 룰에 의해 결정되며, 이것은 어댑터들의 IP 어드레스로 선택될 수 있다. 예를 들면, 높은 IP 어드레스는 높은 우선순위를 가리킨다.
각 네트워크에서 가능한 모든 어댑터들의 리스트는 시작 및 재구성시 모든 노드에 의해 판독되는 구성 파일에 포함된다.
도 2A-2g 참조하면, 상기 그룹에 새로운 멤버를 유인하기 위해, 각 그룹의 그룹 리더는, 어댑터 구성 내에 있으나 그룹에 속하지 않는 어댑터들에 "PROCLAIM" 메시지를 주기적으로 송신한다(도 2a 참조). 송신기 보다 낮은 IP 어드레스를 가지는 어댑터들에 대해서만 이들 메시지가 송신된다.
"PROCLAIM" 메시지는 그룹 리더 외의 모든 어댑터들에 의해 무시된다. 도 2b에 도시된 바와 같이, 높은 우선순위(높은 IP 어드레스)로부터의 "PROCLAIM" 메시지를 수신한 그룹 리더 노드는 그의 그룹을 위하여 "JOIN" 메시지로 응답한다. 상기 메시지는 "결합(joining) 그룹"의 멤버십 리스트를 포함한다.
"JOIN" 메시지를 수신하는 노드(도 2b에서 GL1)는 결합 그룹 내의 모든 멤버 외에 이전 멤버를 포함하는 새로운 그룹의 형성을 시도할 것이다(도 2c 참조). 이것은 새로운 그룹의 모든 멤버들에 "PTC"("커미트 준비")를 송신함으로써 달성된다.
"PTC" 메시지를 수신하는 노드들은 도 2d에 도시된 바와 같이, "PTC_ACK" 메시지로 응답한다. "PTC_ACK" 메시지가 수신된 모든 노드는 새로운 그룹에 포함된다. 상기 그룹 리더(GL1)는 "COMMIT" 메시지를 모든 새로운 그룹 멤버에 송신하며, 이 메시지는 전체 그룹 멤버십 리스트를 포함한다. 도 2e 참조하면, "COMMIT" 메시지의 전송을 더 빠르게 하기 위해, "COMMIT_BCAST" 메시지가 그룹 리더에 의해 "메이어들(mayors)"(12)로 불려지는 소수의 노드들에 전송되며, 그것들의 각각은 각 메이어가 담당하고 있는 서브 그룹 내의 모든 멤버에 "COMMIT" 메시지를 전송할 것이다 (도 2f 참조). (네트워크가 비신뢰성인 것으로 추정되기 때문에, "PTC", "COMMIT_BCAST", 및 "COMMIT" 같은 메시지는, 수신 확인이 수신되지 않는 경우, 다수회 재시도된다.)
"COMMIT" 메시지의 수신은 새로운 그룹으로의 전송을 표시하며, 이것은 과거 멤버에 결합 멤버를 더한 것을 포함한다. 이 메시지를 수신한 후에, 각 그룹 멤버는 그것의 (가능한 새로운) 다운스트림 이웃으로 "HEART BEAT" 메시지 전송을 시작한다.
노드가 초기화되는 경우, 그것은 그 각 어댑터 내에서 (상기 노드가 그룹 리더인) 단독개체 어댑터 그룹을 형성한다. 그 다음 상기 노드가 "PROCLAIM" 메시지를 송신하고 수신하기 시작한다.
이제 도 3a-3c 참조하면, 노드는 그의 "업스트림 이웃(upstream neighbor)" (그룹 멤버 중에서 두번째로 가장 높은 IP 어드레스를 가지는 그룹 내의 어댑터)으로부터 오는 "HEART BEAT" 메시지(20)(도 3a 참조)를 모니터할 것이다. 임의의 소정 시간 동안 "HEART BEAT" 메시지가 수신되지 않은 경우, 상기 "업스트림 이웃"은 고장인 것으로 가정된다. 그 다음 "DEATH" 메시지가 새로운 그룹이 형성될 필요가 있는 그룹 리더에 전송된다.
"DEATH" 메시지를 수신하는 경우, 그룹 리더는, 고장인 것으로 검출된 어댑터를 제외한 현재 그룹 내의 모든 어댑터를 포함하는 새로운 그룹을 형성하려고 시도한다. 도 3c에 도시된 바와 같이, 그룹 리더는 새로운 그룹의 모든 멤버에 "PTC" 메시지를 전송한다. 그 다음, 프로토콜은 JOIN 프로토콜에 대해 위에서 기술된 것과 동일한 시퀀스를 따른다.
노드 도달 가능성 프로토콜(node reachability protocol)은 로컬 노드로부터 도달가능한 (그리고 따라서 동작하는 것으로 간주되는) 노드 세트를 산정할 수 있도록 하는데 사용된다. 모든 노드가 동일한 네트워크에 접속되지 않을 수도 있기 때문에, 몇몇 노드는 단지 다중 네트워크 홉의 시퀀스를 통하여 도달될 수 있다. 모든 네트워크에 대한 정보는, 모든 노드에 미치지 않는 것들에 대하여도, 고려되는 경우에만 노드 도달 가능성이 산정될 수 있다.
노드 도달 가능성을 산정하기 위해, 최종 동의(agreement) 프로토콜이 사용된다: 각 네트워크에서 도달 가능성 정보는 모든 네트워크에 전달된다; 네트워크 토폴로지가 변화하는 것을 중지할 때, 결과적으로 모든 노드가 모든 네트워크에 대해 일치하는 정보를 가질 것이다. 그다음 각 노드는 도달가능 노드의 세트를 독립적으로 산정할 수 있을 것이며 일치된 결과에 도달할 것이다.
주기적으로, 그리고 중지 기준이 그렇게 하도록 데몬에게 명령하기 전까지, 노드들은 다음의 메시지를 전송한다:
"노드 접속 메시지"(NCM 또는 NODE_CONNECTIVITY)는 모든 그룹 멤버로부터 GL에 전송된다(도 4a 참조). 주어진 네트워크용 NCM은, 그 네트워크용 AMG id 및 디스에이블된 로컬 어댑터용의 모든 "디스에이블된 AMG id들"를 더한 것을 포함한다. 노드는 로컬 어댑터들이 속하는 그룹의 각 GL에 NCM들을 전송해야 한다.
GL은 NCM들로부터 오는 모든 정보를 "노드 접속 테이블"(NCT)에 저장한다. NCT는 글로벌 네트워크 토폴리지(의 로컬 뷰)를 저장하며 시스템 내의 각 노드 및 네트워크 어댑터용 AMG id를 포함한다. 동일한 AMG id를 가지는 임의의 두개의 노드는 동일한 네트워크에 의해 상호 접속되어 있는 것으로 추정된다.
"그룹 접속 메시지"(GCM 또는 GROUP_CONNECTIVITY)는 각 GL로부터 모든 그룹 멤버에 전송된다(도 4b 참조). GCM은 AMG id 및 AMG에 속하는 노드들의 리스트를 포함한다. 또한, 이들 노드의 각각에 대해, (다른 네트워크 내의) 모든 "디스에이블된 AMG id들"의 리스트가 포함된다. GCM을 전송하기 위해 필요한 정보는 GL의 NCT로부터 추출된다.
GCM을 수신한 노드는 메시지 내의 정보로 그 자신의 NCT를 갱신한다. GCM을 수신한 데몬이, 로컬 어댑터가 속하고, 그 멤버들이 상기 GCM을 수신하지 않을 임의의 그룹들이 있다는 것을 인지하는 경우, 데몬은 이들 그룹에 GCM을 전송한다(도 4c의 노드 2를 참조). 시스템 내의 모든 노드에, GCM을 생성시킨 네트워크에 직접 접속되지 않은 것들에 대하여도 GCM을 전달하는 것이 목적이다.
도 4c에서, AMG 1에 대한 GCM은 네트워크 2를 통하여 노드 2 또는 노드 3에 의해 노드 4 및 5로 전송된다.
NCM 및 GCM로 송신되는 정보는 송신기의 NCT의 서브셋임을 주목하라.
본 발명에 따르면, GL에 의해 이미 송신된 대응 GCM이 이전 NCM에서 그 노드로부터 GL로 전송된 정보를 나타낸다면, 노드는 주어진 네트워크에 대해 NCM 전송을 중지할 수 있다. 이것은, 로컬 노드와 관계가 있는 입력 GCM에서의 정보와 최종 NCM에서 전송된 정보를 비교함으로써 실행된다.
GCM정보가 로컬 정보와 불일치되는 경우, 또는 로컬 어댑터가 접속되어 있는 임의의 네트워크에 대해 새로운 AMG id가 적절하다는 것을 데몬이 검출하는 경우 (후자는 GCM에 있는 정보를 NCT에 저장된 것과 비교함으로써 검출될 수 있다), 모든 그룹에서 NCM의 전송이 재개된다. NCM은 또한 로컬 어댑터가 디스에이블되는 것으로 검출되는 경우 다시 시작된다.
적어도 몇개의 GCM들이 시스템의 모든 (동작(live)) 노드에 도달할 것으로 추측되기 때문에, 노드는 소정 개수의 GCM들이 전송된 이후 GCM 전송을 중지할 것이다. GCM 전송은 새로운 AMG id가 형성될 때 GL에 의해 재개되며, 이것은 새로운 어댑터가 그룹을 연결시키거나 또는 존재하는 멤버가 이로부터 퇴출될 때 발생한다. 최근 파워 업된 노드가 모든 필요한 GCM들을 얻도록 하기 위해, 노드는 또한, 이것이 수신 노드의 NCT와 불일치되는 모든 NCM 또는 GCM을 수신하는 경우, GCM등의 송신을 (고정된 회수동안) 재개할 것이다. 게다가, GCM들은, 그 어댑터들 중의 하나가 "디스에이블된" 상태로 이동될 때 노드에 의해 재개된다.
이러한 메커니즘(도 6a-6h의 한 예에서 설명된)은 다음 방식으로 작동한다.
- 노드가 파워 업되고, 그의 데몬이 시작된다,
- 노드의 어댑터들이 다수의 AMG들을 결합시킨다,
- GCM들은 그들 각각의 GL들에 의해 새롭게 형성된 AMG들로 전송된다,
- GCM들은, 직접 또는 메커니즘을 전송하는 상기 GCM을 통해 모든 동작(live) 노드에 도달한다,
- 상기 도달한 GCM은 새롭게 형성된 그룹에 대한 정보를 포함하고 그리하여 NCT의 콘텐츠에 변화를 발생시키기 때문에, 새로운 GCM을 수신하는 모든 GL들은 그들의 GCM들 전송을 재개한다,
- 최근 파워 업된 노드는 모든 그룹으로부터 GCM들을 얻는다.
모든 노드가 업이면, 모든 것은, GL에 의해 송신된 (그리고 필요한 만큼 다른 네트워크로 전송된) GCM들 중 적어도 하나를 얻을 것이다. 하나의 노드가 이 지점에서 업이 아니라면, 노드가 동작할 때 재개 기준이 적용되므로, 그것은 그 이후에 파워 온될 때 GCM을 얻을 것이다.
NCM들 및 GCM들은 양쪽 모두, 어느 어댑터가 디스에이블될 때에도 노드에서 재개된다. 이것은, 노드가 토폴로지에서의 변화를 인식할 때 재개 GCM들의 방법(strategy)과 일치한다.
다음의 추론은, GCM들중 적어도 하나가 높은 확률로 모든 노드에 도달하는지 그 이유를 설명한다. 몇회 시도된 경우에도, 어떠한 GCM도 노드에 도달하지 않는다면, 이것은 보통 네트워크 문제가 존재한다는 것을 가리킨다. 그러나 AMG 내의 어댑터들이 상호 모니터하는 것으로 추측되기 때문에 네트워크 문제는 모든 GCM들이 송신되기 전에 양호하게 검출될 것이다. 네트워크 문제의 검출은 상호 통신할수 있는 어댑터들에 의해 형성된 새로운 AMG들에 의해 달성된다. 결과적으로, 새로운 GCM들이, 작동하고 있는 것으로 공지되어 있는 어댑터들을 통하여 전달될 것이다.
도 5a-5e는 본 발명에 따른 토폴로지 전달의 일 예를 나타낸다. 도 5a에는, 분산형 컴퓨팅 환경이, AMG A_1 및 AMG B_1을 각각 가지는 네트워크 1 및 2와 노드 1 내지 6을 포함하는 것으로 도시되어 있다. 상기 환경의 각 노드는 각 NCT에서 정확한 글로벌 토폴리지 구성을 갖는다. 예를 들면, 노드 5에서의 NCT가 도시된 도 5b 참조하라.
도 5c에, 노드 2는 소멸되는 것으로 추측되며, 결과적으로 새로운 어댑터 멤버십 그룹(AMG A_2)이 노드들(1, 3 및 4)에 의해 생성되게 된다. AMG A_2의 생성 시, 노드 5에서의 NCT는 도 5d에 도시되어 있으며, 컴퓨팅 환경으로부터 노드 2의 소멸을 아직 나타내고 있다.
노드 5는 AMG A_2의 노드 1 및 3에 그룹 접속 메시지를 송신하는 그룹 리더(GL1)에 의해 노드 2의 소멸을 인식하게 된다. 다음, 노드 3는, 네트워크 1 및 네트워크 2 둘다에 대해 로컬 어댑터를 가지며, 전송된 GCM을 AMG B_1의 노드 5 및 6으로 전송한다. 위에서 언급된 바와 같이, GCM의 전송은 노드 3 또는 노드 4 어느 쪽에 의해서도 이루어질 수 있는 데, 그것은 양 쪽 노드가 양 쪽 네트워크에 공통적이기 때문이다. 도 5f는 전송된 GCM의 수신시 노드 5에서 갱신된 NCT를 나타낸다. 노드 2는, 노드 5에 의해 A_2 또는 B_1으로부터의 임의의 홉핑을 통하여 도달될 수 없는 A_1의 멤버로 남아 있다는 점에서, 노드 5로부터 격리된다는 것에 주목하라.
도 6a-6h는 본 발명의 원리에 따른 토폴로지 전달의 또다른 예를 나타낸다. 이 예에서, 노드 2는 도 6a에 나타내어진 분산형 컴퓨팅 환경 내에서 동작된다. 이 환경에서는, 노드 1, 3 및 4는 AMG A_1에 속하는 반면, 노드 3 내지 6이 AMG B_1에 속한다. 도 6b는 노드 5에서의 NCT, 및 도 6a의 분산형 컴퓨팅 환경에 대한 노드 2에서의 NCT를 나타낸다.
도 6c에서, 노드 2는 이제 동작 상태이며, 새로운 어댑터 멤버십 그룹(AMG A_2)이 형성되었다. 이 때, 노드 5에서의 NCT 및 노드 2에서의 NCT에서 토폴리지 구성은 도 6d에 도시되어 있으며, 이것은 도 6b와 동일하다.
상기 노드들은 그룹 접속 메시지(GCM)를 노드 1 내지 3에 전송하는 GL1에 의해, 그리고 도 6e에 도시된 바와 같이, GCM을 노드 5 및 6에 전송하는 노드 3에 의해 새로운 AMG를 통지받는다. GCM의 수신시, 각 노드는 그의 NCT를 갱신하고, 결과적으로 도 6f에 도시된 바와 같이 노드 2에서의 NCT 및 노드 5에서의 NCT를 갱신한다. 토폴리지 갱신을 완성하기 위해, AMG B_1의 그룹 리더(2)는 그 자신의 GCM을 송신함으로써 새로운 정보에 응답하며, 이것은 노드 2에 AMG B_1을 통지한다. 도 6g에 도시된 바와 같이, GL2로부터의 GCM이 노드 3 내지 5에 송신되면서, 노드 3는 상기 메시지를 AMG A_2의 노드 1 및 노드 2에 보낸다. 노드 5에서의 NCT 및 노드 2에서의 NCT에서 갱신된 토폴리지 정보는 도 6h에 도시된다.
도 7은 본 발명에 따른 토폴리지 전달을 실행하는 그룹 리더에 대한 상태 개략도를 도시한다. 상태(1)에서, 상기 그룹 리더는 그의 그룹 내의 노드들에 GCM 메시지를 송신하고 있다. 예를 들면, 소정의 한계에 도달하는 메시지 카운트의 소정의 결과가 발생하는 경우, 상기 그룹 리더는, GCM 메시지를 그 그룹의 멤버에게 송신하지 않고 있는 제2 상태로 들어간다. 그 후에, 상기 그룹 리더는 분산형 컴퓨팅 환경에 변화가 있을 때까지 상태(2)에 있다. 특히, (1) 상기 그룹 리더가 로컬 NCT와 불일치되는 NCM을 수신하거나, (2) 상기 그룹 리더가 그의 로컬 NCT와 충돌하는 GCM을 수신하거나, (3) 상기 그룹 리더의 로컬 어댑터가 다른 AMG에 속하거나, 또는 (4) 상기 그룹 리더의 로컬 어댑터가 디스에이블되는 것으로 생각되는 경우, 상태(1)로 상기 그룹 리더는 전이한다.
이 기술분야의 당업자는 상기 설명으로부터 분산형 컴퓨팅 환경 내의 토폴로지 전달 메시지 송신을 중지하고 재개하는 메커니즘이 기술되어 있는 것을 알 수 있을 것이다. 이 메커니즘은 네트워크 토폴로지 정보를 분산형 시스템의 노드들에 주기적으로 송신할 필요성을 없애준다. 일단 토폴리지가 변화하는 것을 중지하면, 상기 시스템의 모든 GCM들은 한정된 시간 내에서 멈추게 될 것이다. 본 발명에 따른 시스템은 상기 시스템의 모든 노드들에 걸쳐 토폴로지 정보를 전송하는 토폴로지 서비스에 이용된다. 상기 NCT는,
ㆍ 로컬 노드로부터 도달가능한 노드 세트 산정.
ㆍ 패킷을 목적지에 "소스-루트"하는 신뢰성 있는 메시지(PRM)에 이용되는 루트를, 각 도달가능 노드로 산정.
을 위하여 토폴로지 서비스에 이용된다.
본 발명은, 예를 들면, 컴퓨터 이용가능 미디어를 가지는 제조 품목(예를 들면, 1이상의 컴퓨터 프로그램 제품)에 포함될 수 있다. 이 미디어는, 예를 들면, 본 발명의 효과를 제공하고 촉진하기 위해 컴퓨터 판독가능 프로그램 코드 수단을 구체화하였다. 상기 제조 품목은 컴퓨터 시스템의 일부로서 포함되거나 또는 따로 판매될 수 있다.
또한, 본 발명의 효과를 실행하기 위해 기기에 의해 판독가능한, 기기에 의해 실행가능한 적어도 하나의 명령 프로그램을 확실히 구체화한 적어도 하나의 프로그램 스토리지 장치가 될 수 있다.
여기서 도시된 순서도는 예로서 제공된다. 본 발명의 정신에서 벗어나지 않고 여기서 기술된 이들 개략도 또는 단계(또는 작용)에 여러가지 변화가 있을 수 있다. 예를 들면, 어떤 경우에, 상기 단계들은 다른 순서로 실행될 수 있거나, 또한 단계들이 추가되고, 삭제되거나 또는 변형될 수 있다. 모든 이들 변화는, 수반되는 청구범위에서 기술되는 바와 같이 본 발명의 일부를 구성하는 것으로 간주된다.
본 발명은 여기서 소정의 바람직한 실시예에 따라 상세히 기술되었으나, 한편 많은 변화 및 변형예가 이 기술분야에서의 당업자에 의해 실시될 수 있다. 따라서, 본 발명은 수반되는 청구범위에 의해 그러한 모든 변화 및 변형예를 본 발명의 정신 및 범위내로 한정하는 것으로서 포함하는 것으로 해석된다.

Claims (14)

  1. 분산형 컴퓨팅 환경에서 토폴로지 전달 방법에 있어서,
    상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 그룹 노드 중 확인된 노드로 그룹 접속 메시지(group connectivity messages)를 전송하는 단계와,
    모든 그룹 노드들로부터 상기 적어도 하나의 그룹 리더로 노드 접속 메시지(node connectivity messages)를 송신하는 단계와,
    상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 기간 동안 상기 그룹 접속 메시지의 송신을 중단하는 단계와,
    만일 상기 적어도 하나의 그룹 리더가 로컬 네트워크 접속 테이블 값과 불일치하는 노드 접속 메시지를 수신하거나, 로컬 네트워크 접속 테이블 값과 불일치하는 그룹 접속 메시지를 수신하거나, 로컬 어댑터가 상이한 어댑터 멤버쉽 그룹에 속하거나, 로컬 어댑터가 고장났다는 것을 확인하는 경우, 토폴로지가 변화하였다고 확인하는 단계와,
    상기 토폴로지의 변화를 확인할 때, 상기 분산형 컴퓨팅 환경 내에서 상기 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 단계를 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달 방법.
  2. 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템에 있어서,
    상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 노드 그룹 중 확인된 노드로 그룹 접속 메시지를 송신하는 수단과,
    모든 그룹 노드들로부터 상기 적어도 하나의 그룹 리더로 노드 접속 메시지를 전송하는 수단과,
    상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 기간 동안 상기 그룹 접속 메시지의 송신을 중단하는 수단과,
    만일 상기 적어도 하나의 그룹 리더가 로컬 네트워크 접속 테이블 값과 불일치하는 노드 접속 메시지를 수신하거나, 로컬 네트워크 접속 테이블 값과 불일치하는 그룹 접속 메시지를 수신하거나, 로컬 어댑터가 상이한 어댑터 멤버쉽 그룹에 속하거나, 로컬 어댑터가 고장났다는 것을 확인하는 경우, 토폴로지가 변화하였다고 확인하는 수단과,
    상기 토폴로지의 변화를 확인할 때, 상기 분산형 컴퓨팅 환경 내에서 상기 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 수단을 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  3. 제2항에 있어서, 상기 분산형 컴퓨팅 환경은, 각각 적어도 하나의 확인된 노드 그룹을 가지는 적어도 2개의 네트워크를 포함하며, 상기 시스템은, 상기 그룹 내의 각 확인된 노드가 연속적으로 존재한다는 것을 보장하기 위하여 적어도 두개의 네트워크의 각 그룹 내에서 하트비트 프로토콜을 사용하는 수단을 더 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  4. 제3항에 있어서, 상기 분산형 컴퓨팅 환경의 적어도 2개의 네트워크가 이종의(heterogenous) 네트워크들을 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  5. 제3항에 있어서, 상기 분산형 컴퓨팅 환경의 적어도 하나의 노드는 상기 적어도 2개의 네트워크에 상기 적어도 하나의 노드를 결합하는 적어도 2개의 어댑터를 가지며,
    상기 송신 수단은 상기 적어도 2개의 네트워크 중의 제1 네트워크 상에서 제1 그룹 리더로부터 제1 노드 그룹 중 확인된 노드로 제1 그룹 접속 메시지(GCM)들을 송신하는 수단, 및 상기 적어도 2개의 네트워크 중 제2 네트워크 상에서, 상기 적어도 하나의 노드에 의해 제2 노드 그룹에 상기 제1 GCM들을 전송하는 수단을 포함하고,
    상기 적어도 하나의 노드는 상기 제1 노드 그룹 중 확인된 노드를 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  6. 제5항에 있어서, 상기 제1 노드 그룹 중 확인된 노드 및 상기 제2 노드 그룹 중 확인된 노드에서 수신된 상기 제1 GCM들이, 로컬 네트워크 접속 테이블(NCT)을 갱신하기 위하여 상기 각 확인된 노드에 의해 사용되는 것을 특징으로 하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  7. 제5항에 있어서, 상기 송신 수단은, 제2 그룹 리더로부터 상기 제2 노드 그룹 중 확인된 노드로 제2 GCM들을 송신하는 수단, 및 상기 적어도 하나의 노드에 의해 상기 적어도 2개의 네트워크 중 상기 제1 네트워크 상에서 제1 노드 그룹으로 상기 제2 GCM들을 전달하는 수단을 더 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  8. 제7항에 있어서, 상기 제2 그룹 리더에 의해 제2 GCM들을 송신하기 위한 상기 수단은 상기 제2 그룹 리더에서 상기 전달된 제1 GCM들 내의 새로운 정보를 수신하는 것에 응답하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  9. 제7항에 있어서, 상기 중단 수단은, 상기 분산형 컴퓨팅 환경에서 상기 그룹 리더에 의한 토폴로지 변화 확인 후에 상기 그룹 리더로부터 송신된 다수의 메시지가 설정된 한계에 도달하는 경우, 상기 각 그룹 리더에 대해 그룹 접속 메시지의 상기 송신을 중단시키는 수단을 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  10. 삭제
  11. 제2항에 있어서, 상기 중단 수단은, 상기 분산형 컴퓨팅 환경내에서의 상기 토폴로지 변화 확인 후에 상기 그룹 리더로부터 송신된 다수의 메시지가 설정된 한계에 도달하는 경우, 상기 각 그룹 리더에 대해 상기 그룹 접속 메시지의 송신을 중단시키는 수단을 포함하는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  12. 제2항에 있어서, 상기 송신 수단, 상기 중단 수단, 및 상기 재개 수단은, 상기 토폴로지 전달 중에 수신 확인메시지(acknowledgment messages)를 사용하지 않고 실행되는 분산형 컴퓨팅 환경에서의 토폴로지 전달을 위한 시스템.
  13. 삭제
  14. 분산형 컴퓨팅 환경 내에서의 토폴로지 전달 방법을 실행하는 명령어들을 포함하는 컴퓨터 프로그램을 저장하는 컴퓨터로 판독가능한 기록 매체에 있어서,
    상기 분산형 컴퓨팅 환경 내에서 적어도 하나의 그룹 리더로부터 적어도 하나의 그룹 노드 중 확인된 노드로 그룹 접속 메시지를 전송하는 단계와,
    모든 그룹 노드들로부터 상기 적어도 하나의 그룹 리더로 노드 접속 메시지를 송신하는 단계와,
    상기 분산형 컴퓨팅 환경 내에서 토폴로지의 변화가 없는 시간 기간 동안 상기 그룹 접속 메시지의 송신을 중단하는 단계와,
    만일 상기 적어도 하나의 그룹 리더가 로컬 네트워크 접속 테이블 값과 불일치하는 노드 접속 메시지를 수신하거나, 로컬 네트워크 접속 테이블 값과 불일치하는 그룹 접속 메시지를 수신하거나, 로컬 어댑터가 상이한 어댑터 멤버쉽 그룹에 속하거나, 로컬 어댑터가 고장났다는 것을 확인하는 경우, 토폴로지가 변화하였다고 확인하는 단계와,
    상기 토폴로지의 변화를 확인할 때, 상기 분산형 컴퓨팅 환경 내에서 상기 적어도 하나의 그룹 리더로부터 그룹 접속 메시지의 송신을 재개하는 단계를 실행하는 것인 컴퓨터로 판독가능한 기록 매체.
KR10-2001-0024552A 2000-05-30 2001-05-07 정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달 KR100445374B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/580,945 US6885644B1 (en) 2000-05-30 2000-05-30 Topology propagation in a distributed computing environment with no topology message traffic in steady state
US09/580,945 2000-05-30

Publications (2)

Publication Number Publication Date
KR20010109080A KR20010109080A (ko) 2001-12-08
KR100445374B1 true KR100445374B1 (ko) 2004-08-25

Family

ID=24323248

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0024552A KR100445374B1 (ko) 2000-05-30 2001-05-07 정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달

Country Status (4)

Country Link
US (1) US6885644B1 (ko)
JP (1) JP3589409B2 (ko)
KR (1) KR100445374B1 (ko)
CN (1) CN1207674C (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934768B1 (en) * 2000-10-23 2005-08-23 International Business Machines Corporation Dynamic modification of fragmentation size cluster communication parameter in clustered computer system
US7027411B1 (en) * 2000-10-31 2006-04-11 Hewlett-Packard Development Company, L.P. Method and system for identifying and processing changes to a network topology
US7120693B2 (en) * 2001-05-08 2006-10-10 International Business Machines Corporation Method using two different programs to determine state of a network node to eliminate message response delays in system processing
US7203748B2 (en) * 2002-02-15 2007-04-10 International Business Machines Corporation Method for detecting the quick restart of liveness daemons in a distributed multinode data processing system
US7302692B2 (en) * 2002-05-31 2007-11-27 International Business Machines Corporation Locally providing globally consistent information to communications layers
DE50313304D1 (de) * 2002-09-10 2011-01-20 Siemens Ag Verfahren zur Kontrolle von Übertragungsressourcen eines paketorientierten Kommunikationsnetzes bei Topologieänderungen
US7383313B2 (en) * 2003-11-05 2008-06-03 Hitachi, Ltd. Apparatus and method of heartbeat mechanism using remote mirroring link for multiple storage system
US9332069B2 (en) 2012-12-28 2016-05-03 Wandisco, Inc. Methods, devices and systems for initiating, forming and joining memberships in distributed computing systems
US7430684B2 (en) * 2005-02-09 2008-09-30 International Business Machines Corporation Method to use fabric initialization to test functionality of all inter-chip paths between processors in system
US7492716B1 (en) * 2005-10-26 2009-02-17 Sanmina-Sci Method for efficiently retrieving topology-specific data for point-to-point networks
US7996093B2 (en) * 2008-01-24 2011-08-09 Rockwell Automation Technologies, Inc. Automatic controller relationship resolution
JP5111153B2 (ja) * 2008-02-22 2012-12-26 キヤノン株式会社 サーバ、デバイス管理方法、プログラム
US8903973B1 (en) 2008-11-10 2014-12-02 Tanium Inc. Parallel distributed network management
US8589732B2 (en) 2010-10-25 2013-11-19 Microsoft Corporation Consistent messaging with replication
ES2618217T3 (es) * 2012-03-02 2017-06-21 Lsis Co., Ltd. Dispositivo de comunicación y procedimiento de comunicación
US9059961B2 (en) 2012-12-21 2015-06-16 Tanium Inc. Creation and maintenance of self-organizing communication orbits in distributed networks
US11172470B1 (en) 2012-12-21 2021-11-09 Tanium Inc. System, security and network management using self-organizing communication orbits in distributed networks
US10873645B2 (en) 2014-03-24 2020-12-22 Tanium Inc. Software application updating in a local network
CN105991325B (zh) * 2015-02-10 2019-06-21 华为技术有限公司 处理至少一个分布式集群中的故障的方法、设备和系统
US9910752B2 (en) 2015-04-24 2018-03-06 Tanium Inc. Reliable map-reduce communications in a decentralized, self-organizing communication orbit of a distributed network
US11461208B1 (en) 2015-04-24 2022-10-04 Tanium Inc. Reliable map-reduce communications in a decentralized, self-organizing communication orbit of a distributed network
US11886229B1 (en) 2016-03-08 2024-01-30 Tanium Inc. System and method for generating a global dictionary and performing similarity search queries in a network
US11609835B1 (en) 2016-03-08 2023-03-21 Tanium Inc. Evaluating machine and process performance in distributed system
US10929345B2 (en) 2016-03-08 2021-02-23 Tanium Inc. System and method of performing similarity search queries in a network
US11153383B2 (en) 2016-03-08 2021-10-19 Tanium Inc. Distributed data analysis for streaming data sources
US11372938B1 (en) 2016-03-08 2022-06-28 Tanium Inc. System and method for performing search requests in a network
US10824729B2 (en) 2017-07-14 2020-11-03 Tanium Inc. Compliance management in a local network
US11188445B2 (en) 2017-08-18 2021-11-30 Vmware, Inc. Generating a temporal topology graph of a computing environment based on captured component relationship data
US10841365B2 (en) 2018-07-18 2020-11-17 Tanium Inc. Mapping application dependencies in a computer network
US11343355B1 (en) 2018-07-18 2022-05-24 Tanium Inc. Automated mapping of multi-tier applications in a distributed system
CN109951331B (zh) * 2019-03-15 2021-08-20 北京百度网讯科技有限公司 用于发送信息的方法、装置和计算集群
US11831670B1 (en) 2019-11-18 2023-11-28 Tanium Inc. System and method for prioritizing distributed system risk remediations
US11563764B1 (en) 2020-08-24 2023-01-24 Tanium Inc. Risk scoring based on compliance verification test results in a local network
US12231467B1 (en) 2021-10-19 2025-02-18 Tanium Inc. System and method for deputizing satellite endpoints

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4827411A (en) 1987-06-15 1989-05-02 International Business Machines Corporation Method of maintaining a topology database
US5101348A (en) 1988-06-23 1992-03-31 International Business Machines Corporation Method of reducing the amount of information included in topology database update messages in a data communications network
US5261085A (en) 1989-06-23 1993-11-09 Digital Equipment Corporation Fault-tolerant system and method for implementing a distributed state machine
US5093824A (en) 1990-03-27 1992-03-03 Bell Communications Research, Inc. Distributed protocol for improving the survivability of telecommunications trunk networks
US5321813A (en) * 1991-05-01 1994-06-14 Teradata Corporation Reconfigurable, fault tolerant, multistage interconnect network and protocol
FR2691312B1 (fr) 1992-05-18 1994-07-29 Telecommunications Sa Procede de gestion decentralisee du routage de communications dans un reseau de commutateurs de paquets.
US5574860A (en) * 1993-03-11 1996-11-12 Digital Equipment Corporation Method of neighbor discovery over a multiaccess nonbroadcast medium
US5732086A (en) * 1995-09-21 1998-03-24 International Business Machines Corporation System and method for determining the topology of a reconfigurable multi-nodal network
US5805578A (en) * 1995-10-27 1998-09-08 International Business Machines Corporation Automatic reconfiguration of multipoint communication channels
US5991821A (en) 1996-04-30 1999-11-23 International Business Machines Corporation Method for serializing actions of independent process groups
US5805786A (en) 1996-07-23 1998-09-08 International Business Machines Corporation Recovery of a name server managing membership of a domain of processors in a distributed computing environment
US6321270B1 (en) * 1996-09-27 2001-11-20 Nortel Networks Limited Method and apparatus for multicast routing in a network
US5995488A (en) * 1996-10-08 1999-11-30 Advanced Micro Devices, Inc. Method and apparatus for regulating data flow in networks
US6507562B1 (en) * 1998-06-30 2003-01-14 Sun Microsystems, Inc. Dynamic optimization for receivers using distance between a repair head and a member station in a repair group for receivers having a closely knit topological arrangement to locate repair heads near the member stations which they serve in tree based repair in reliable multicast protocol

Also Published As

Publication number Publication date
JP2002033752A (ja) 2002-01-31
US6885644B1 (en) 2005-04-26
CN1327204A (zh) 2001-12-19
KR20010109080A (ko) 2001-12-08
CN1207674C (zh) 2005-06-22
JP3589409B2 (ja) 2004-11-17

Similar Documents

Publication Publication Date Title
KR100445374B1 (ko) 정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달
US7069320B1 (en) Reconfiguring a network by utilizing a predetermined length quiescent state
US10674486B2 (en) System, security and network management using self-organizing communication orbits in distributed networks
US7894335B2 (en) Redundant routing capabilities for a network node cluster
US9397747B2 (en) Method and apparatus for connectivity control in a data center network
US7724644B2 (en) Node redundancy method, interface card, interface device, node device, and packet ring network system
US7835303B2 (en) Packet-switched network topology tracking method and system
JP5033856B2 (ja) ネットワーク構成の想定のための装置、システム
EP0221360A2 (en) Digital data message transmission networks and the establishing of communication paths therein
US20070008880A1 (en) Router redundancy in data communication networks
JP5764820B2 (ja) 伝送システムおよび伝送システムの制御方法
US20070177589A1 (en) Network system and node redundancy method of network system
US7774480B1 (en) Routing instances for network system management and control
JP4954420B2 (ja) 通信システム
US20040170130A1 (en) Spontaneous topology discovery in a multi-node computer system
JP4579850B2 (ja) ブレード型システムおよびコネクション管理方法
JP5518771B2 (ja) 冗長ネットワークシステム、終端装置及び中継点隣接装置
CN114125827A (zh) 一种终端管理方法、装置及集中化管理系统
JP3604380B2 (ja) データ中継方法、データ中継装置およびその装置を用いたデータ中継システム
JPH06132959A (ja) ルーティング管理システム
US20160301600A1 (en) System and method for management of network links by traffic type
CN105827533A (zh) 一种报文转发方法及装置
CN113765783A (zh) 通信方法及装置
JP2009130637A (ja) ネットワークシステム及びノード装置
JPH11143843A (ja) 複数ノード構成システムの稼働状態管理方法

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20010507

A201 Request for examination
AMND Amendment
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20011123

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20010507

Comment text: Patent Application

PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20030628

Patent event code: PE09021S01D

AMND Amendment
E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20040220

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20030628

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I

J201 Request for trial against refusal decision
PJ0201 Trial against decision of rejection

Patent event date: 20040521

Comment text: Request for Trial against Decision on Refusal

Patent event code: PJ02012R01D

Patent event date: 20040220

Comment text: Decision to Refuse Application

Patent event code: PJ02011S01I

Appeal kind category: Appeal against decision to decline refusal

Decision date: 20040729

Appeal identifier: 2004101002214

Request date: 20040521

AMND Amendment
PB0901 Examination by re-examination before a trial

Comment text: Amendment to Specification, etc.

Patent event date: 20040621

Patent event code: PB09011R02I

Comment text: Request for Trial against Decision on Refusal

Patent event date: 20040521

Patent event code: PB09011R01I

Comment text: Amendment to Specification, etc.

Patent event date: 20030826

Patent event code: PB09011R02I

Comment text: Amendment to Specification, etc.

Patent event date: 20011123

Patent event code: PB09011R02I

B701 Decision to grant
PB0701 Decision of registration after re-examination before a trial

Patent event date: 20040729

Comment text: Decision to Grant Registration

Patent event code: PB07012S01D

Patent event date: 20040702

Comment text: Transfer of Trial File for Re-examination before a Trial

Patent event code: PB07011S01I

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20040812

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20040813

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee