[go: up one dir, main page]

KR20170013860A - 오브젝트-기반 원격 회의 프로토콜 - Google Patents

오브젝트-기반 원격 회의 프로토콜 Download PDF

Info

Publication number
KR20170013860A
KR20170013860A KR1020167027362A KR20167027362A KR20170013860A KR 20170013860 A KR20170013860 A KR 20170013860A KR 1020167027362 A KR1020167027362 A KR 1020167027362A KR 20167027362 A KR20167027362 A KR 20167027362A KR 20170013860 A KR20170013860 A KR 20170013860A
Authority
KR
South Korea
Prior art keywords
teleconference
participants
protocol
teleconferencing
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020167027362A
Other languages
English (en)
Inventor
앨런 크레머
Original Assignee
컴히어, 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 컴히어, 인코퍼레이티드 filed Critical 컴히어, 인코퍼레이티드
Publication of KR20170013860A publication Critical patent/KR20170013860A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F17/30017
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1827Network arrangements for conference optimisation or adaptation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/401Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference
    • H04L65/4015Support for services or applications wherein the services involve a main real-time session and one or more additional parallel real-time or time sensitive sessions, e.g. white board sharing or spawning of a subconference where at least one of the additional parallel sessions is real time or time sensitive, e.g. white board sharing, collaboration or spawning of a subconference
    • H04L65/607
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • H04L67/18
    • H04L67/36
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/561Adding application-functional data or data for application control, e.g. adding metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/75Indicating network or usage conditions on the user display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

원격 회의 이벤트에서 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공할 때 사용하기 위한 오브젝트-기반 원격 회의 프로토콜이 제공된다. 오브젝트-기반 원격 회의 프로토콜은 복수의 스피치 신호로부터 형성된 하나 이상의 음성 패킷을 포함한다. 하나 이상의 태깅된 음성 패킷은 음성 패킷들로부터 형성된다. 태깅된 음성 패킷들은 메타데이터 패킷 식별자를 포함한다. 인터리빙된 송신 스트림은 태깅된 음성 패킷들로부터 형성된다. 하나 이상의 시스템은 태깅된 음성 패킷들을 수신하도록 구성된다. 하나 이상의 시스템은 원격 회의 이벤트의 참가자들의 상호 작용적 공간 구성을 허용하기 위해 추가로 구성된다.

Description

오브젝트-기반 원격 회의 프로토콜{OBJECT-BASED TELECONFERENCING PROTOCOL}
관련 출원
본 출원은 2014년 3월 4일자로 출원된 미국 가출원 번호 제61/947,672호의 유익을 주장하며, 이 기초 출원의 개시 내용은 그의 전문이 참고로 본 명세서에 편입된다.
원격 회의는 비디오 및 오디오 부분들 양쪽 모두를 수반할 수 있다. 원격 회의 비디오의 품질이 꾸준히 개선되고 있지만, 원격 회의의 오디오 부분은 여전히 문제를 일으킬 수 있다. 종래의 원격 회의 시스템들(또는 프로토콜들)은 참가자들의 모두로부터 발생된 오디오 신호들을 브리지와 같은, 오디오 디바이스로 믹싱하며, 그 다음에 단일 모노럴 스트림에 다시 믹싱된 오디오 신호들을 반영하고, 현재 화자는 그 또는 그녀 자신의 오디오 신호 피드 밖으로 게이팅된다. 종래의 원격 회의 시스템들에 의해 이용된 방법들은 참가자들이 공간에서 다른 참가자들을 분리하거나 또는 그것들의 상대적 사운드 레벨들을 조작하도록 허용하지 않는다. 따라서, 종래의 원격 회의 시스템들은, 특히 많은 참가자들이 있을 때, 어떤 참가자가 말하고 있는지에 관해 혼란을 야기할 수 있으며 또한 제한된 양해도를 제공할 수 있다. 뿐만 아니라, 말하려는 의도의 명확한 시그널링이 어렵고 또 다른 화자의 언급을 향한 태도의 언어 표현들이 어려우며, 양쪽 모두는 직접 다중-참가자 원격 회의의 중요한 구성요소들일 수 있다. 또한, 종래의 원격 회의 시스템들에 의해 이용된 방법들은 원격 회의 참가자들의 서브세트 중에서 "사이드바"(sidebar)들을 허용하지 않는다.
원격 회의를 위한 다양한 다중-채널 기법을 사용함으로써 상기 논의된 문제들에 대해 개선하기 위한 시도들이 이루어져 왔다. 대안적인 접근법의 일 예는 각각의 원격 회의 참가자에 대한 별개의 통신 채널을 요구한다. 이 방법에서, 통신 채널들의 모두가 원격 회의 참가자들의 모두에 도달하는 것이 필요하다. 그 결과, 이러한 접근법은, 단독 원격 회의 참가자가 말하고 있을 수 있지만, 통신 채널들의 모두가 개방된 채로 있어야 하고, 그에 의해 원격 회의의 지속 기간 동안 대역폭을 소비하므로 비효율적이라는 것이 발견되어 왔다.
다른 원격 회의 프로토콜들은 말하고 있는 원격 회의 참가자를 식별하려고 시도한다. 그러나, 이들 원격 회의 프로토콜은 개개의 참가자들을 분리하는데 어려움을 가질 수 있으며, 그에 의해 일반적으로 말하고 있는 원격 회의 참가자들에 대한 오디오 신호들이 단일 오디오 신호 스트림에 믹싱되므로 동시에 말하고 있는 다수의 원격 회의 참가자의 인스턴스들(일반적으로 이중 토크(double talk)로서 불림)을 야기한다.
그것은 원격 회의 프로토콜들이 개선될 수 있다면 유리할 것이다.
상기 목적들뿐만 아니라 구체적으로 열거되지 않은 다른 목적들이 원격 회의 이벤트에서 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공할 때 사용하기 위한 오브젝트-기반 원격 회의 프로토콜에 의해 달성된다. 상기 오브젝트-기반 원격 회의 프로토콜은 복수의 스피치 신호로부터 형성된 하나 이상의 음성 패킷을 포함한다. 하나 이상의 태깅된 음성 패킷은 상기 음성 패킷들로부터 형성된다. 상기 태깅된 음성 패킷들은 메타데이터 패킷 식별자를 포함한다. 인터리빙된 송신 스트림은 상기 태깅된 음성 패킷들로부터 형성된다. 하나 이상의 시스템은 상기 태깅된 음성 패킷들을 수신하도록 구성된다. 상기 하나 이상의 시스템은 원격 회의 이벤트의 참가자들의 상호 작용적 공간 구성을 허용하기 위해 추가로 구성된다.
상기 목적들뿐만 아니라 구체적으로 열거되지 않은 다른 목적들이 또한 원격 회의 이벤트에서 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법에 의해 달성된다. 상기 방법은 복수의 스피치 신호로부터 하나 이상의 음성 패킷을 형성하는 단계, 상기 하나 이상의 음성 패킷에 메타데이터 패킷 식별자를 부착하고, 그에 의해 태깅된 음성 패킷들을 형성하는 단계, 상기 태깅된 음성 패킷들로부터 인터리빙된 송신 스트림을 형성하는 단계 및 상기 인터리빙된 송신 스트림을 상기 원격 회의 참가자들에 의해 이용된 시스템들로 송신하는 단계로서, 상기 시스템들은 상기 태깅된 음성 패킷들을 수신하도록 구성되며 또한 상기 원격 회의 이벤트의 참가자들의 상호 작용적 공간 구성을 허용하도록 구성되는, 상기 송신하는 단계를 포함한다.
오브젝트-기반 원격 회의 프로토콜의 다양한 목적 및 이점은 수반되는 도면들을 고려하여 판독될 때, 본 발명의 다음의 상세한 설명으로부터 이 기술분야의 숙련자들에게 명백해질 것이다.
도 1은 기술적 메타데이터 태그(descriptive metadata tag)들을 생성 및 송신하기 위한 오브젝트-기반 원격 회의 프로토콜의 제1 부분의 개략적 도면;
도 2는 도 1의 오브젝트-기반 원격 회의 프로토콜의 제1 부분에 의해 제공된 바와 같이 기술적 메타데이터 태그의 개략적 도면;
도 3은 태깅된 음성 패킷들을 통합한 인터리빙된 송신 스트림을 예시한 오브젝트-기반 원격 회의 프로토콜의 제2 부분의 개략적 도면;
도 4a는 원격 회의 참가자들의 아치형 배열을 예시한 디스플레이의 개략적 도면;
도 4b는 원격 회의 참가자들의 선형 배열을 예시한 디스플레이의 개략적 도면;
도 4c는 원격 회의 참가자들의 교실 배열을 예시한 디스플레이의 개략적 도면.
본 발명은 이제 본 발명의 특정 실시예들을 간헐적으로 참조하여 설명될 것이다. 본 발명은, 그러나, 상이한 형태들로 구체화될 수 있으며 여기에 제시된 실시예들에 제한되는 것으로 해석되지 않아야 한다. 오히려, 이들 실시예는 본 개시가 철저하며 완전할 것이며, 이 기술 분야의 숙련자들에게 본 발명의 범위를 완전히 전달하도록 제공된다.
달리 정의되지 않는다면, 여기에서 사용된 모든 기술적 및 과학적 용어는 일반적으로 본 발명이 속하는 기술 분야에서의 숙련자에 의해 이해되는 바와 동일한 의미를 가진다. 여기에서의 본 발명의 설명에서 사용된 용어들은 단지 특정한 실시예들을 설명하기 위한 것이며 본 발명을 제한하도록 의도되지 않는다. 본 발명의 설명 및 첨부된 청구항들에서 사용된 바와 같이, 단수 형태들은, 문맥이 달리 명확하게 표시하지 않는다면, 복수 형태를 포함하도록 의도된다.
달리 표시되지 않는다면, 명세서 및 청구항들에서 사용된 바와 같이 길이, 폭, 높이 등과 같은 치수들의 양들을 표현한 모든 숫자는 용어("약")에 의해 모든 인스턴스에서 수정된 대로 이해될 것이다. 따라서, 달리 표시되지 않는다면, 명세서 및 청구항들에서 제시된 수치적 속성들은 본 발명의 실시예들에서 획득하고자 하는 원하는 속성들에 의존하여 달라질 수 있는 근사치들이다. 본 발명의 광범위한 범위를 제시하고 있는 수치적 범위들 및 파라미터들이 근사치들임에도 불구하고, 특정 예들에서 제시된 수치적 값들은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치 값들은 본질적으로 반드시 그것들 각각의 측정에서 발견된 에러에 기인한 특정한 에러들을 포함한다.
설명 및 도면은 오브젝트-기반 원격 회의 프로토콜(이후 "오브젝트-기반 프로토콜")을 개시한다. 일반적으로, 오브젝트-기반 프로토콜의 제1 양상은 원격 회의 참가자들로의 분배를 위한 기술적 메타데이터 태그들을 생성하는 것을 수반한다. 여기에서 사용된 바와 같이, 용어("기술적 메타데이터 태그")는 원격 회의 및/또는 원격 회의 참가자의 하나 이상의 양상에 대한 정보를 제공하는 데이터를 의미하는 것으로 정의된다. 하나의 비-제한적인 예로서, 기술적 메타데이터 태그는 특정 원격 회의의 아이덴티티를 수립 및/또는 유지할 수 있다. 오브젝트-기반 프로토콜의 제2 양상은 메타데이터 패킷 식별자들을 생성하며 원격 회의 참가자가 말할 때 생성된 음성 패킷들에 이를 부착하는 것을 수반한다. 오브젝트-기반 프로토콜의 제3 양상은 부착된 메타데이터 패킷 식별자들을 갖고, 각각의 참가자의 별개의 아이덴티티를 유지하기 위한 방식으로 브리지에 의해 순차적으로, 음성 패킷들을 인터리빙하며 송신하는 것을 수반한다.
이제 도 1을 참조하면, 오브젝트-기반 프로토콜의 제1 부분은 일반적으로 10a에서 도시된다. 오브젝트-기반 프로토콜(10a)의 제1 부분은 원격 회의의 착수 시 또는 진행 중인 원격 회의의 상태의 변화 시 발생한다. 원격 회의의 상태에서의 변화의 비-제한적인 예는 새로운 원격 회의 참가자가 원격 회의에 참여하거나 또는 현재 원격 회의 참가자가 새로운 룸에 들어가는 것을 포함한다.
오브젝트-기반 프로토콜(10a)의 제1 부분은 기술적 메타데이터 요소들(20a, 21a)을 형성하는 것 및 기술적 메타데이터 태그(22a)를 형성하기 위해 기술적 메타데이터 요소들(20a, 21a)을 조합하는 것을 수반한다. 특정한 실시예들에서, 기술적 메타데이터 태그들(22a)은 시스템 서버(도시되지 않음)에 의해 형성될 수 있다. 시스템 서버는 새로운 원격 회의 참가자가 원격 회의에 참여하거나 또는 원격 회의 참가자가 새로운 룸에 들어갈 때와 같은, 원격 회의의 상태에서의 변화 시 기술적 메타데이터 태그들(22a)을 송신하며 반영하도록 구성될 수 있다. 시스템 서버는 원격 회의 참가자들에 의해 사용된 컴퓨터 시스템들, 디스플레이들, 연관된 하드웨어 및 소프트웨어로 상태에서의 변화를 반영하도록 구성될 수 있다. 시스템 서버는 원격 회의의 길이 전체에 걸쳐 실시간 기술적 메타데이터 태그들(22a)의 사본을 유지하기 위해 추가로 구성될 수 있다. 용어("시스템 서버")는, 여기에서 사용된 바와 같이, 원격 회의를 용이하게 하기 위해 사용된 임의의 컴퓨터-기반 하드웨어 및 연관된 소프트웨어를 의미하는 것으로 정의된다.
이제 도 2를 참조하면, 기술적 메타데이터 태그(22a)가 개략적으로 예시된다. 기술적 메타데이터 태그(22a)는 원격 회의 참가자 및 특정 원격 회의 이벤트에 관한 정보 요소들을 포함할 수 있다. 기술적 메타데이터 태그(22a)에 포함된 정보 요소들의 예들은: 미팅 인스턴스에 대한 전역적 식별자를 제공하는 미팅 식별(30), 미팅의 발신 위치를 고유하게 식별하도록 구성된 위치 특정자(32), 개개의 회의 참가자들을 고유하게 식별하도록 구성된 참가자 식별(34), 각각의 개별적으로 식별 가능한 참가자에 대한 특권 레벨을 특정하도록 구성된 참가자 특권 레벨(36), 참가자가 현재 점유하는 "가상 회의실"을 식별하도록 구성된 룸 식별(38)(이하에서 보다 상세히 논의될 바와 같이, 가상 회의실은 동적이며, 이는 가상 회의실이 원격 회의 동안 변할 수 있음을 의미한다), 중단 없이 원격 회의 참가자들 사이에서 사적 대화를 허용하기 위해 적절한 특권 레벨들을 가진 원격 회의 참가자들에 의해 가상 회의실의 잠금을 지원하도록 구성된 룸 락(40)을 포함할 수 있다. 특정한 실시예들에서, 단지 잠금 시 룸에 에서의 이들 원격 회의 참가자만이 액세스를 가질 것이다. 부가적인 원격 회의 참가자들은 잠금 해제 및 그 후 재잠금에 의해 룸으로 초대될 수 있다. 룸 락 필드는 동적이며 회의 동안 변할 수 있다.
다시 도 2를 참조하면, 기술적 메타데이터 태그(22a)에 포함된 정보 요소들의 추가 예들은, 예를 들면, 이름, 제목, 전문 배경 등과 같은, 참가자 보완 정보(42), 및 각각의 개별적으로 식별 가능한 참가자들과 연관된 메타데이터 패킷을 고유하게 식별하도록 구성된 메타데이터 패킷 식별자(44)를 포함할 수 있다. 메타데이터 패킷 식별자(44)는 요청된 대로 국소적으로 저장된 회의 메타데이터 태그들로 인덱싱하기 위해 사용될 수 있다. 메타데이터 패킷 식별자(44)는 이하에서 보다 상세히 논의될 것이다.
다시 도 2를 참조하면, 정보 요소들(30 내지 44) 중 하나 이상은 기술적 메타데이터 태그(22a)의 필수적인 포함일 수 있다는 것이 오브젝트-기반 프로토콜(10)의 고려 과정 내에 있다. 도 2에 도시된 정보 요소들(30 내지 44)의 리스트는 철저한 리스트가 아니며 다른 원하는 정보 요소들이 포함될 수 있다는 것이 오브젝트-기반 프로토콜(10)의 고려 과정 내에 또한 있다.
다시 도 1을 참조하면, 특정한 인스턴스들에서, 메타데이터 요소들(20a, 21a)은 원격 회의 참가자들이 원격 회의 서비스들에 가입함에 따라 생성될 수 있다. 이들 메타데이터 요소의 예들은 참가자 식별(34), 회사(42), 위치(42) 등을 포함한다. 다른 인스턴스들에서, 메타데이터 요소들(20a, 21a)은 특정 원격 회의 이벤트들에 대해 요청된 대로 원격 회의 서비스들에 의해 생성될 수 있다. 이들 메타데이터 요소의 예들은 원격 회의 식별(30), 참가자 특권 레벨(36), 룸 식별(38) 등을 포함한다. 계속해서 다른 실시예들에서, 메타데이터 요소들(20a, 21a)은 다른 방법들에 의해 다른 시간들에서 생성될 수 있다.
다시 도 1을 참조하면, 송신 스트림(25)은 하나 이상의 기술적 메타데이터 태그(22a)의 스트림에 의해 형성된다. 송신 스트림(25)은 기술적 메타데이터 태그들(22a)을 브리지(26)로 운반한다. 브리지(26)는 여러 개의 기능을 위해 구성된다. 첫 번째로, 브리지(26)는 원격 회의 참가자가 원격 회의 호출에 접속함에 따라 각각의 원격 회의 참가자에 원격 회의 식별을 할당하도록 구성된다. 두 번째로, 브리지(26)는 각각의 원격 회의 참가자에 대한 기술적 메타데이터를 인식하며 저장한다. 세 번째로, 원격 회의 호출에 접속한 각각의 원격 회의 참가자의 동작은 상태의 변화로 고려되며, 상태의 임의의 변화 시, 브리지(26)는 원격 회의 참가자들의 모두에 대한 총합된 기술적 메타데이터의 현재 리스트의 사본을 다른 원격 회의 참가자들에 송신하도록 구성된다. 따라서, 원격 회의 참가자의 컴퓨터-기반 시스템의 각각은 그 후 메타데이터 식별자에 의해 인덱싱되는 원격 회의 메타데이터의 국소적 사본을 유지한다. 상기 논의되는 바와 같이, 상태의 변화는 또한 원격 회의 참가자가 원격 회의 동안 룸들을 변경하거나 또는 특권 레벨을 변경한다면 발생할 수 있다. 네 번째로, 브리지(26)는 상기 설명된 방법에 따라, 기술적 메타데이터 요소들(20a, 21a)을, 원격 회의 참가자의 컴퓨터-기반 시스템의 각각 상에 저장된 정보로 인덱싱하도록 구성된다.
다시 도 1을 참조하면, 브리지(26)는 원격 회의 참가자들(12a 내지 12d)의 각각에 상태 정보의 변화를 반영하는, 기술적 메타데이터 태그들(22a)을 송신하도록 구성된다.
상기 논의된 바와 같이, 오브젝트-기반 프로토콜의 제2 양상은 도 3에서 10b로서 도시된다. 제2 양상(10b)은 메타데이터 패킷 식별자들을 생성하며 원격 회의 참가자(12a)가 말할 때 생성된 음성 패킷들에 이를 부착하는 것을 수반한다. 참가자(12a)가 원격 회의 동안 말함에 따라, 참가자의 스피치(14a)는 방향 화살표에 의해 표시된 바와 같이, 오디오 코덱(16a)에 의해 검출된다. 예시된 실시예에서, 오디오 코덱(16a)은 참가자의 스피치(14a)를 검출하기 위해 음성 활동 검출(흔히 VAD로서 불리우는) 알고리즘을 포함한다. 그러나, 다른 실시예들에서, 오디오 코덱(16a)은 참가자의 스피치(14a)를 검출하기 위해 다른 방법들을 사용할 수 있다.
다시 도 3을 참조하면, 오디오 코덱(16a)은 스피치(14a)를 디지털 스피치 신호들(17a)로 변환하도록 구성되다. 오디오 코덱(16a)은 하나 이상의 디지털 스피치 신호(17a)를 조합함으로써 압축된 음성 패킷(18a)을 형성하기 위해 추가로 구성된다. 적절한 오디오 코덱들(16a)의 비-제한적인 예들은 캐나다, 퀘벡, 몬트리올에 본부를 둔, CodecPro에 의해 판매되는, G.723.1, G.726, G.728 및 G.729 모델들을 포함한다. 적절한 오디오 코덱(16a)의 또 다른 비-제한적인 예는 Global IP Solutions에 의해 개발된, 인터넷 저 비트레이트 코덱(iLBC)이다. 오브젝트-기반 프로토콜(10b)의 실시예는 도 3에 도시되며 오디오 코덱(16a)을 이용하는 것으로서 상기에서 설명되지만, 다른 실시예들에서, 다른 구조들, 메커니즘들 및 디바이스들이 스피치(14a)를 디지털 스피치 신호들로 변환하며 하나 이상의 디지털 스피치 신호를 조합함으로써 압축된 음성 패킷들(18a)을 형성하기 위해 사용될 수 있다는 것이 이해되어야 한다.
다시 도 3을 참조하면, 메타데이터 패킷 식별자(44)가 형성되며 음성 패킷(18a)에 부착되고, 그에 의해 태깅된 음성 패킷(27a)을 형성한다. 상기 논의된 바와 같이, 메타데이터 패킷 식별자(44)는 각각의 개별적으로 식별 가능한 원격 회의 참가자를 고유하게 식별하도록 구성된다. 메타데이터 패킷 식별자(44)는 요청된 대로 국소적으로 저장된 회의 기술 메타데이터 태그들로 인덱싱하기 위해 사용될 수 있다.
특정한 실시예들에서, 메타데이터 패킷 식별자(44)는 상기 설명된 것과 유사한 방식으로 시스템 서버(도시되지 않음)에 의해 형성되며 음성 패킷(18a)에 부착될 수 있다. 대안으로, 메타데이터 패킷 식별자(44)는 다른 프로세스들, 구성요소들 및 시스템들에 의해 형성되며 음성 패킷(18a)에 부착될 수 있다.
다시 도 3을 참조하면, 송신 스트림(25)은 하나 이상의 태깅된 음성 패킷(27a)에 의해 형성된다. 송신 스트림(25)은 상기 논의된 바와 동일한 방식으로 태깅된 음성 패킷들(27a)을 브리지(26)로 운반한다.
다시 도 3을 참조하면, 브리지(26)는 인터리빙 방식으로, 원격 회의 참가자(12a)에 의해 생성된, 태깅된 음성 패킷들(27a)을 인터리빙된 송신 스트림(28)으로 순차적으로 송신하도록 구성된다. 용어("인터리빙된")는, 여기에서 사용된 바와 같이, 태깅된 음성 패킷들(27a)이 랜덤하게 함께 믹싱되기보다는, 교번하는 방식으로, 송신 스트림(25)으로 삽입됨을 의미하는 것으로 정의된다. 인터리빙 방식으로 태깅된 음성 패킷들(27a)을 송신하는 것은 태깅된 음성 패킷들(27a)이 원격 회의 참가자(12a)의 별개의 아이덴티티를 유지하도록 허용한다.
다시 도 3을 참조하면, 인터리빙된 송신 스트림(28)은 원격 회의 참가자들(12a 내지 12d)의 컴퓨터-기반 시스템(도시되지 않음)에 제공되며, 즉 원격 회의 참가자들(12a 내지 12d)의 각각은 인터리빙 방식으로 배열된 태깅된 음성 패킷들(27a)을 가진 동일한 오디오 스트림을 수신한다. 그러나, 원격 회의 참가자의 컴퓨터-기반 시스템이 그 자신의 메타데이터 패킷 식별자(44)를 인식한다면, 그것은 참가자가 그 자신의 음성을 듣지 않도록 태깅된 음성 패킷을 무시한다.
다시 도 3을 참조하면, 태깅된 음성 패킷들(27a)은 원격 회의 참가자들이 원격 회의 프리젠테이션에 대한 제어를 갖도록 허용하기 위해 원격 회의 참가자에 의해 유리하게 이용될 수 있다. 각각의 원격 회의 참가자의 태깅된 음성 패킷들이 개별적이며 별개인 채로 있으므로, 원격 회의 참가자는 상기 참가자의 컴퓨터-기반 시스템에 의해 통합된 디스플레이(도시되지 않음) 상에서의 공간에 각각의 원격 회의 참가자를 개별적으로 배치하기 위한 유연성을 가진다. 유리하게는, 태깅된 음성 패킷들(27a)은 임의의 특정한 제어 또는 렌더링 방법을 요구하거나 또는 기대하지 않는다. 다양한 개선된 렌더링 기술이, 태깅된 음성 패킷들(27a)이 클라이언트에 이용 가능해짐에 따라 이용될 수 있으며 이용될 것이라는 것이 오브젝트-기반 프로토콜(10a, 10b)의 고려 과정 내에 있다.
이제 도 4a 내지 도 4c를 참조하면, 참가자의 디스플레이상에서의 공간에 개개의 원격 회의 참가자들을 배치하는 다양한 예가 예시된다. 먼저 도 4a를 참조하면, 원격 회의 참가자(12a)는 상대적 아치 형태로 다른 원격 회의 참가자들(12b 내지 12e)에 배치되었다. 이제 도 4b를 참조하면, 원격 회의 참가자(12a)는 상대적 선형 형태로 다른 원격 회의 참가자들(12b 내지 12e)에 배치되었다. 이제 도 4c를 참조하면, 원격 회의 참가자(12a)는 상대적 교실 좌석 형태로 다른 원격 회의 참가자들(12b 내지 12e)에 배치되었다. 원격 회의 참가자들은 임의의 상대적인 원하는 형태로 또는 디폴트 위치들로 배치될 수 있다는 것이 이해되어야 한다. 이론을 지키지 않고, 원격 회의 참가자들의 상대적인 배치는 보다 자연스러운 원격 회의 경험을 생성한다고 믿어진다.
다시 도 4c를 참조하면, 원격 회의 참가자(12a)는 유리하게는 부가적인 원격 회의 프리젠테이션 피처들에 대한 제어를 가진다. 다른 원격 회의 참가자들의 배치 외에, 원격 회의 참가자(12a)는 상대적 레벨 제어(30)에 대한 제어, 음소거(32) 및 자기-필터링(34) 피처들에 대한 제어를 가진다. 상대적 레벨 제어(30)는 원격 회의 참가자가 말하는 원격 회의 참가자의 사운드 진폭을 제어하도록 허용하며, 그에 의해 특정한 원격 회의 참가자들로 하여금 다른 원격 회의 참가자들보다 많거나 또는 적게 들리도록 허용하기 위해 구성된다. 음소거 피처(32)는 원격 회의 참가자가 원하는 대로 및 원할 때 다른 원격 회의 참가자들을 선택적으로 음소거하도록 허용하기 위해 구성된다. 음소거 피처(32)는 말하는 원격 회의 참가자의 잡음 간섭 없이 원격 회의 참가자들 사이에서 사이드-바 논의(side-bar discussion)들을 용이하게 한다. 자기-필터링 피처(34)는 활성화한 원격 회의 참가자의 메타데이터 패킷 식별자를 인식하며, 상기 원격 회의 참가자로 하여금 원격 회의 참가자가 그 자신의 음성을 듣지 않도록 그 자신의 태깅된 음성 패킷을 음소거하도록 허용하기 위해 구성된다.
오브젝트-기반 프로토콜(10a, 10b)은 알려진 원격 회의 프로토콜들에 비해 중요하며 신규의 양식들을 제공하지만, 이점들 모두가 모든 실시예에 존재하는 것은 아닐 수 있다. 첫 번째로, 오브젝트-기반 프로토콜(10a, 10b)은 참가자의 디스플레이상에 원격 회의 참가자들의 상호 작용적 공간 구성을 제공한다. 두 번째로, 오브젝트-기반 프로토콜(10a, 10b)은 다양한 원격 회의 참가자의 구성 가능한 사운드 진폭을 제공한다. 세 번째로, 오브젝트-기반 프로토콜(10)은 원격 회의 참가자들이 가상 "룸들"에서 브레이크아웃 논의들 및 사운드바들을 갖도록 허용한다. 네 번째로, 태깅된 기술적 메타데이터에서의 배경 정보의 포함은 원격 회의 참가자들에게 도움이 되는 정보를 제공한다. 다섯 번째로, 오브젝트-기반 프로토콜(10a, 10b)은 공간 분리를 통해 발신 원격 회의 지부들 및 참가자들의 식별을 제공한다. 여섯 번째로, 오브젝트-기반 프로토콜(10a, 10b)은 원격 회의 현장 전체에 걸쳐 위치된 오디오 빔 형성, 헤드폰들 또는 다수의 스피커와 같은 다양한 수단을 통해 유연한 렌더링을 제공하도록 구성된다.
특허법의 제공들에 따라, 오브젝트-기반 원격 회의 프로토콜의 동작의 원리 및 모드는 그것의 예시된 실시예들에서 설명되고 예시되었다. 그러나, 오브젝트-기반 원격 회의 프로토콜은 그것의 사상 또는 범위로부터 벗어나지 않고 구체적으로 설명되고 예시된 것과 다르게 실시될 수 있다는 것이 이해되어야 한다.

Claims (20)

  1. 원격 회의 이벤트에서 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공할 때 사용하기 위한 오브젝트-기반 원격 회의 프로토콜로서,
    복수의 스피치 신호로부터 형성된 하나 이상의 음성 패킷;
    상기 음성 패킷으로부터 형성된 하나 이상의 태깅된 음성 패킷으로서, 메타데이터 패킷 식별자를 포함하는, 상기 하나 이상의 태깅된 음성 패킷;
    상기 태깅된 음성 패킷으로부터 형성된 인터리빙된 송신 스트림; 및
    상기 태깅된 음성 패킷을 수신하도록 구성된 하나 이상의 시스템으로서, 상기 원격 회의 이벤트의 상기 참가자들의 상호 작용적 공간 구성을 허용하기 위해 추가로 구성되는, 상기 하나 이상의 시스템을 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  2. 제1항에 있어서, 상기 음성 패킷은 디지털 스피치 신호들을 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  3. 제1항에 있어서, 상기 메타데이터 패킷 식별자는 상기 원격 회의 참가자에 관한 정보를 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  4. 제1항에 있어서, 상기 메타데이터 패킷 식별자는 상기 원격 회의 이벤트에 관한 정보를 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  5. 제1항에 있어서, 상기 메타데이터 패킷 식별자 태그는 상기 원격 회의 참가자를 고유하게 식별하는 정보를 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  6. 제1항에 있어서, 기술적 메타데이터 태그(descriptive metadata tag)가 상기 원격 회의 이벤트를 호스팅하도록 구성된 원격 회의 서비스에 의해 생성된 정보를 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  7. 제1항에 있어서, 기술적 메타데이터 태그가 상기 특정 원격 회의 이벤트에 대해 생성된 정보를 포함하는, 오브젝트-기반 원격 회의 프로토콜.
  8. 제1항에 있어서, 상기 인터리빙된 송신 스트림은 상기 하나 이상의 시스템의 각각상에 저장된 정보로 상기 메타데이터 패킷 식별자를 인덱싱하도록 구성된, 브리지에 의해 형성되는, 오브젝트-기반 원격 회의 프로토콜.
  9. 제1항에 있어서, 상기 원격 회의 참가자들은 참가자의 시스템의 디스플레이상에 아치형 배열로 배치되는, 오브젝트-기반 원격 회의 프로토콜.
  10. 제1항에 있어서, 상기 참가자들의 상기 상호 작용적 공간 구성은 가상 룸들에서 다른 참가자들과의 사이드바 논의(sidebar discussion)들을 위해 제공하는, 오브젝트-기반 원격 회의 프로토콜.
  11. 원격 회의 이벤트에서 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법으로서,
    복수의 스피치 신호로부터 하나 이상의 음성 패킷을 형성하는 단계;
    상기 하나 이상의 음성 패킷에 메타데이터 패킷 식별자를 부착함으로써, 태깅된 음성 패킷들을 형성하는 단계;
    상기 태깅된 음성 패킷들로부터 인터리빙된 송신 스트림을 형성하는 단계; 및
    상기 인터리빙된 송신 스트림을 상기 원격 회의 참가자들에 의해 이용된 시스템들로 송신하는 단계로서, 상기 시스템들은 상기 태깅된 음성 패킷들을 수신하도록 구성되며 상기 원격 회의 이벤트의 참가자들의 상호 작용적 공간 구성을 허용하기 위해 추가로 구성되는, 상기 송신하는 단계를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  12. 제11항에 있어서, 상기 음성 패킷은 디지털 스피치 신호들을 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  13. 제11항에 있어서, 상기 메타데이터 패킷 식별자는 상기 원격 회의 참가자에 관한 정보를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  14. 제11항에 있어서, 상기 메타데이터 패킷 식별자는 상기 원격 회의 이벤트에 관한 정보를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  15. 제11항에 있어서, 상기 메타데이터 패킷 식별자는 상기 원격 회의 참가자를 고유하게 식별하는 정보를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  16. 제11항에 있어서, 기술적 메타데이터 태그가 상기 원격 회의 이벤트를 호스팅하도록 구성된 원격 회의 서비스에 의해 생성된 정보를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  17. 제11항에 있어서, 기술적 메타데이터 태그가 상기 특정 원격 회의 이벤트에 대해 생성된 정보를 포함하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  18. 제11항에 있어서, 상기 인터리빙된 송신 스트림은 상기 하나 이상의 시스템의 각각 상에 저장된 정보로 상기 메타데이터 패킷 식별자를 인덱싱하도록 구성된, 브리지에 의해 형성되는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  19. 제11항에 있어서, 상기 원격 회의 참가자들은 참가자의 시스템의 디스플레이상에 아치형 배열로 배치되는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
  20. 제11항에 있어서, 상기 참가자들의 상호 작용적 공간 구성은 가상 룸들에서 다른 참가자들과의 사이드바 논의들을 위해 제공하는, 원격 회의 참가자들에게 비디오 및/또는 오디오 콘텐트를 제공하기 위한 방법.
KR1020167027362A 2014-03-04 2015-03-03 오브젝트-기반 원격 회의 프로토콜 Withdrawn KR20170013860A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461947672P 2014-03-04 2014-03-04
US61/947,672 2014-03-04
PCT/US2015/018384 WO2015134422A1 (en) 2014-03-04 2015-03-03 Object-based teleconferencing protocol

Publications (1)

Publication Number Publication Date
KR20170013860A true KR20170013860A (ko) 2017-02-07

Family

ID=54055771

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167027362A Withdrawn KR20170013860A (ko) 2014-03-04 2015-03-03 오브젝트-기반 원격 회의 프로토콜

Country Status (8)

Country Link
US (1) US20170085605A1 (ko)
EP (1) EP3114583A4 (ko)
JP (1) JP2017519379A (ko)
KR (1) KR20170013860A (ko)
CN (1) CN106164900A (ko)
AU (1) AU2015225459A1 (ko)
CA (1) CA2941515A1 (ko)
WO (1) WO2015134422A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111866022B (zh) * 2015-02-03 2022-08-30 杜比实验室特许公司 感知质量比会议中原始听到的更高的后会议回放系统
US12107698B2 (en) * 2021-03-30 2024-10-01 Snap Inc. Breakout sessions based on tagging users within a virtual conferencing system
US20230138733A1 (en) * 2021-10-31 2023-05-04 Zoom Video Communications, Inc. Representation of natural eye contact within a video conferencing session

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003513538A (ja) * 1999-10-22 2003-04-08 アクティブスカイ,インコーポレイテッド オブジェクト指向ビデオシステム
US7724885B2 (en) * 2005-07-11 2010-05-25 Nokia Corporation Spatialization arrangement for conference call
US8326927B2 (en) * 2006-05-23 2012-12-04 Cisco Technology, Inc. Method and apparatus for inviting non-rich media endpoints to join a conference sidebar session
US8279254B2 (en) * 2007-08-02 2012-10-02 Siemens Enterprise Communications Gmbh & Co. Kg Method and system for video conferencing in a virtual environment
CN101527756B (zh) * 2008-03-04 2012-03-07 联想(北京)有限公司 一种电话会议的方法及系统
US20100040217A1 (en) * 2008-08-18 2010-02-18 Sony Ericsson Mobile Communications Ab System and method for identifying an active participant in a multiple user communication session
JP5669418B2 (ja) * 2009-03-30 2015-02-12 アバイア インク. グラフィカルな接続表示を用いて通信セッションを要求する来入するリクエストを管理するシステムと方法。
US10984346B2 (en) * 2010-07-30 2021-04-20 Avaya Inc. System and method for communicating tags for a media event using multiple media types
US8880412B2 (en) * 2011-12-13 2014-11-04 Futurewei Technologies, Inc. Method to select active channels in audio mixing for multi-party teleconferencing
US9749473B2 (en) * 2012-03-23 2017-08-29 Dolby Laboratories Licensing Corporation Placement of talkers in 2D or 3D conference scene

Also Published As

Publication number Publication date
JP2017519379A (ja) 2017-07-13
CN106164900A (zh) 2016-11-23
AU2015225459A1 (en) 2016-09-15
US20170085605A1 (en) 2017-03-23
WO2015134422A1 (en) 2015-09-11
CA2941515A1 (en) 2015-09-11
EP3114583A4 (en) 2017-08-16
EP3114583A1 (en) 2017-01-11

Similar Documents

Publication Publication Date Title
US9654644B2 (en) Placement of sound signals in a 2D or 3D audio conference
US6850496B1 (en) Virtual conference room for voice conferencing
EP3282669B1 (en) Private communications in virtual meetings
US9749473B2 (en) Placement of talkers in 2D or 3D conference scene
US20050271194A1 (en) Conference phone and network client
US8358599B2 (en) System for providing audio highlighting of conference participant playout
US10423382B2 (en) Teleconference recording management system
US10009475B2 (en) Perceptually continuous mixing in a teleconference
JP2010506444A (ja) 多言語会議を実現するシステム、方法、及び多地点制御装置
EP3005690B1 (en) Method and system for associating an external device to a video conference session
US9420109B2 (en) Clustering of audio streams in a 2D / 3D conference scene
US20180048683A1 (en) Private communications in virtual meetings
WO2014052431A1 (en) Method for improving perceptual continuity in a spatial teleconferencing system
US20040249967A1 (en) Primary data stream communication
US11089164B2 (en) Teleconference recording management system
KR20170013860A (ko) 오브젝트-기반 원격 회의 프로토콜
KR102069695B1 (ko) 분산 텔레프레즌스 서비스 제공 방법 및 장치
Akoumianakis et al. The MusiNet project: Towards unraveling the full potential of Networked Music Performance systems
JP2006254064A (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
US20120075408A1 (en) Technique for providing in-built audio/video bridge on endpoints capable of video communication over ip
JP2008227693A (ja) 話者映像表示制御システム、話者映像表示制御方法、話者映像表示制御プログラム、通信端末及び多地点テレビ会議システム
CN115914542B (zh) 会议的处理方法、装置和电子设备及存储介质
KR20180105594A (ko) 영상 회의 서비스를 위한 다지점 접속 제어 장치 및 방법
Sawyer Telephony shoot-out
Kim et al. 3-dimensional voice communication system for two user groups

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20160930

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination