KR20190125987A - 공간 오디오 처리를 위한 2-스테이지 오디오 포커스 - Google Patents
공간 오디오 처리를 위한 2-스테이지 오디오 포커스 Download PDFInfo
- Publication number
- KR20190125987A KR20190125987A KR1020197026954A KR20197026954A KR20190125987A KR 20190125987 A KR20190125987 A KR 20190125987A KR 1020197026954 A KR1020197026954 A KR 1020197026954A KR 20197026954 A KR20197026954 A KR 20197026954A KR 20190125987 A KR20190125987 A KR 20190125987A
- Authority
- KR
- South Korea
- Prior art keywords
- spatial
- audio signal
- microphone
- focus
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/405—Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/003—Digital PA systems using, e.g. LAN or internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/005—Audio distribution systems for home, i.e. multi-room use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
도 1은 기존의 오디오 포커스 시스템을 도시하고 있다.
도 2는 기존의 공간 오디오 포맷 생성기를 개략적으로 도시하고 있다.
도 3은 일부 실시예에 따라 공간 오디오 포맷 지원을 구현하는 예시적인 2-스테이지 오디오 포커스 시스템을 개략적으로 도시하고 있다.
도 4는 일부 실시예에 따라 도 3에 개략적으로 도시된 예시적인 2-스테이지 오디오 포커스 시스템을 더욱 상세하게 도시하고 있다.
도 5(a) 및 도 5(b)는 일부 실시예에 따라 도 3 및 도 4에 도시된 시스템에 도시된 바와 같이 빔 포밍을 구현하기 위한 예시적인 마이크로폰 쌍 빔 포밍을 개략적으로 도시하고 있다.
도 6은 일부 실시예에 따라 단일 장치 내에 구현된 추가의 예시적인 2-스테이지 오디오 포커스 시스템을 도시하고 있다.
도 7은 일부 실시예에 따라 공간 합성 전에 공간 필터링이 적용되는 추가의 예시적인 2-스테이지 오디오 포커스 시스템을 도시하고 있다.
도 8은 빔 포밍 및 공간 합성이 오디오 신호의 캡처 및 공간 분석과 별개로 장치 내에서 구현되는 추가의 2-스테이지 오디오 포커스 시스템을 도시하고 있다.
도 9는 도 3 내지 도 8 중 어느 하나에 도시된 바와 같이 2-스테이지 오디오 포커스 시스템을 구현하기에 적합한 예시적인 장치를 도시하고 있다.
Claims (25)
- 하나 이상의 프로세서를 포함하는 장치로서,
상기 하나 이상의 프로세서는:
오디오 신호 처리를 위해 적어도 2 개의 마이크로폰 오디오 신호를 수신하는 것 - 상기 오디오 신호 처리는 공간 정보를 출력하도록 구성된 적어도 공간 오디오 신호 처리 및 포커스 정보 및 적어도 하나의 빔 포밍된 오디오 신호를 출력하도록 구성된 빔 포밍 처리를 포함함 -;
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 상기 공간 오디오 신호 처리에 기초하여 공간 정보를 결정하는 것;
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 상기 빔 포밍 처리를 위한 포커스 정보 및 적어도 하나의 빔 포밍된 오디오 신호를 결정하는 것; 및
상기 적어도 2 개의 마이크로폰 오디오 신호로부터의 상기 적어도 하나의 빔 포밍된 오디오 신호, 상기 공간 정보 및 상기 포커스 정보에 기초하여 적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 합성하기 위해 상기 적어도 하나의 빔 포밍된 오디오 신호에 공간 필터를 적용하는 것 - 이러한 방식에서, 상기 공간 필터, 상기 적어도 하나의 빔 포밍된 오디오 신호, 상기 공간 정보 및 상기 포커스 정보는 상기 적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 공간적으로 합성하는 데 사용되도록 구성됨 - 을 수행하도록 구성되는
장치.
- 제1항에 있어서,
상기 하나 이상의 프로세서는 상기 공간 정보와 상기 포커스 정보를 결합하여 결합된 메타 데이터 신호를 생성하도록 구성되는
장치.
- 하나 이상의 프로세서를 포함하는 장치로서,
상기 하나 이상의 프로세서는:
적어도 하나의 빔 포밍된 오디오 신호 및 공간 메타 데이터 정보로부터 적어도 하나의 공간 오디오 신호를 공간적으로 합성하는 것 - 상기 적어도 하나의 빔 포밍된 오디오 신호 그 자체는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리로부터 생성되며, 상기 공간 메타 데이터 정보는 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 오디오 신호 처리에 기초함 - ; 및
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 것을 수행하도록 구성되는
장치.
- 제3항에 있어서,
상기 하나 이상의 프로세서는:
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 오디오 신호 처리에 기초하여 상기 공간 정보를 결정하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호를 공간 오디오 신호 처리하는 것; 및
상기 빔 포밍 처리를 위한 상기 포커스 정보를 결정하고 상기 적어도 2 개의 마이크로폰 오디오 신호를 빔 포밍 처리하여 상기 적어도 하나의 빔 포밍된 오디오 신호를 생성하는 것을 수행하도록 더 구성되는
장치.
- 제3항 또는 제4항에 있어서,
상기 장치는 출력 채널 배열을 정의하는 오디오 출력 선택 표시자를 수신하도록 구성될 수 있고, 적어도 하나의 공간 오디오 신호를 공간적으로 합성하도록 구성된 장치는 상기 오디오 출력 선택 표시자에 기초한 포맷으로 상기 적어도 하나의 공간 오디오 신호를 생성하도록 더 구성되는
장치.
- 제3항 내지 제5항 중 어느 한 항에 있어서,
상기 장치는 공간 필터링을 정의하는 오디오 필터 선택 표시자를 수신하도록 구성되고, 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 구성된 장치는 상기 오디오 필터 선택 표시자와 관련된 적어도 하나의 포커스 필터 파라미터에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 더 구성되며,
상기 적어도 하나의 필터 파라미터는:
방위각 및/또는 고도 중 적어도 하나에서의 포커스 방향 및 방위각 폭 및/또는 고도의 높이에서의 포커스 섹터 중 적어도 하나를 정의하는 적어도 하나의 공간 포커스 필터 파라미터;
포커싱되는 상기 적어도 하나의 공간 오디오 신호의 적어도 하나의 주파수 대역을 정의하는 적어도 하나의 주파수 포커스 필터 파라미터;
상기 적어도 하나의 공간 오디오 신호에 대한 감쇠 포커스 효과의 강도를 정의하는 적어도 하나의 감쇠 포커스 필터 파라미터;
상기 적어도 하나의 공간 오디오 신호에 대한 포커스 효과의 강도를 정의하는 적어도 하나의 이득 포커스 필터 파라미터; 및
상기 적어도 하나의 공간 오디오 신호의 공간 필터를 구현할지 또는 바이패스할지를 정의하는 포커스 바이패스 필터 파라미터 중 적어도 하나를 포함하는
장치.
- 제6항에 있어서,
상기 오디오 필터 선택 표시자는 헤드 트래커 입력에 의해 제공되는
장치.
- 제7항에 있어서,
상기 포커스 정보는 상기 헤드 트래커 입력에 의해 제공된 상기 오디오 필터 선택 표시자의 처리를 가능하게 하도록 구성된 스티어링 모드 표시자를 포함하는
장치.
- 제3항 내지 제8항 중 어느 한 항에 있어서,
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리에 기초한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 구성된 장치는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리의 효과를 상쇄시키기 위해 상기 적어도 하나의 공간 오디오 신호를 적어도 부분적으로 공간적으로 필터링하도록 더 구성되는
장치.
- 제3항 내지 제9항 중 어느 한 항에 있어서,
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 구성된 장치는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리에 의해 크게 영향을 받지 않는 주파수 대역만을 공간적으로 필터링하도록 더 구성되는
장치.
- 제3항 내지 제10항 중 어느 한 항에 있어서,
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 구성된 장치는 상기 포커스 정보 내에 표시된 방향으로 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하도록 구성되는
장치.
- 제1항 내지 제11항 중 어느 한 항에 있어서,
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 오디오 신호 처리에 기초한 상기 공간 정보 및/또는 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 상기 포커스 정보는 상기 적어도 하나의 공간 오디오 신호의 어느 주파수 대역이 상기 빔 포밍 처리에 의해 처리되는지를 결정하도록 구성되는 주파수 대역 표시자를 포함하는
장치.
- 제1항 내지 제12항 중 어느 한 항에 있어서,
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리로부터 적어도 하나의 빔 포밍된 오디오 신호를 생성하도록 구성된 장치는 적어도 2 개의 빔 포밍된 스테레오 오디오 신호를 생성하도록 구성되는
장치.
- 제1항 내지 제13항 중 어느 한 항에 있어서,
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리로부터 적어도 하나의 빔 포밍된 오디오 신호를 생성하도록 구성된 장치는:
2 개의 미리 결정된 빔 포밍 방향 중 하나를 결정하는 것; 및
상기 2 개의 미리 결정된 빔 포밍 방향 중 하나에서 상기 적어도 2 개의 마이크로폰 오디오 신호를 빔 포밍하는 것을 수행하도록 구성되는
장치.
- 제1항 내지 제14항 중 어느 한 항에 있어서,
상기 하나 이상의 프로세서는 마이크로폰 어레이로부터 상기 적어도 2 개의 마이크로폰 오디오 신호를 수신하도록 더 구성되는
장치.
- 방법으로서,
오디오 신호 처리를 위해 적어도 2 개의 마이크로폰 오디오 신호를 수신하는 단계 - 상기 오디오 신호 처리는 공간 정보를 출력하도록 구성된 적어도 공간 오디오 신호 처리 및 포커스 정보 및 적어도 하나의 빔 포밍된 오디오 신호를 출력하도록 구성된 빔 포밍 처리를 포함함 -;
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 상기 공간 오디오 신호 처리에 기초하여 공간 정보를 결정하는 단계;
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 상기 빔 포밍 처리를 위한 포커스 정보 및 적어도 하나의 빔 포밍된 오디오 신호를 결정하는 단계; 및
상기 적어도 2 개의 마이크로폰 오디오 신호로부터의 상기 적어도 하나의 빔 포밍된 오디오 신호, 상기 공간 정보 및 상기 포커스 정보에 기초하여 적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 합성하기 위해 상기 적어도 하나의 빔 포밍된 오디오 신호에 공간 필터를 적용하는 단계 - 이러한 방식에서, 상기 공간 필터, 상기 적어도 하나의 빔 포밍된 오디오 신호, 상기 공간 정보 및 상기 포커스 정보는 상기 적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 공간적으로 합성하는 데 사용되도록 구성됨 - 를 포함하는
방법.
- 제16항에 있어서,
상기 방법은 상기 공간 정보와 상기 포커스 정보를 결합하여 결합된 메타 데이터 신호를 생성하는 단계를 더 포함하는
방법.
- 방법으로서,
적어도 하나의 빔 포밍된 오디오 신호 및 공간 메타 데이터 정보로부터 적어도 하나의 공간 오디오 신호를 공간적으로 합성하는 단계 - 상기 적어도 하나의 빔 포밍된 오디오 신호 그 자체는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리로부터 생성되며, 상기 공간 메타 데이터 정보는 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 오디오 신호 처리에 기초함 - ; 및
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 단계를 포함하는
방법.
- 제18항에 있어서,
상기 방법은
상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 오디오 신호 처리에 기초하여 상기 공간 정보를 결정하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호를 공간 오디오 신호 처리하는 단계; 및
상기 빔 포밍 처리를 위한 포커스 정보를 결정하고 상기 적어도 2 개의 마이크로폰 오디오 신호를 빔 포밍 처리하여 상기 적어도 하나의 빔 포밍된 오디오 신호를 생성하는 단계를 더 포함하는
방법.
- 제18항 또는 제19항에 있어서,
상기 방법은 출력 채널 배열을 정의하는 오디오 출력 선택 표시자를 수신하는 단계를 더 포함하고, 적어도 하나의 공간 오디오 신호를 공간적으로 합성하는 단계는 상기 오디오 출력 선택 표시자에 기초한 포맷으로 상기 적어도 하나의 공간 오디오 신호를 생성하는 단계를 포함하는
방법.
- 제18항 내지 제20항 중 어느 한 항에 있어서,
상기 방법은 공간 필터링을 정의하는 오디오 필터 선택 표시자를 수신하는 단계를 포함하고, 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 단계는 상기 오디오 필터 선택 표시자와 관련된 적어도 하나의 포커스 필터 파라미터에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 단계를 포함하며,
상기 적어도 하나의 필터 파라미터는:
방위각 및/또는 고도 중 적어도 하나에서의 포커스 방향 및 방위각 폭 및/또는 고도의 높이에서의 포커스 섹터 중 적어도 하나를 정의하는 적어도 하나의 공간 포커스 필터 파라미터;
포커싱되는 상기 적어도 하나의 공간 오디오 신호의 적어도 하나의 주파수 대역을 정의하는 적어도 하나의 주파수 포커스 필터 파라미터;
상기 적어도 하나의 공간 오디오 신호에 대한 감쇠 포커스 효과의 강도를 정의하는 적어도 하나의 감쇠 포커스 필터 파라미터;
상기 적어도 하나의 공간 오디오 신호에 대한 포커스 효과의 강도를 정의하는 적어도 하나의 이득 포커스 필터 파라미터; 및
상기 적어도 하나의 공간 오디오 신호의 공간 필터를 구현할지 또는 바이패스할지를 정의하는 포커스 바이패스 필터 파라미터 중 적어도 하나를 포함하는
방법.
- 제21항에 있어서,
상기 방법은 헤드 트래커로부터 상기 오디오 필터 선택 표시자를 수신하는 단계를 더 포함하는
방법.
- 제22항에 있어서,
상기 포커스 정보는 상기 오디오 필터 선택 표시자의 처리를 가능하게 하도록 구성된 스티어링 모드 표시자를 포함하는
방법.
- 제18항 내지 제23항 중 어느 한 항에 있어서,
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리에 기초한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 단계는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리의 효과를 상쇄시키기 위해 상기 적어도 하나의 공간 오디오 신호를 적어도 부분적으로 공간적으로 필터링하는 단계를 포함하는
방법.
- 제18항 내지 제24항 중 어느 한 항에 있어서,
적어도 하나의 포커싱된 공간적으로 처리된 오디오 신호를 제공하기 위해 상기 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리를 위한 포커스 정보에 기초하여 상기 적어도 하나의 공간 오디오 신호를 공간적으로 필터링하는 단계는 적어도 2 개의 마이크로폰 오디오 신호와 관련된 빔 포밍 처리에 의해 크게 영향을 받지 않는 주파수 대역만을 공간적으로 필터링하는 단계를 포함하는
방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1702578.4 | 2017-02-17 | ||
GB1702578.4A GB2559765A (en) | 2017-02-17 | 2017-02-17 | Two stage audio focus for spatial audio processing |
PCT/FI2018/050057 WO2018154175A1 (en) | 2017-02-17 | 2018-01-24 | Two stage audio focus for spatial audio processing |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190125987A true KR20190125987A (ko) | 2019-11-07 |
KR102214205B1 KR102214205B1 (ko) | 2021-02-10 |
Family
ID=58486889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197026954A Active KR102214205B1 (ko) | 2017-02-17 | 2018-01-24 | 공간 오디오 처리를 위한 2-스테이지 오디오 포커스 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10785589B2 (ko) |
EP (1) | EP3583596A4 (ko) |
KR (1) | KR102214205B1 (ko) |
CN (1) | CN110537221B (ko) |
GB (1) | GB2559765A (ko) |
WO (1) | WO2018154175A1 (ko) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
EP3618464A1 (en) * | 2018-08-30 | 2020-03-04 | Nokia Technologies Oy | Reproduction of parametric spatial audio using a soundbar |
EP3854108A1 (en) * | 2018-09-20 | 2021-07-28 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
CA3127528A1 (en) * | 2019-01-21 | 2020-07-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs |
GB2584837A (en) * | 2019-06-11 | 2020-12-23 | Nokia Technologies Oy | Sound field related rendering |
GB2584838A (en) * | 2019-06-11 | 2020-12-23 | Nokia Technologies Oy | Sound field related rendering |
EP3783923A1 (en) | 2019-08-22 | 2021-02-24 | Nokia Technologies Oy | Setting a parameter value |
GB2589082A (en) * | 2019-11-11 | 2021-05-26 | Nokia Technologies Oy | Audio processing |
US11134349B1 (en) * | 2020-03-09 | 2021-09-28 | International Business Machines Corporation | Hearing assistance device with smart audio focus control |
WO2022010453A1 (en) * | 2020-07-06 | 2022-01-13 | Hewlett-Packard Development Company, L.P. | Cancellation of spatial processing in headphones |
US12223354B2 (en) * | 2020-08-02 | 2025-02-11 | Avatar Cognition Barcelona S.L. | Pattern recognition system, method and computer readable storage medium utilizing self-replicating nodes based on similarity measure and stored tuples |
CN115989682A (zh) * | 2020-08-27 | 2023-04-18 | 苹果公司 | 基于立体声的沉浸式编码(stic) |
TWI772929B (zh) * | 2020-10-21 | 2022-08-01 | 美商音美得股份有限公司 | 分析濾波器組 及其運算程序、音訊移頻系統 及音訊移頻程序 |
US11568884B2 (en) | 2021-05-24 | 2023-01-31 | Invictumtech, Inc. | Analysis filter bank and computing procedure thereof, audio frequency shifting system, and audio frequency shifting procedure |
US12198661B2 (en) * | 2021-09-03 | 2025-01-14 | Dolby Laboratories Licensing Corporation | Music synthesizer with spatial metadata output |
US11967335B2 (en) * | 2021-09-03 | 2024-04-23 | Google Llc | Foveated beamforming for augmented reality devices and wearables |
US20220007127A1 (en) * | 2021-09-14 | 2022-01-06 | Intel Corporation | Methods and apparatus to generate spatial audio based on computer vision |
GB2611357A (en) * | 2021-10-04 | 2023-04-05 | Nokia Technologies Oy | Spatial audio filtering within spatial audio capture |
GB2620593A (en) * | 2022-07-12 | 2024-01-17 | Nokia Technologies Oy | Transporting audio signals inside spatial audio signal |
GB2620960A (en) * | 2022-07-27 | 2024-01-31 | Nokia Technologies Oy | Pair direction selection based on dominant audio direction |
GB2620978A (en) | 2022-07-28 | 2024-01-31 | Nokia Technologies Oy | Audio processing adaptation |
CN115396783B (zh) * | 2022-08-24 | 2024-09-27 | 音曼(北京)科技有限公司 | 基于麦克风阵列的自适应波束宽度的音频采集方法及装置 |
GB202218136D0 (en) * | 2022-12-02 | 2023-01-18 | Nokia Technologies Oy | Apparatus, methods and computer programs for spatial audio processing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007078254A2 (en) * | 2006-01-05 | 2007-07-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Personalized decoding of multi-channel surround sound |
US20090252356A1 (en) * | 2006-05-17 | 2009-10-08 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US20120128174A1 (en) * | 2010-11-19 | 2012-05-24 | Nokia Corporation | Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof |
US20130044884A1 (en) * | 2010-11-19 | 2013-02-21 | Nokia Corporation | Apparatus and Method for Multi-Channel Signal Playback |
US20140105416A1 (en) * | 2012-10-15 | 2014-04-17 | Nokia Corporation | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8934640B2 (en) | 2007-05-17 | 2015-01-13 | Creative Technology Ltd | Microphone array processor based on spatial analysis |
CN102209988B (zh) * | 2008-09-11 | 2014-01-08 | 弗劳恩霍夫应用研究促进协会 | 基于麦克风信号来提供空间提示集合的设备、方法以及用于提供双声道音频信号和空间提示集合的设备 |
EP2249334A1 (en) | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
BR112012021369B1 (pt) * | 2010-02-24 | 2021-11-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho para gerar um sinal downmix intensificado e método para gerar um sinal downmix intensificado |
US9219972B2 (en) * | 2010-11-19 | 2015-12-22 | Nokia Technologies Oy | Efficient audio coding having reduced bit rate for ambient signals and decoding using same |
CN110223677A (zh) * | 2012-03-14 | 2019-09-10 | 诺基亚技术有限公司 | 空间音频信号滤波 |
EP2898506B1 (en) | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
EP2733965A1 (en) * | 2012-11-15 | 2014-05-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals |
EP2923502A4 (en) | 2012-11-20 | 2016-06-15 | Nokia Technologies Oy | DEVICE FOR ROOM ENHANCEMENT |
US10127912B2 (en) * | 2012-12-10 | 2018-11-13 | Nokia Technologies Oy | Orientation based microphone selection apparatus |
EP2982139A4 (en) | 2013-04-04 | 2016-11-23 | Nokia Technologies Oy | AUDIOVISUAL PROCESSING APPARATUS |
US9781507B2 (en) | 2013-04-08 | 2017-10-03 | Nokia Technologies Oy | Audio apparatus |
US9596437B2 (en) | 2013-08-21 | 2017-03-14 | Microsoft Technology Licensing, Llc | Audio focusing via multiple microphones |
US9747068B2 (en) | 2014-12-22 | 2017-08-29 | Nokia Technologies Oy | Audio processing based upon camera selection |
GB2540175A (en) * | 2015-07-08 | 2017-01-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
US9769563B2 (en) * | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
-
2017
- 2017-02-17 GB GB1702578.4A patent/GB2559765A/en not_active Withdrawn
-
2018
- 2018-01-24 EP EP18756902.5A patent/EP3583596A4/en active Pending
- 2018-01-24 CN CN201880025205.1A patent/CN110537221B/zh active Active
- 2018-01-24 WO PCT/FI2018/050057 patent/WO2018154175A1/en unknown
- 2018-01-24 US US16/486,176 patent/US10785589B2/en active Active
- 2018-01-24 KR KR1020197026954A patent/KR102214205B1/ko active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007078254A2 (en) * | 2006-01-05 | 2007-07-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Personalized decoding of multi-channel surround sound |
US20090252356A1 (en) * | 2006-05-17 | 2009-10-08 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US20120128174A1 (en) * | 2010-11-19 | 2012-05-24 | Nokia Corporation | Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof |
US20130044884A1 (en) * | 2010-11-19 | 2013-02-21 | Nokia Corporation | Apparatus and Method for Multi-Channel Signal Playback |
US20140105416A1 (en) * | 2012-10-15 | 2014-04-17 | Nokia Corporation | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
Also Published As
Publication number | Publication date |
---|---|
WO2018154175A1 (en) | 2018-08-30 |
US10785589B2 (en) | 2020-09-22 |
US20190394606A1 (en) | 2019-12-26 |
CN110537221A (zh) | 2019-12-03 |
KR102214205B1 (ko) | 2021-02-10 |
CN110537221B (zh) | 2023-06-30 |
GB201702578D0 (en) | 2017-04-05 |
EP3583596A4 (en) | 2021-03-10 |
EP3583596A1 (en) | 2019-12-25 |
GB2559765A (en) | 2018-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102214205B1 (ko) | 공간 오디오 처리를 위한 2-스테이지 오디오 포커스 | |
US11671781B2 (en) | Spatial audio signal format generation from a microphone array using adaptive capture | |
JP7082126B2 (ja) | デバイス内の非対称配列の複数のマイクからの空間メタデータの分析 | |
US10382849B2 (en) | Spatial audio processing apparatus | |
US9820037B2 (en) | Audio capture apparatus | |
US11659349B2 (en) | Audio distance estimation for spatial audio processing | |
JP2020500480A5 (ko) | ||
US11284211B2 (en) | Determination of targeted spatial audio parameters and associated spatial audio playback | |
CN117412237A (zh) | 合并音频信号与空间元数据 | |
CN113597776B (zh) | 参数化音频中的风噪声降低 | |
CN105264911A (zh) | 音频设备 | |
CN112133316B (zh) | 空间音频表示和渲染 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20190916 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20190916 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200527 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201125 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210203 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210203 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240109 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20250106 Start annual number: 5 End annual number: 5 |