[go: up one dir, main page]

KR101330237B1 - 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치 - Google Patents

멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치 Download PDF

Info

Publication number
KR101330237B1
KR101330237B1 KR1020117027088A KR20117027088A KR101330237B1 KR 101330237 B1 KR101330237 B1 KR 101330237B1 KR 1020117027088 A KR1020117027088 A KR 1020117027088A KR 20117027088 A KR20117027088 A KR 20117027088A KR 101330237 B1 KR101330237 B1 KR 101330237B1
Authority
KR
South Korea
Prior art keywords
signal
energy
smoothing process
long time
processed signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020117027088A
Other languages
English (en)
Other versions
KR20130023023A (ko
Inventor
리빈 장
키 장
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20130023023A publication Critical patent/KR20130023023A/ko
Application granted granted Critical
Publication of KR101330237B1 publication Critical patent/KR101330237B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 실시예에서는 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치가 제공된다. 상기 방법은, 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계(101); 상기 처리된 신호의 에너지 분포를 계산하는 단계(102); 및 상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하고, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 경우에 상기 멀티채널 신호의 채널 지연 파라미터를 조정하는 단계(103)를 포함한다.

Description

멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치 {METHOD AND APPARATUS FOR ADJUSTING CHANNEL DELAY PARAMETERS OF MULTI-CHANNEL SIGNAL}
본 발명은 통신 기술분야에 관한 것으로, 특히 멀티채널(mult-channel) 신호의 채널 지연 파라미터를 조정하는 장치 및 방법에 관한 것이다.
삭제
멀티채널 신호는 전화 회의와 게임 등 여러 분야에 널리 적용되며, 멀티 채널 신호의 인코딩/디코딩은 점점 더 중시되고 있다. 멀티채널 신호를 인코딩할 때, MPEG(Moving Pictures Experts Group, 동영상 전문가 그룹)-L II, mp3(Moving Picture Experts Group Audio Layer III, 동영상 전문가 그룹 압축 표준 오디오 계층 3), 및 AAC(Advanced Audio Coding, 고급 오디오 코딩) 등의 파형 인코딩에 기초한 종래의 인코더는 각 채널을 모두 독립적으로 인코딩한다. 이 인코딩 방법은 멀티채널 신호를 잘 복원하지만, 필요한 대역폭과 인코딩 코드율(code rate)은 모노채널(mono-channel) 신호의 그것의 수 배이다.
스테레오(stere0) 또는 멀티채널 인코딩 기술은 파라미터 스테레오 인코딩이며, 적은 대역폭을 이용하여 음향 느낌(acoustic feeling)이 원래 신호와 완전히 동일한 멀티채널 신호를 재건(reestablish)할 수 있다. 파라미터 스테레오 인코딩의 기본 사고는 다음과 같다. 인코딩 단에서, 멀티채널 신호는 모노채널 신호로 다운믹싱(down-mixing)되고, 모노채널 신호는 독립적으로 인코딩되는 한편 채널들 사이의 채널 파라미터들이 추출되며, 그 후 이들 채널 파라미터가 인코딩된다. 디코딩 단에서, 먼저, 다운믹싱된 모노채널 신호가 디코딩된 다음, 채널들 사이의 채널 파라미터들이 디코딩되어, 최종적으로 이들 채널 파라미터가 다운믹싱된 모노채널 신호와 함께 멀티채널 신호의 합성에 이용된다.
파라미터 스테레오 인코딩 시에, 일반적으로 채널들 사이의 상호관계를 설명하기 위해 사용되는 채널 파라미터들은 채널간(inter-channel) 시간차 파라미터(즉, 채널 지연 파라미터), 채널간 진폭차 파라미터 및 채널간 상관성(correlation) 파라미터를 포함한다. 채널 지연 파라미터는 채널들 사이의 지연 관계를 나타내고, 화자(speaker)의 위치를 정하는 중요한 역할을 한다.
스테레오 신호를 예로 들면, 종래기술에서 멀티채널 신호를 송신하는 방법은 다음과 같다: 스테레오 좌채널 신호와 스테레오 우채널 신호 사이의 상관성을 이용하여 좌채널과 우채널 사이의 채널 지연 파라미터가 추출되고, 인코딩 단에서 채널 지연 파라미터를 이용하여 송신되어야 하는 스테레오 신호의 좌/우 채널 신호에 대해 지연 조정을 수행하여, 두 채널 사이의 지연차를 제거한다. 그 후, 지연 조정 후에 취득된 좌/우 채널 신호를 시간 영역(time domain)에 부가하여 다운믹싱된 M 신호(합 신호, sum signal)를 취득하고, 좌/우 채널 신호 지연 조정 후에 취득된 좌/우 채널 신호를 시간 영역에서 서로 감산하여 다운믹싱된 S 신호(에지 신호, edge signal)를 취득한다.
그 후, M 신호 및 S 신호에 따라, 좌채널과 우채널의 에너지비나 채널간 진폭차 파라미터 같은, 다른 채널 파라미터들이 추출된다. 인코딩 단에서, 채널 파라미터가 송신을 위해 인코딩되고, M 신호가 송신을 위해 모노채널 방식으로 인코딩된다. 디코딩 단에서, 먼저 M 신호가 재구성되고(reconstructed), 그 후 수신된 채널 지연 파라미터에 따라 각 채널의 M 신호에 대해 인코딩 단에서와는 반대의 지연 작업이 수행되어, 송신된 스테레오 신호를 재구성한다. 그러므로, 모노채널 신호의 송신에 기초하면, 채널 파라미터들을 송신하기 위해 소량의 코드율이 제공되기만 하면, 스테레오 신호는 디코딩 단에서 재구성될 수 있다.
본 발명의 구현에 있어, 종래기술은 적어도 다음과 같은 문제가 있다. 종래기술에서, 다운믹싱 처리 후에 취득된 처리 신호(M 신호 및 S 신호를 포함함)에서 빗형 필터링 효과(comb filtering effect)가 발생할 수 있다, 즉 M 신호와 S 신호 중 적어도 하나의 어떤 특정 주파수 대역 내의 신호 주파수 영역 진폭은 매우 감쇄되고, 어떤 특정 주파수 대역 내의 신호 주파수 영역 진폭은 강화된다. 빗형 필터링 효과는 처리된 신호의 품질을 악화시켜, 재구성된 멀티채널 신호의 품질에 영향을 미친다.
본 발명의 실시예는 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치를 제공하여, 빗형 필터링 효과로 인해 처리된 신호의 품질이 바람직하지 못하게 되는 현상을 완화한다.
본 발명의 일 실시예는 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법을 제공하며, 상기 방법은
멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계;
상기 처리된 신호의 에너지 분포를 계산하는 단계; 및
상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하고, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 경우에 상기 멀티채널 신호의 채널 지연 파라미터를 조정하는 단계를 포함한다.
본 발명의 일 실시예는, 멀티채널 신호의 채널 지연 파라미터를 조정하는 장치를 제공하며, 상기 장치는
멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하도록 구성된 다운믹싱 처리 모듈;
상기 처리된 신호의 에너지 분포를 계산하도록 구성된 에너지 분포 취득 모듈; 및
상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하도록 구성된 판단 모듈; 및
상기 판단 모듈이 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단한 경우에 상기 멀티채널 신호의 채널 지연 파라미터를 조정하도록 구성된 채널 지연 파라미터 조정 모듈을 포함한다.
멀티채널 신호에 대해 다운믹싱 처리가 수행된 후에 취득한 처리된 신호의 에너지 분포에 따라, 빗형 필터링 효과가 발생하였는지를 판단하고, 빗형 필터링 효과가 발생한 것으로 결정한 후에, 멀티채널 신호의 채널 지연 파라미터가 조정되므로, 빗형 필터링 효과를 완화할 수 있고, 따라서 오디오-비디오 품질과 재구성된 멀티채널 신호의 선명도(definition)를 향상시킨다.
본 발명의 실시예에 따른 기술적 해결방안을 더욱 분명하게 설명하기 위해, 실시예의 설명에 필요한 도면에 대해 이하에 간략하게 설명한다. 명백히, 이하에 설명하는 도면은 본 발명의 일부 실시예일 뿐이며, 해당 기술분야의 당업자라면 창조적인 노력 없이도 이 도면들에 기초하여 다른 도면을 얻을 수 있다.
도 1은 본 발명의 실시예 1에 따른 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법의 처리 흐름도이다.
도 2는 본 발명의 실시예 1에 따른 멀티채널 신호의 채널 지연 파라미터를 조정하는 다른 방법의 처리 흐름도이다.
도 3은 본 발명의 실시예 1에 따른 멀티채널 신호의 채널 지연 파라미터를 조정하는 장치의 구체적인 구현의 구성도이다.
본 발명의 실시예를 더 잘 이해할 수 있도록, 이하에서는 첨부도면과 몇몇 특정 실시예를 참조하여 본 발명의 실시예에 대해 더욱 자세하게 설명하는데, 본 발명은 이 실시예들에 한정되는 것은 아니다.
본 발명의 실시예는 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법을 제공하며, 도 1에 나타낸 바와 같이, 상기 방법은 다음의 단계들을 포함한다.
단계 101: 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득한다.
단계 102: 처리된 신호의 에너지 분포를 계산한다.
단계 103: 처리된 신호의 에너지 분포에 따라, 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하고, 처리된 신호에서 빗형 필터링 효과가 발생한 경우에 멀티채널 신호의 채널 지연 파라미터를 조정한다.
본 발명의 실시예를 구체적으로 실시할 때, 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하며, 이 처리된 신호는 M 신호와 S 신호를 포함한다. 해당 기술분야의 당업자라면, 처리된 신호에서의 빗형 필터링 효과의 발생은 중 하나 이상을 포함한다는 것을 알 것이다: M 신호에서의 빗형 필터링 효과 발생; S 신호에서의 빗형 필터링 효과 발생; 그리고 M 신호와 S 신호 모두에서의 빗형 필터링 효과 발생.
본 발명의 실시예에서는, 멀티채널 신호에 대해 다운믹싱 처리를 수행한 후에 취득한 처리된 신호의 에너지 분포에 따라 빗형 필터링 효과가 발생하였는지를 판단하며, 빗형 필터링 효과가 발생하는 것으로 판단한 경우에 멀티채널 신호의 채널 지연 파라미터를 조정하므로, 빗형 필터링 효과를 완화할 수 있고, 따라서 오디오-비디오 품질과 재구성된 멀티채널 신호의 선명도를 향상시킨다. 유의할 것은, 본 발명을 구체적으로 실시할 때, 일반적으로 본 발명의 해결방안을 채택함으로써 빗형 필터링 효과를 제거할 수 있다는 것이다.
이하에 구체적인 애플리케이션 시나리오의 일 실시예를 설명한다. 설명의 편의를 위해, 이하에서는 한결같이 스트레오(좌채널와 우채널)를 사용하여 본 발명의 실시예를 설명하지만, 본 발명의 실시예는 스테레오에 한정되지 않으며 다른 멀티채널에도 적용가능하다는 것을 명백히 유의하여야 한다.
입력 신호가 좌채널과 우채널로만 이루어진 스테레오 신호가 아닌 두 채널 이상의 멀티채널 신호를 포함할 때, 이 멀티채널 신호는 스테레오 신호로 변환될 수 있으며, 구체적인 변환식은 다음과 같다:
Figure 112011089676114-pct00001
.
위 식에서,
Figure 112011089676114-pct00002
Figure 112011089676114-pct00003
는 5.1 채널 신호이고,
Figure 112011089676114-pct00004
Figure 112011089676114-pct00005
는 변환이 수행된 후의 스테레오 신호이다.
실시예 1
본 실시예에 따른 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법의 처리 흐름은 도 2에 도시되어 있으며, 다음의 단계들을 포함한다.
본 실시예에서, 입력 신호는 스테레오 좌채널 시간 영역 신호
Figure 112011089676114-pct00006
와 스테레오 우채널 시간 영역 신호
Figure 112011089676114-pct00007
이며, 여기서 k는 k 번째(제k) 프레임을 나타내고, N은 N개의 샘플링 지점을 가지는 신호의 프레임을 나타낸다.
단계 201: 스테레오 좌채널 신호와 스테레오 우채널 신호 사이의 상관성(coreelation)에 따라, 현재 프레임에 대응하는 좌채널과 우채널 사이의 채널 지연 파라미터(channel_delay)를 계산한다.
단계 202: 채널 지연 파라미터(channel_delay)에 따라, 좌채널 신호(L)와 우채널 신호(R)의 현재 프레임 신호에 대해 다운믹싱을 수행하여 처리된 신호(M 신호와 S 신호)를 취득하고, 이로써 제1 S/M비(ratio_1), 제2 S/M비(ratio_2), 제3 S/M비(ratio_3), 제4 S/M비(ratio_4) 및 장시간 평활 교차상관 계수(long smoothing cross-correlation coefficien)(long_corr)을 각각 계산한다.
채널 지연 파라미터(channel_delay)에 따라, 아래의 식 1에 의해 좌채널 신호(L)와 우채널 신호(R)의 각 프레임 신호에 대해 다운믹싱을 수행하여, 다운믹싱된 M 신호와 다운믹싱된 S 신호를 취득하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00008
식 1.
식 1에서,
Figure 112011089676114-pct00009
= channel_delay이고, k는 제k 프레임을 나타낸다.
현재 프레임의 M 신호와 S 신호는 각각 샘플링 지점을 포함하므로,
Figure 112011089676114-pct00010
Figure 112011089676114-pct00011
는 다음과 같은 표현될 수 있다:
Figure 112011089676114-pct00012
Figure 112011089676114-pct00013
.
M 신호와 S 신호를 취득한 후, 본 발명의 실시예에서는, M 신호와 S 신호 사이의 에너지 분포 특성을 구해야 하며, 이 에너지 분포 특성에 따라 다운믹싱 처리를 통해 취득한 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단한다. 유의할 것은, 본 발명자들이 본 발명의 실시 중에 빗형 필터링 효과는 M 신호 또는 S 신호에서 발생할 수 있거나, M 신호와 S 신호 모두에서 발생할 수 있음을 발견하였다는 것이다.
실제 애플리케이션에서, M 신호와 S 신호 사이의 에너지 분포 특성은 M 신호와 S 신호 사이의 에너지 파라미터비로 나타낼 수 있다. 그러므로,
Figure 112011089676114-pct00014
Figure 112011089676114-pct00015
에 따라, 제1 S/M비(ratio_1)(제1 에너지 파라미터 비)를 계산하며, 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00016
위 식에서,
Figure 112011089676114-pct00017
는 S 신호의 각 샘플링 지점의 에너지 파라미터의 합성값(superposed value)을 나타내고,
Figure 112011089676114-pct00018
는 M 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 나타내며, 계산된 ratio_1은 S 신호와 M 신호 사이의 에너지 파라미터비를 나타낸다.
ratio_1에 대해 장시간 평활을 수행하여 장기간 평활 후의 제1 S/M비(long_ratio_1)를 취득하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00019
.
위 식의 우변의
Figure 112011089676114-pct00020
은 이전 프레임에 대응하는 long_ratio_1를 나타낸다.
Figure 112011089676114-pct00021
의 값은 0에서 1까지의 범위이다, 즉
Figure 112011089676114-pct00022
이고;
Figure 112011089676114-pct00023
이며, 이것은 이들 파라미터에 대해 평활을 수행하지 않는다는 것을 나타내며, 일 실시예에서
Figure 112011089676114-pct00024
의 값은 0.5이다.
그 후, delay=0으로 가정하고, 식 1에 따라 한 그룹의 처리된 신호
Figure 112011089676114-pct00025
, 즉 제2 합 신호와
Figure 112011089676114-pct00026
, 즉 제2 에지 신호를 계산한다.
Figure 112011089676114-pct00027
Figure 112011089676114-pct00028
에 따라, 제2 S/M비(ratio_2)(제2 에너지 파라미터비)를 계산하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00029
.
ratio_2에 대해 장시간 평활을 수행하여 장시간 평활 후의 제2 S/M비(long_ratio_2)를 취득하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00030
.
위 식의 우변의
Figure 112011089676114-pct00031
은 이전 프레임에 대응하는 long_ratio_2를 나타낸다.
이어서, long_ratio_1 및 long_ratio_2에 따라, 제3 S/M비(ratio_3)(제3 에너지 파라미터비)를 계산하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00032
.
실제 애플리케이션에서는, ratio_1 및 ratio_2에 따라 직접 ratio_3을 추가로 계산할 수 있으며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00033
ratio_3의 기저 파라미터(floor parameter)(ratio_floor)를 계산하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00034
위 식에서,
Figure 112011089676114-pct00035
Figure 112011089676114-pct00036
는 비교 임계값이고,
Figure 112011089676114-pct00037
의 값은 0에서 3까지 범위이고,
Figure 112011089676114-pct00038
의 값은 0에서 10까지 범위이며;
Figure 112011089676114-pct00039
이고
Figure 112011089676114-pct00040
인 경우에, ratio_3에서 기저(floor)가 제거되지 않음을 나타내고(이 경우에,
Figure 112011089676114-pct00041
의 값은 항상 1이기 때문임), 일 실시예서는,
Figure 112011089676114-pct00042
이고
Figure 112011089676114-pct00043
이다.
ratio_3에 대해 기저 제거 처리(floor removing processing)를 수행하여, 신호 에너지 분포 특성의 더욱 명백한 에너지비 파라미터(ratio_4)(제4 에너지 파라미터비)를 취득하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00044
.
ratio_4에 대해 장시간 평활을 수행하여 장시간 평활 후의 제4 S/M비(long_ratio_4)를 취득하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00045
.
위 식의 우변의
Figure 112011089676114-pct00046
는 이전 프레임에 대응하는 long_ratio_4를 나타낸다.
단계 203: 취득한 S/M비 및 미리 설정된 임계값에 따라 빗형 필터링 효과가 발생하였는지를 판단하고, 빗살 필터링 효과가 발생한 경우에 채널 지연 파라미터(chnnel_delay)를 조정한다.
delay=0인 경우에 좌채널과 우채널 사이의 장시간 평활 교차상관 계수(long_corr)를 계산하며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00047
.
위 식의 우변의
Figure 112011089676114-pct00048
는 이전 프레임에 대응하는 long_corr이며,
Figure 112011089676114-pct00049
는 좌채널과 우채널 사이의 잔차 교차상관 계수(residual cross-correlation coefficient)이며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00050
위 식의 MAX_OFFSET은 상수이며, 미리 설정된 가능한 최대 채널 지연 파라미터이고, 일반적으로 MAX_OFFSET=48이며; T는 잔차 신호(residual signal)의 프레임이 T개의 샘플링 지점을 가진다는 것을 나타낸다. 위 식에서,
Figure 112011089676114-pct00051
는 좌채널 잔차 시간 영역 신호
Figure 112011089676114-pct00052
이고,
Figure 112011089676114-pct00053
는 우채널 잔차 시간 영역 신호
Figure 112011089676114-pct00054
이다.
Figure 112011089676114-pct00055
에 대해 정규화 처리(normalization processing)를 추가로 수행하여, 정규화 교차상관 계수
Figure 112011089676114-pct00056
를 취득할 수 있으며, 그 구체적인 계산 방법은 다음과 같다:
Figure 112011089676114-pct00057
.
Figure 112011089676114-pct00058
의 값은 0에서 1까지 범위이고, 일 실시예에서,
Figure 112011089676114-pct00059
의 값은 0.8이다.
취득한 ratio_1, long_ratio_1, ratio_3, long_ratio_4 및 long_corr, 그리고 미리 설정된 결정 임계값 thr3(제1 임계값), thr4(제2 임계값), thr5(제3 임계값), thr6(제4 임계값) 및 thr7(제5 임계값)에 따라, 빗형 필터링 효과가 발생하였는지를 판단하고, 구체적인 판단 조건은 다음의 4 유형을 포함한다:
조건 1: ratio_1 > thr3 또는 long_ratio_1 > thr4;
조건 2: ratio_3 > thr5 또는 long_ratio_4 > thr6;
조건 3:(ratio_1 > thr3 또는 long_ratio_1 > thr4) &&(long_corr > thr7); 그리고
조건 4:(ratio_3 > thr5 또는 long_ratio_4 > thr6) &&(long_corr > thr7).
위의 4가지 조건에서, thr3, thr4, thr5, thr6 및 thr7은 결정 임계값이고, 이 값들의 범위 서로 상이하며, thr3 및 thr4의 값은 1에서 100까지 범위이고, 예를 들면, 그 값은 5이며; thr5 및 thr6의 값은 1에서 100까지 범위이고, 예를 들면, 그 값은 10이며; thr7의 값은 0에서 1까지 범위이고, 예를 들면, 그 값은 0.35이다.
상기한 4가지 조건 중 어느 하나가 충족되면, 빗형 필터링 효과를 검출한 것으로 간주될 수 있다. 본 실시예에서, 빗형 필터링 효과가 발생한 경우에, 다운믹싱된 M 신호가 정상적인 경우보다 작은 것으로 추정하는 한편, S 신호는 비교적 큰 것으로 추정하거나, 채널 지연이 없는 경우에 좌채널과 우채널의 상관성이 큰 것으로 추정한다. 그러므로 채널 지연 파라미터(channel_delay)는 조정되어야 하고, 지연 조정 지시 플래그
Figure 112011089676114-pct00060
이며; 그렇지 않으면
Figure 112011089676114-pct00061
이다.
지연 조정 지시 플래그가 1, 즉
Figure 112011089676114-pct00062
이면, 채널 지연 파라미터는 다음의 4가지 조정 방법을 통해 간접 조정될 수 있다. 조정 방법의 요지는, delay=0인 위치에서의 정규화 교차상관 계수
Figure 112011089676114-pct00063
의 함수값(즉,
Figure 112011089676114-pct00064
)이 delay≠0인 모든 위치에서의 함수값보다 증대되거나 최대로 증대되도록 하는 것이다.
Figure 112011089676114-pct00065
에서의 최대값을 찾음으로써, 그 값에 대응하는 지연 i는 바로 그 채널 지연(channel_delay), 즉,
Figure 112011089676114-pct00066
이다. 그러므로,
Figure 112011089676114-pct00067
이 증대되면, 채널 지연은 0으로 조정될 수 있다.
조정 방법 1:
Figure 112011089676114-pct00068
, 여기서 M은 상수이고, M 값의 범위는 0에서 10 사이로, 예를 들면, 그 값은 3이다.
조정 방법 2:
Figure 112011089676114-pct00069
, 여기서 Q는 상수이고, Q값의 범위는 1에서 10000 사이로, 예를 들면, 그 값은 1000이다.
조정 방법 3:
Figure 112011089676114-pct00070
, 여기서 증폭 계수
Figure 112011089676114-pct00071
은 long_ratio_4의 직접 비례 함수이고, long_ratio_4이 클수록, 그 함수값이 커진다.
함수
Figure 112011089676114-pct00072
의 표현식은 다음과 같다:
Figure 112011089676114-pct00073
.
위 식에서, 변수 q1값의 범위는 1에서 1000 사이로, 예를 들면, 그 값은 100이다. c1값의 범위는 0에서 10 사이로, 예를 들면, 그 값은 0이다.
조정 방법 4:
Figure 112011089676114-pct00074
, 여기서 증폭 계수
Figure 112011089676114-pct00075
는 long_ratio_1의 직접 비례 함수이고, long_ratio_1이 클수록 그 함수값이 크다.
함수
Figure 112011089676114-pct00076
의 표현식은 다음과 같다:
Figure 112011089676114-pct00077
.
위 표현식에서, 변수 q2 값의 범위는 1에서 1000사이로, 예를 들면, 그 값은 100이고, c2 값의 범위는 0에서10 사이로, 예를 들면, 0이다.
각 조정 방법 1, 2, 3 및 4에서 식 양변의
Figure 112011089676114-pct00078
은 같은 의미, 즉 값의 갱신을 나타낸다.
유의할 것은, 바람직하게는, 전술한 처리는 정규화 교차상관 계수
Figure 112011089676114-pct00079
에 대해 수행되어, 채널 지연 파라미터의 간접 조정이라는 목적을 달성한다는 것이다. 또한, 동일한 처리가 교차상관 계수
Figure 112011089676114-pct00080
에 대해서도 수행되어 채널 지연 파라미터의 간접 조정이라는 목적을 달성할 수 있으며; 그 구체적인 처리 방법은 정규화 교차상관 계수
Figure 112011089676114-pct00081
에 대한 처리 방법과 동일하므로, 자세한 것은 여기서 다시 설명하지 않는다.
실제 애플리케이션에서, 지연 조정 지시 플레그는 1, 즉
Figure 112011089676114-pct00082
이고, 채널 지연 파라미터는 직접 더 조정될 수 있으며, 채널 지연 파라미터는 0으로 설정된다, 즉 channel_delay=0이다. 지연 파라미터의 직접 조정은 그 지연 파라미터에 관련된 몇몇 파라미터에 영향을 미칠 수 있고, 따라서 인코딩 단의 다른 부분들의 성능에 영향을 미친다. 지연 파라미터의 간접 조정은 상기한 영향을 미치지 않을 수 있으며, 그 효과는 직접 조정보다 우수하다.
본 실시예는 현재 프레임의 다운믹싱 처리된 신호에 빗형 필터링 효과가 발생하였는지를 판단할 수 있고, 그에 따라 빗형 필터링 효과가 발생한 경우 채널 지연 파라미터(channel_delay)를 제시간에 조정할 수 있어, 빗형 필터링 효과를 제거할 수 있고 오디오-비디오 품질 및
재구성된 스테레오 신호와 같은 멀티채널 신호의 선명도를 보장할 수 있다.
실시예 2
본 실시예와 실시예 1의 차이점은, 다운믹싱된 M 신호와 다운믹싱된 S 신호를 계산할 때 채택한 입력 신호가 원래의 좌채널 신호와 원래의 우채널 신호를 간단히 추출한 후에 취득한 신호라는 것이다.
본 실시예에서, 간단한 추출 처리는 원래 입력의 스테레오 좌채널 시간 영역 신호
Figure 112011089676114-pct00083
및 원래 입력의 스테레오 우채널 시간 영역 신호
Figure 112011089676114-pct00084
에 대해 수행되고, 즉 다운샘플링 처리가 수행되어, 다운샘플링된 신호
Figure 112011089676114-pct00085
Figure 112011089676114-pct00086
를 취득하며, 여기서 M은 추출 후의 신호 프레임의 샘플링 지점의 수이고, k는 제k 프레임을 나타낸다. 다운샘플링 처리 방법은 다음과 같다:
Figure 112011089676114-pct00087
.
그 후, 다운샘플링된 신호
Figure 112011089676114-pct00088
Figure 112011089676114-pct00089
를 이용하여 실시예 1에 따른 처리 흐름에 따라 빗형 필터링 효과가 발생하였는지를 판단하고, 그에 따라 채널 지연 파라미터(channel_delay)를 조정한다.
본 실시예에서는, 원래 입력의 스테레오 좌채널 시간 영역 신호 및 원래 입력의 스테레오 우채널 시간 영역 신호에 대해 다운샘플링을 수행하므로, 샘플링된 신호의 수가 감소되고, 계산량이 감소되므로, 제1 S/M비(ratio_1), 제2 S/M비(ratio_2), 제3 S/M비(ratio_3), 제4 S/M비(ratio_4) 및 장시간 평활 교차상관 계수(long_corr)의 계산 속도가 향상된다.
실시예 3
본 실시예에서는, 조정되어야 하는 채널 지연 파라미터를 검출한 경우, 즉 프레임에서
Figure 112011089676114-pct00090
을 검출한 경우, 꼬리끌림 범위(tailing range)를 설정하고, 그 프레임 후의 꼬리끌림 범위 내의 모든 프레임에 대해, 이들 프레임이 빗형 필터링 효과가 발생하는 조건을 정말 충족시키는지에 상관없이, 채널 지연 파라미터를 조정한다, 즉 이들 프레임의 지연 조정 지시 플래그가 강제로 1이 된다. 그러면, 4가지 간접 조정 방법 또는 실시예 1에 따른 직접 조정 방법을 사용하여 이들 프레임의 채널 지연 파라미터가 조정된다.
꼬리끌림 범위의 프레임은 실제 경우에 따라 설정될 수 있다, 예를 들면, 그 프레임 후의 100개 프레임의 채널 지연 파라미터가 조정되도록 설정된다.
현재 프레임에서 빗형 필터링 효과가 발생한 후에는, 이 빗형 필터링 효과가 그 다음 프레임에서 계속하여 발생할 가능성도 크다. 본 실시예는 채널 지연 파라미터의 조정된 하나의 꼬리끌림 설정하는 것과 동등하고, 조정된 꼬리끌림을 설정하는 이점은 지연 조정의 유효성 및 지속성을 최대한 보증하여, 빗형 필터링 효과가 그 다음 프레임에 계속하여 발생하는 문제를 방지하는 것이다.
본 발명의 실시에는 멀티채널 신호의 채널 지연 파라미터를 조정하는 장치를 더 제공하며, 이 장치의 구체적인 실시 구성은 도 3에 도시되어 있다. 상기 장치는 다음 구성요소를 포함한다:
멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하도록 구성된 다운믹싱 처리 모듈(301).
처리된 신호의 에너지 분포를 계산하도록 구성된 에너지 분포 취득 모듈(302).
처리된 신호의 에너지 분포에 따라, 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하도록 구성된 판단 모듈(303).
판단 모듈이 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단한 경우에 멀티채널 신호의 채널 지연 파라미터를 조정하도록 구성된 채널 지연 파라미터 조정 모듈(304).
또한, 다운믹싱 처리 모듈(301)은 멀티채널 신호의 현재 프레임 신호에 대해 다운믹싱 처리를 수행하여 합 신호 및 에지 신호를 취득하도록 구성된다.
다르게는, 다운믹싱 처리 모듈(301)은 멀티채널 신호의 현재 프레임 신호에 대해 다운샘플링을 수행하고, 다운샘플링된 신호에 대해 다운믹싱 처리를 수행하여 합 신호와 에지 신호를 취득하도록 구성된다.
또한, 다운믹싱 처리 모듈(301)은 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 취득하고, 현재 프레임의 채널 지연 파라미터에 따라 멀티채널 신호에 대해 다운믹싱을 수행하여 다운믹싱된 합 신호와 다운믹싱된 에지 신호를 취득하도록 구성된다.
에너지 분포 취득 모듈(302)은 에지 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 합 신호의 각 샘플링 지점의 에너지 파라미터의 합성값으로 나누어 제1 에너지 파라미터비를 취득하도록 구성된다.
판단 모듈(303)은 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
다르게는, 판단 모듈(303)은 장시간 평활 처리 후에 취득된 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 크면, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
또, 에너지 분포 취득 모듈(302)은 또한 멀티채널 신호의 무지연(zero delay)에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득하도록 구성된다.
판단 모듈(303)은 장기 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 결정하도록 구성되거나; 또는 판단 모듈(303)은 장기 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 장기 평활 처리 후에 취득된 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
또, 다운믹싱 처리 모듈(301)은 영(0)인 채널 지연 파라미터에 따라 멀티채널 신호에 대해 다운믹싱을 수행하여, 다운믹싱된 제2 합 신호와 다운믹싱된 제2 에지 신호를 취득하도록 구성된다.
에너지 분포 취득 모듈(302)은 또한 제2 에지 신호의 각 샘플링 지점의 에너지 파라미터들의 합성값을 제2 합 신호의 각 샘플링 지점의 에너지 파라미터들의 합성값으로 나누어 제2 에너지 파라미터비를 취득하고, 제1 에너지 파라미터비를 제2 에너지 파라미터비로 나누어 제3 에너지 파라미터비를 취득하거나; 또는 제1 에너지 파라미터비와 제2 에너지 파라미터비 각각에 대해 장시간 평활 처리를 수행하고, 장시간 평활 처리 후에 취득한 제1 에너지 파라미터비를 장시간 평활 처리 후에 취득한 제2 에너지 파라미터로 나누어 제3 에너지 파라미터비를 취득하도록, 구성된다.
판단 모듈(303)은 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
또, 에너지 분포 취득 모듈(302)은 제3 에너지 파라미터비에 대해 기저 제거 처리(floor removing processing)를 수행하여 제4 에너지 파라미터비를 취득하고, 제4 에너지 파라미터비에 대해 장시간 평활 처리를 수행하여 장시간 평활 처리 후에 취득된 제4 에너지 파라미터비를 취득한다.
판단 모듈(303)은 장시간 평활 처리 후에 취득된 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
또, 에너지 분포 취득 모듈(302)은 또한 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득한다.
판단 모듈(303)은, 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
판단 모듈(303)은, 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 장시간 평활 처리 후에 취득된 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에, 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성된다.
구체적으로 설명하면, 채널 지연 파라미터 조정 모듈(304)은 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 영(0)으로 설정하도록 구성되거나; 또는 채널 지연 파라미터 조정 모듈(304)은 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 무지연에 대응하는 그 교차상관 계수를 증가시키도록 구성되거나; 또는 채널 지연 파라미터 조정 모듈(304)은 멀티채널 신호의 무지연에 대응하는 정규화 교차상관 계수를 계산하고, 무지연에 대응하는 그 정규화 교차상관 계수를 증가시키도록 구성된다.
또, 채널 지연 파라미터 조정 모듈(304)은, 멀티채널 신호의 현재 프레임 신호의 채널 지연 파라미터를 조정한 후에, 현재 프레임 후의 꼬리끌림 범위 내의 프레임의 채널 지연 파라미터를 조정하도록 구성된다.
요컨대, 본 발명의 실시예는 다운믹싱 처리를 통해 취득한 처리된 신호의 에너지 분포에 따라 빗형 필터링 효과가 발생하였는지를 판단하고, 에너지 분포는 S 신호와 M 신호 사이의 에너지 파라미터비로 나타낼 수 있다. 빗형 필터링 효과가 발생한 경우에, 멀티채널 신호의 채널 지연 파라미터는 여러 직접 방법 및 간접 방법을 통해 조절되므로, 빗형 필터링 효과를 제거하고, 오디오-비디오 품질 및 재구성된 스테레오 신호와 같은 멀티채널 신호의 선명도를 보증한다.
해당 기술분야의 당업자라면, 본 발명의 실시예에 따른 방법의 단계 전부 또는 일부는 관련 하드웨어에 지시를 하는 프로그램으로 구현할 수 있다는 것을 알아야 한다. 이 프로그램은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다. 이 프로그램이 실행될 때, 본 발명의 실시예에 따른 방법의 단계들이 수행된다. 저장 매체는 자기 디스크, 광 디스크, 판독 전용 메모리(ROM), 또는 임의 접근 메모리(RAM)일 수 있다.
이상에서는 본 발명을 몇몇 예시적인 실시예를 사용하여 설명하였지만, 본 발명의 보호 범위는 이에 한정되지 않는다. 본 발명의 기술 범위를 벗어나지 않고서 해당 기술분야의 당업자가 쉽게 얻을 수 있는 다양한 변경 및 변형은, 본 발명의 보호 범위에 속한다. 그러므로, 본 발명의 보호 범위는 청구항의 보호범위에 의해 정해진다.

Claims (28)

  1. 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법으로서,
    멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계;
    상기 처리된 신호의 에너지 분포를 계산하는 단계; 및
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하고, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 경우에 상기 멀티채널 신호의 채널 지연 파라미터를 조정하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 처리된 신호는 합 신호 및 에지 신호를 포함하는, 방법.
  3. 제1항에 있어서,
    상기 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계는,
    상기 멀티채널 신호의 현재 프레임 신호에 대해 다운믹싱 처리를 수행하여 합 신호와 에지 신호를 취득하는 단계; 또는
    상기 멀티채널 신호의 현재 프레임 신호에 대해 다운샘플링을 수행하고, 상기 다운샘플링 후에 취득된 다운샘플링된 신호에 대해 다운믹싱 처리를 수행하여 합 신호와 에지 신호를 취득하는 단계
    를 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계는,
    상기 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 취득하고, 상기 현재 프레임의 채널 지연 파라미터에 따라 상기 멀티채널 신호에 대해 다운믹싱을 수행하여 다운믹싱된 합 신호와 다운믹싱된 에지 신호를 취득하는 단계를 포함하고,
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 에지 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 상기 합 신호의 각 샘플링 지점의 에너지 파라미터의 합성값으로 나누어, 제1 에너지 파라미터비를 취득하는 단계를 포함하는, 방법.
  5. 제4항에 있어서,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계; 또는
    장시간 평활 처리 후에 취득된 상기 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 큰 경우에 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  6. 제4항에 있어서,
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여, 상기 장시간 평활 처리 후의 교차상관 계수를 취득하는 단계를 더 포함하고,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계; 또는
    상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 장시간 평활 처리 후에 취득된 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  7. 제4항에 있어서,
    상기 멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하는 단계는,
    영(0)인 채널 지연 파라미터에 따라, 상기 멀티채널 신호에 대해 다운믹싱을 수행하여 다운믹싱된 제2 합 신호와 다운믹싱된 제2 에지 신호를 취득하는 단계를 더 포함하고;
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 제2 에지 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 상기 제2 합 신호의 각 샘플링 지점의 에너지 파라미터의 합성값으로 나누어, 제2 에너지 파라미터비를 취득하는 단계; 및
    상기 제1 에너지 파라미터비를 상기 제2 에너지 파라미터비로 나누어, 제3 에너지 파라미터비를 취득하거나; 또는 상기 제1 에너지 파라미터비와 상기 제2 에너지 파라미터비 각각에 대해 장시간 평활 처리를 수행하고, 장시간 평활 처리 후에 취득된 상기 제1 에너지 파라미터를 장시간 평활 처리 후에 취득된 상기 제2 에너지 파라미터로 나누어 제3 에너지 파라미터를 취득하는 단계를 더 포함하는, 방법.
  8. 제7항에 있어서,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  9. 제7항에 있어서,
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 제3 에너지 파라미터비에 대해 기저 제거 처리를 수행하여 제4 에너지 파라미터비를 취득하고, 상기 제4 에너지 파라미터비에 대해 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 상기 제4 에너지 파라미터비를 취득하는 단계를 더 포함하는, 방법.
  10. 제9항에 있어서,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 장시간 평활 처리 후에 취득된 상기 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  11. 청구항 11은(는) 설정등록료 납부시 포기되었습니다.
    제7항에 있어서,
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 상기 장시간 평활 처리 후의 교차상관 계수를 취득하는 단계를 더 포함하고,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  12. 청구항 12은(는) 설정등록료 납부시 포기되었습니다.
    제9항에 있어서,
    상기 처리된 신호의 에너지 분포를 계산하는 단계는,
    상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득하는 단계를 더 포함하고,
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하는 단계는,
    상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 장시간 평활 처리 후에 취득된 상기 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하는 단계를 포함하는, 방법.
  13. 청구항 13은(는) 설정등록료 납부시 포기되었습니다.
    제1항에 있어서,
    상기 멀티채널 신호의 채널 지연 파라미터를 조정하는 단계는,
    상기 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 영(0)으로 설정하는 단계; 또는
    상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 상기 무지연에 대응하는 교차상관 계수를 증가시키는 단계; 또는
    상기 멀티채널 신호의 무지연에 대응하는 정규화 교차상관 계수를 계산하고, 상기 무지연에 대응하는 정규화 교차상관 계수를 증가시키는 단계를 포함하는, 방법.
  14. 청구항 14은(는) 설정등록료 납부시 포기되었습니다.
    제13항에 있어서,
    상기 무지연에 대응하는 교차상관 계수를 증가시키는 단계는,
    상기 무지연에 대응하는 교차상관 계수에 상수를 더하는 단계; 또는
    상기 무지연에 대응하는 교차상관 계수에 상수를 곱하는 단계; 또는
    상기 무지연에 대응하는 교차상관 계수에 증폭 계수를 곱하는 단계를 포함하고,
    상기 증폭 계수는 상기 처리된 신호의 에너지 분포에 따라 취득되는, 방법.
  15. 청구항 15은(는) 설정등록료 납부시 포기되었습니다.
    제1항에 있어서,
    상기 멀티채널 신호의 현재 프레임 신호의 채널 지연 파라미터가 조정된 후에, 상기 현재 프레임 후의 꼬리끌림 범위 내의 프레임의 채널 지연 파라미터를 조정하는 단계를 더 포함하는 방법.
  16. 멀티채널 신호의 채널 지연 파라미터를 조정하는 장치로서,
    멀티채널 신호에 대해 다운믹싱 처리를 수행하여 처리된 신호를 취득하도록 구성된 다운믹싱 처리 모듈;
    상기 처리된 신호의 에너지 분포를 계산하도록 구성된 에너지 분포 취득 모듈; 및
    상기 처리된 신호의 에너지 분포에 따라, 상기 처리된 신호에서 빗형 필터링 효과가 발생하였는지를 판단하도록 구성된 판단 모듈; 및
    상기 판단 모듈이 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단한 경우에 상기 멀티채널 신호의 채널 지연 파라미터를 조정하도록 구성된 채널 지연 파라미터 조정 모듈
    을 포함하는 장치.
  17. 제16항에 있어서,
    상기 다운믹싱 처리 모듈은 상기 멀티채널 신호의 현재 프레임 신호에 대해 다운믹싱 처리를 수행하여 합 신호 및 에지 신호를 취득하도록 구성되거나; 또는
    상기 다운믹싱 처리 모듈은 상기 멀티채널 신호의 현재 프레임 신호에 대해 다운샘플링을 수행하고, 다운샘플링 후에 취득된 다운샘플링된 신호에 대해 다운믹싱 처리를 수행하여, 합 신호와 에지 신호를 취득하도록 구성되는, 장치.
  18. 제16항 또는 제17항에 있어서,
    상기 다운믹싱 처리 모듈은 상기 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 취득하고, 상기 현재 프레임의 채널 지연 파라미터에 따라 상기 멀티채널 신호에 대해 다운믹싱을 수행하여 다운믹싱된 합 신호와 다운믹싱된 에지 신호를 취득하도록 구성되고;
    상기 에너지 분포 취득 모듈은 상기 에지 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 상기 합 신호의 각 샘플링 지점의 에너지 파라미터의 합성값으로 나누어 제1 에너지 파라미터비를 취득하도록 구성되는, 장치.
  19. 제18항에 있어서,
    상기 판단 모듈은, 상기 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되거나; 또는
    상기 판단 모듈은, 장시간 평활 처리 후에 취득된 상기 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  20. 제18항에 있어서,
    상기 에너지 분포 취득 모듈은 또한, 상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득하도록 구성되고;
    상기 판단 모듈은, 장기 평활 처리 후에 취득된 상기 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 제1 에너지 파라미터비가 미리 설정된 제1 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 결정하도록 구성되거나; 또는 상기 판단 모듈은, 장기 평활 처리 후에 취득된 상기 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 장기 평활 처리 후에 취득된 제1 에너지 파라미터비가 미리 설정된 제2 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  21. 제18항에 있어서,
    상기 다운믹싱 처리 모듈은 또한, 영(0)인 채널 지연 파라미터에 따라 상기 멀티채널 신호에 대해 다운믹싱을 수행하여 다운믹싱된 제2 합 신호와 다운믹싱된 제2 에지 신호를 취득하도록 구성되고;
    상기 에너지 분포 취득 모듈은 또한, 상기 제2 에지 신호의 각 샘플링 지점의 에너지 파라미터의 합성값을 상기 제2 합 신호의 각 샘플링 지점의 에너지 파라미터의 합성값으로 나누어 제2 에너지 파라미터비를 취득하고, 상기 제1 에너지 파라미터비를 상기 제2 에너지 파라미터비로 나누어 제3 에너지 파라미터비를 취득하거나; 또는 상기 제1 에너지 파라미터비와 상기 제2 에너지 파라미터비 각각에 대해 장시간 평활 처리를 수행하고, 장시간 평활 처리 후에 취득된 상기 제1 에너지 파라미터비를 장시간 평활 처리 후에 취득된 상기 제2 에너지 파라미터로 나누어 제3 에너지 파라미터비를 취득하도록, 구성되는, 장치.
  22. 제21항에 있어서,
    상기 판단 모듈은, 상기 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  23. 제21항에 있어서,
    상기 에너지 분포 취득 모듈은 또한, 상기 제3 에너지 파라미터비에 대해 기저 제거 처리를 수행하여 제4 에너지 파라미터비를 취득하고, 상기 제4 에너지 파라미터비에 대해 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 상기 제4 에너지 파라미터비를 취득하도록 구성되는, 장치.
  24. 제23항에 있어서,
    상기 판단 모듈은, 상기 장시간 평활 처리 후에 취득된 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  25. 제21항에 있어서,
    상기 에너지 분포 취득 모듈은 또한, 상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득하도록 구성되고;
    상기 판단 모듈은, 상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 제3 에너지 파라미터비가 미리 설정된 제3 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  26. 청구항 26은(는) 설정등록료 납부시 포기되었습니다.
    제23항에 있어서,
    상기 에너지 분포 취득모듈은 또한, 상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 장시간 평활 처리를 수행하여 장시간 평활 처리 후의 교차상관 계수를 취득하도록 구성되고;
    상기 판단 모듈은, 상기 장시간 평활 처리 후에 취득된 교차상관 계수가 미리 설정된 제5 임계값보다 크고, 상기 장시간 평활 처리 후에 취득된 제4 에너지 파라미터비가 미리 설정된 제4 임계값보다 큰 경우에, 상기 처리된 신호에서 빗형 필터링 효과가 발생한 것으로 판단하도록 구성되는, 장치.
  27. 청구항 27은(는) 설정등록료 납부시 포기되었습니다.
    제16항에 있어서,
    상기 채널 지연 파라미터 조정 모듈은 상기 멀티채널 신호의 현재 프레임의 채널 지연 파라미터를 영(0)으로 설정하도록 구성되거나; 또는 상기 채널 지연 파라미터 조정 모듈은 상기 멀티채널 신호의 무지연에 대응하는 교차상관 계수를 계산하고, 상기 무지연에 대응하는 교차상관 계수를 증가시키도록 구성되거나; 또는 상기 채널 지연 파라미터 조정 모듈은 상기 멀티채널 신호의 무지연에 대응하는 정규화 교차상관 계수를 계산하고, 상기 무지연에 대응하는 정규화 교차상관 계수를 증가시키도록 구성되는, 장치.
  28. 청구항 28은(는) 설정등록료 납부시 포기되었습니다.
    제16항에 있어서,
    상기 채널 지연 파라미터 조정 모듈은 또한, 상기 멀티채널 신호의 현재 프레임 신호의 채널 지연 파라미터를 조정한 후에, 현재 프레임 후의 꼬리끌림 범위 내의 프레임의 채널 지연 파라미터를 조정하도록 구성되는, 장치.
KR1020117027088A 2009-04-20 2010-04-20 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치 Active KR101330237B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910082270.0 2009-04-20
CN2009100822700A CN101533641B (zh) 2009-04-20 2009-04-20 对多声道信号的声道延迟参数进行修正的方法和装置
PCT/CN2010/071907 WO2010121536A1 (zh) 2009-04-20 2010-04-20 对多声道信号的声道延迟参数进行修正的方法和装置

Publications (2)

Publication Number Publication Date
KR20130023023A KR20130023023A (ko) 2013-03-07
KR101330237B1 true KR101330237B1 (ko) 2013-11-15

Family

ID=41104195

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117027088A Active KR101330237B1 (ko) 2009-04-20 2010-04-20 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치

Country Status (6)

Country Link
US (1) US8976971B2 (ko)
EP (1) EP2423658B1 (ko)
JP (1) JP5312680B2 (ko)
KR (1) KR101330237B1 (ko)
CN (1) CN101533641B (ko)
WO (1) WO2010121536A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533641B (zh) * 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
CN102314882B (zh) 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
MX350690B (es) * 2012-08-03 2017-09-13 Fraunhofer Ges Forschung Método y descodificador para un concepto paramétrico de codificación de objeto de audio espacial generalizado para casos de mezcla descendente/mezcla ascendente de multicanal.
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
JP6629739B2 (ja) * 2014-09-01 2020-01-15 ソニーセミコンダクタソリューションズ株式会社 音声処理装置
CN106033672B (zh) * 2015-03-09 2021-04-09 华为技术有限公司 确定声道间时间差参数的方法和装置
US10115403B2 (en) * 2015-12-18 2018-10-30 Qualcomm Incorporated Encoding of multiple audio signals
CN107968984B (zh) * 2016-10-20 2019-08-20 中国科学院声学研究所 一种5-2通道音频转换优化方法
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
CN107782977A (zh) * 2017-08-31 2018-03-09 苏州知声声学科技有限公司 多个usb数据采集卡输入信号延时测量装置及测量方法
DE102018207780B3 (de) * 2018-05-17 2019-08-22 Sivantos Pte. Ltd. Verfahren zum Betrieb eines Hörgerätes
US11545165B2 (en) * 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008065487A1 (en) 2006-11-30 2008-06-05 Nokia Corporation Method, apparatus and computer program product for stereo coding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4430527A (en) 1982-06-03 1984-02-07 Eberbach Steven J Loudspeaker crossover delay equalization
US8676361B2 (en) 2002-06-05 2014-03-18 Synopsys, Inc. Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
US20040138876A1 (en) 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP2004325633A (ja) * 2003-04-23 2004-11-18 Matsushita Electric Ind Co Ltd 信号符号化方法、信号符号化プログラム及びその記録媒体
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
ES2324926T3 (es) 2004-03-01 2009-08-19 Dolby Laboratories Licensing Corporation Descodificacion de audio multicanal.
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
GB2422755A (en) 2005-01-27 2006-08-02 Synchro Arts Ltd Audio signal processing
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
TW200742275A (en) * 2006-03-21 2007-11-01 Dolby Lab Licensing Corp Low bit rate audio encoding and decoding in which multiple channels are represented by fewer channels and auxiliary information
JP2008203315A (ja) * 2007-02-16 2008-09-04 Matsushita Electric Ind Co Ltd オーディオ符号化・復号化装置、方法、及びソフトウェア
CN101673548B (zh) 2008-09-08 2012-08-08 华为技术有限公司 参数立体声编码方法、装置和参数立体声解码方法、装置
CN101673545B (zh) 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008065487A1 (en) 2006-11-30 2008-06-05 Nokia Corporation Method, apparatus and computer program product for stereo coding

Also Published As

Publication number Publication date
US20120033770A1 (en) 2012-02-09
US8976971B2 (en) 2015-03-10
EP2423658B1 (en) 2013-06-19
CN101533641A (zh) 2009-09-16
WO2010121536A1 (zh) 2010-10-28
EP2423658A1 (en) 2012-02-29
KR20130023023A (ko) 2013-03-07
EP2423658A4 (en) 2012-09-26
JP5312680B2 (ja) 2013-10-09
CN101533641B (zh) 2011-07-20
JP2012524304A (ja) 2012-10-11

Similar Documents

Publication Publication Date Title
KR101330237B1 (ko) 멀티채널 신호의 채널 지연 파라미터를 조정하는 방법 및 장치
KR101935183B1 (ko) 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치
CA2880126C (en) Improving at least one of intelligibility or loudness of an audio program
US9129593B2 (en) Multi channel audio processing
RU2733278C1 (ru) Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке спектрального улучшения аудиосигнала
US11869519B2 (en) Apparatus and method for decomposing an audio signal using a variable threshold
CN102307323B (zh) 对多声道信号的声道延迟参数进行修正的方法
US11183199B2 (en) Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
TW201532035A (zh) 預測式fm立體聲無線電雜訊降低
Adami et al. Down-mixing using coherence suppression
Łopatka Detection of dialogue in movie soundtrack for speech intelligibility enhancement
Kang et al. Audio Effect for Highlighting Speaker’s Voice Corrupted by Background Noise on Portable Digital Imaging Devices
JP2008283385A (ja) 雑音抑制装置
TWM527596U (zh) 用於預測式fm立體聲無線電雜訊降低的設備

Legal Events

Date Code Title Description
A201 Request for examination
PA0105 International application

Patent event date: 20111114

Patent event code: PA01051R01D

Comment text: International Patent Application

PA0201 Request for examination
PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20130416

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20131021

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20131111

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20131111

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20161020

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20161020

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20171018

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20171018

Start annual number: 5

End annual number: 5

FPAY Annual fee payment

Payment date: 20181023

Year of fee payment: 6

PR1001 Payment of annual fee

Payment date: 20181023

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20191016

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20191016

Start annual number: 7

End annual number: 7

PR1001 Payment of annual fee

Payment date: 20201015

Start annual number: 8

End annual number: 8

PR1001 Payment of annual fee

Payment date: 20211015

Start annual number: 9

End annual number: 9

PR1001 Payment of annual fee

Payment date: 20221017

Start annual number: 10

End annual number: 10