KR20160121612A - 음성 주파수 신호 처리 방법 및 장치 - Google Patents
음성 주파수 신호 처리 방법 및 장치 Download PDFInfo
- Publication number
- KR20160121612A KR20160121612A KR1020167028242A KR20167028242A KR20160121612A KR 20160121612 A KR20160121612 A KR 20160121612A KR 1020167028242 A KR1020167028242 A KR 1020167028242A KR 20167028242 A KR20167028242 A KR 20167028242A KR 20160121612 A KR20160121612 A KR 20160121612A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- audio
- frequency signal
- parameter
- current frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 139
- 238000012545 processing Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 7
- 230000003595 spectral effect Effects 0.000 claims description 80
- 230000005284 excitation Effects 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims 1
- 238000006243 chemical reaction Methods 0.000 description 23
- 230000007704 transition Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Transmitters (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
도 1은 본 발명에 따른 음성/오디오 신호 처리 방법의 실시예의 개략적 플로차트이다;
도 2는 본 발명에 따른 음성/오디오 신호 처리 방법의 또 다른 실시예의 개략적 플로차트이다;
도 3은 본 발명에 따른 음성/오디오 신호 처리 방법의 또 다른 실시예의 개략적 플로차트이다;
도 4는 본 발명에 따른 음성/오디오 신호 처리 방법의 또 다른 실시예의 개략적 플로차트이다;
도 5는 본 발명에 따른 음성/오디오 신호 처리 장치의 실시예의 개략적 구조도이다;
도 6은 본 발명에 따른 음성/오디오 신호 처리 장치의 실시예의 개략적 구조도이다;
도 7은 본 발명에 따른 파라미터 획득 유닛의 실시예의 개략적 구조도이다;
도 8은 본 발명에 따른 전역 이득 파라미터 획득 유닛의 실시예의 개략적 구조도이다;
도 9는 본 발명에 따른 취득 유닛의 실시예의 개략적 구조도이다;
도 10은 본 발명에 따른 음성/오디오 신호 처리 장치의 또 다른 실시예의 개략적 구조도이다.
Claims (11)
- 음성/오디오 신호(speech/audio signal) 처리 방법으로서,
음성/오디오 신호가 넓은 주파수 신호(wide frequency signal)로부터 좁은 주파수 신호(narrow frequency signal)로 전환할 때, 현재 프레임의 음성/오디오 신호에 대응하는 초기 고주파 신호를 얻는 단계;
상기 초기 고주파 신호의 시간 영역 전역 이득 파라미터(time-domain global gain parameter)를 얻는 단계;
에너지 비율(energy ratio)과 상기 시간 영역 전역 이득 파라미터에 관해 가중치 처리(weighting processing)를 수행하여 예측된 전역 이득 파라미터로서 가중된 값(weighted value)을 얻는 단계 - 상기 에너지 비율은 이전 프레임의 고주파 시간 영역 신호의 에너지와 현재 프레임의 초기 고주파 신호의 에너지 사이의 비율임 -;
상기 예측된 전역 이득 파라미터를 이용하여 상기 초기 고주파 신호를 보정하여, 보정된 고주파 시간 영역 신호를 얻는 단계; 및
현재 프레임의 좁은 주파수 시간 영역 신호와 상기 보정된 고주파 시간 영역 신호를 합성하고, 합성된 신호를 출력하는 단계
를 포함하는 음성/오디오 신호 처리 방법. - 제1항에 있어서,
상기 초기 고주파 신호의 시간 영역 전역 이득 파라미터를 얻는 단계는,
상기 현재 프레임의 음성/오디오 신호의 스펙트럼 틸트 파라미터(spectrum tilt parameter), 및 현재 프레임의 좁은 주파수 신호와 이전 프레임의 좁은 주파수 신호 사이의 상관관계(correlation)에 따라 상기 고주파 신호의 시간 영역 전역 이득 파라미터를 얻는 단계를 포함하는, 음성/오디오 신호 처리 방법. - 제2항에 있어서,
상기 현재 프레임의 음성/오디오 신호의 스펙트럼 틸트 파라미터, 및 현재 프레임의 좁은 주파수 신호와 이전 프레임의 좁은 주파수 신호 사이의 상관관계에 따라 상기 고주파 신호의 시간 영역 전역 이득 파라미터를 얻는 단계는,
상기 현재 프레임의 음성/오디오 신호의 상기 스펙트럼 틸트 파라미터, 및 상기 현재 프레임의 좁은 주파수 신호와 상기 이전 프레임의 좁은 주파수 신호 사이의 상기 상관관계에 따라 상기 현재 프레임의 음성/오디오 신호를 제1 타입의 신호 또는 제2 타입의 신호로 분류하는 단계;
상기 현재 프레임의 음성/오디오 신호가 제1 타입의 신호일 때, 상기 스펙트럼 틸트 파라미터를 제1 미리 결정된 값 이하로 제한하여 스펙트럼 틸트 파라미터 제한값을 얻는 단계; 및
상기 현재 프레임의 음성/오디오 신호가 제2 타입의 신호일 때, 상기 스펙트럼 틸트 파라미터를 제1 범위의 값으로 제한하여 스펙트럼 틸트 파라미터 제한값을 얻는 단계
를 포함하고,
상기 스펙트럼 틸트 파라미터 제한값은 상기 고주파 신호의 상기 시간 영역 전역 이득 파라미터를 얻기 위해 이용되는, 음성/오디오 신호 처리 방법. - 제3항에 있어서, 상기 제1 타입의 신호는 마찰음(fricative) 신호이고, 상기 제2 타입의 신호는 비마찰음(non-fricative) 신호이며; 상기 스펙트럼 틸트 파라미터 tilt > 5이고 상관관계 파라미터 cor가 특정 값 미만이면, 상기 좁은 주파수 신호는 마찰음 신호로서 분류되고, 나머지는 비마찰음 신호들로서 분류되며; 상기 제1 미리 결정된 값은 8이고; 상기 제1 범위는 [0.5, 1]인, 음성/오디오 신호 처리 방법.
- 제1항에 있어서, 상기 현재 프레임의 음성/오디오 신호에 대응하는 초기 고주파 신호를 얻는 단계는,
상기 현재 프레임의 음성/오디오 신호에 따라 고주파 여기 신호(high frequency excitation signal)를 예측하는 단계;
상기 고주파 신호의 LPC 계수를 예측하는 단계; 및
상기 고주파 여기 신호와 상기 고주파 신호의 LPC 계수를 합성하여 상기 예측된 고주파 신호를 얻는 단계
를 포함하는, 음성/오디오 신호 처리 방법. - 음성/오디오 신호 처리 장치로서,
음성/오디오 신호가 넓은 주파수 신호로부터 좁은 주파수 신호로 전환할 때, 현재 프레임의 음성/오디오 신호에 대응하는 초기 고주파 신호를 얻도록 구성된 취득 유닛;
상기 초기 고주파 신호에 대응하는 시간 영역 전역 이득 파라미터를 얻도록 구성된 파라미터 획득 유닛;
에너지 비율과 상기 시간 영역 전역 이득 파라미터에 관해 가중치 처리를 수행하여 예측된 전역 이득 파라미터로서 가중된 값을 얻도록 구성된 가중치 처리 유닛 ―상기 에너지 비율은 이전 프레임의 고주파 시간 영역 신호의 에너지와 현재 프레임의 초기 고주파 신호의 에너지 사이의 비율임― ;
상기 예측된 전역 이득 파라미터를 이용하여 상기 초기 고주파 신호를 보정하여, 보정된 고주파 시간 영역 신호를 얻도록 구성된 보정 유닛; 및
현재 프레임의 좁은 주파수 시간 영역 신호와 상기 보정된 고주파 시간 영역 신호를 합성하고, 합성된 신호를 출력하도록 구성된 합성 유닛
을 포함하는 음성/오디오 신호 처리 장치. - 제6항에 있어서, 상기 파라미터 획득 유닛은,
상기 현재 프레임의 음성/오디오 신호의 스펙트럼 틸트 파라미터, 및 현재 프레임의 좁은 주파수 신호와 이전 프레임의 좁은 주파수 신호 사이의 상관관계에 따라 상기 고주파 신호의 상기 시간 영역 전역 이득 파라미터를 얻도록 구성된 전역 이득 파라미터 획득 유닛을 포함하는, 음성/오디오 신호 처리 장치. - 제7항에 있어서, 상기 전역 이득 파라미터 획득 유닛은,
상기 현재 프레임의 음성/오디오 신호의 상기 스펙트럼 틸트 파라미터, 및 상기 현재 프레임의 좁은 주파수 신호와 상기 이전 프레임의 좁은 주파수 신호 사이의 상기 상관관계에 따라 상기 현재 프레임의 음성/오디오 신호를 제1 타입의 신호 또는 제2 타입의 신호로 분류하도록 구성된 분류 유닛;
상기 현재 프레임의 음성/오디오 신호가 제1 타입의 신호일 때, 상기 스펙트럼 틸트 파라미터를 제1 미리 결정된 값 이하로 제한하여 스펙트럼 틸트 파라미터 제한값을 얻도록 구성된 제1 제한 유닛; 및
상기 현재 프레임의 음성/오디오 신호가 제2 타입의 신호일 때, 상기 스펙트럼 틸트 파라미터를 제1 범위의 값으로 제한하여 스펙트럼 틸트 파라미터 제한값을 얻도록 구성된 제2 제한 유닛
을 포함하고,
상기 스펙트럼 틸트 파라미터 제한값은 상기 고주파 신호의 상기 시간 영역 전역 이득 파라미터를 얻기 위해 이용되는, 음성/오디오 신호 처리 장치. - 제8항에 있어서, 상기 제1 타입의 신호는 마찰음 신호이고, 상기 제2 타입의 신호는 비마찰음 신호이며; 상기 스펙트럼 틸트 파라미터 tilt > 5이고 상관관계 파라미터 cor가 특정 값 미만이면, 상기 좁은 주파수 신호는 마찰음 신호로서 분류되고, 나머지는 비마찰음 신호들로서 분류되며; 상기 제1 미리 결정된 값은 8이고; 상기 제1 범위는 [0.5, 1]인, 음성/오디오 신호 처리 장치.
- 제6항에 있어서, 상기 취득 유닛은,
상기 현재 프레임의 음성/오디오 신호에 따라 고주파 여기 신호를 예측하도록 구성된 여기 신호 획득 유닛;
상기 고주파 신호의 LPC 계수를 예측하도록 구성된 LPC 계수 획득 유닛; 및
상기 고주파 여기 신호와 상기 고주파 신호의 상기 LPC 계수를 합성하여 상기 예측된 고주파 신호를 얻도록 구성된 합성 유닛을 포함하는, 음성/오디오 신호 처리 장치. - 컴퓨터가 제1항 내지 제5항 중 어느 한 항의 방법을 실행하게 하는 프로그램이 저장되어 있는 컴퓨터 판독가능 기록 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210051672.6 | 2012-03-01 | ||
CN201210051672.6A CN103295578B (zh) | 2012-03-01 | 2012-03-01 | 一种语音频信号处理方法和装置 |
PCT/CN2013/072075 WO2013127364A1 (zh) | 2012-03-01 | 2013-03-01 | 一种语音频信号处理方法和装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147025655A Division KR101667865B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177002148A Division KR101844199B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160121612A true KR20160121612A (ko) | 2016-10-19 |
KR101702281B1 KR101702281B1 (ko) | 2017-02-03 |
Family
ID=49081655
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177002148A Active KR101844199B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
KR1020147025655A Active KR101667865B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
KR1020167028242A Active KR101702281B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177002148A Active KR101844199B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
KR1020147025655A Active KR101667865B1 (ko) | 2012-03-01 | 2013-03-01 | 음성 주파수 신호 처리 방법 및 장치 |
Country Status (20)
Country | Link |
---|---|
US (4) | US9691396B2 (ko) |
EP (3) | EP3193331B1 (ko) |
JP (3) | JP6010141B2 (ko) |
KR (3) | KR101844199B1 (ko) |
CN (2) | CN105469805B (ko) |
BR (1) | BR112014021407B1 (ko) |
CA (1) | CA2865533C (ko) |
DK (1) | DK3534365T3 (ko) |
ES (3) | ES2867537T3 (ko) |
HU (1) | HUE053834T2 (ko) |
IN (1) | IN2014KN01739A (ko) |
MX (2) | MX345604B (ko) |
MY (1) | MY162423A (ko) |
PL (1) | PL3534365T3 (ko) |
PT (2) | PT2821993T (ko) |
RU (2) | RU2616557C1 (ko) |
SG (2) | SG11201404954WA (ko) |
TR (1) | TR201911006T4 (ko) |
WO (1) | WO2013127364A1 (ko) |
ZA (1) | ZA201406248B (ko) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469805B (zh) * | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
AU2014336357B2 (en) | 2013-10-18 | 2017-04-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
EP3058568B1 (en) | 2013-10-18 | 2021-01-13 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
US20150170655A1 (en) * | 2013-12-15 | 2015-06-18 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
KR101864122B1 (ko) | 2014-02-20 | 2018-06-05 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
CN105225666B (zh) | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
GB2578386B (en) | 2017-06-27 | 2021-12-01 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201719734D0 (en) * | 2017-10-30 | 2018-01-10 | Cirrus Logic Int Semiconductor Ltd | Speaker identification |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB2567503A (en) * | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
CN111554309B (zh) * | 2020-05-15 | 2024-11-22 | 腾讯科技(深圳)有限公司 | 一种语音处理方法、装置、设备及存储介质 |
CN112927709B (zh) * | 2021-02-04 | 2022-06-14 | 武汉大学 | 一种基于时频域联合损失函数的语音增强方法 |
CN113571079B (zh) * | 2021-02-08 | 2025-07-11 | 腾讯科技(深圳)有限公司 | 语音增强方法、装置、设备及存储介质 |
CN113470691B (zh) * | 2021-07-08 | 2024-08-30 | 浙江大华技术股份有限公司 | 一种语音信号的自动增益控制方法及其相关装置 |
CN115294947B (zh) * | 2022-07-29 | 2024-06-11 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、电子设备及介质 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
EP1173998B1 (en) | 1999-04-26 | 2008-09-03 | Lucent Technologies Inc. | Path switching according to transmission requirements |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6606591B1 (en) | 2000-04-13 | 2003-08-12 | Conexant Systems, Inc. | Speech coding employing hybrid linear prediction coding |
US7113522B2 (en) | 2001-01-24 | 2006-09-26 | Qualcomm, Incorporated | Enhanced conversion of wideband signals to narrowband signals |
JP2003044098A (ja) | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
US7895035B2 (en) | 2004-09-06 | 2011-02-22 | Panasonic Corporation | Scalable decoding apparatus and method for concealing lost spectral parameters |
CN101213590B (zh) | 2005-06-29 | 2011-09-21 | 松下电器产业株式会社 | 可扩展解码装置及丢失数据插值方法 |
KR20080097178A (ko) | 2006-01-18 | 2008-11-04 | 연세대학교 산학협력단 | 부호화/복호화 장치 및 방법 |
RU2414009C2 (ru) * | 2006-01-18 | 2011-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Устройство и способ для кодирования и декодирования сигнала |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
GB2444757B (en) | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
JP4733727B2 (ja) | 2007-10-30 | 2011-07-27 | 日本電信電話株式会社 | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
CN100585699C (zh) * | 2007-11-02 | 2010-01-27 | 华为技术有限公司 | 一种音频解码的方法和装置 |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
KR100930061B1 (ko) * | 2008-01-22 | 2009-12-08 | 성균관대학교산학협력단 | 신호 검출 방법 및 장치 |
CN101499278B (zh) * | 2008-02-01 | 2011-12-28 | 华为技术有限公司 | 音频信号切换处理方法和装置 |
CN101751925B (zh) * | 2008-12-10 | 2011-12-21 | 华为技术有限公司 | 一种语音解码方法及装置 |
JP5448657B2 (ja) * | 2009-09-04 | 2014-03-19 | 三菱重工業株式会社 | 空気調和機の室外機 |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
JP5287685B2 (ja) * | 2009-11-30 | 2013-09-11 | ダイキン工業株式会社 | 空調室外機 |
US8000968B1 (en) * | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
SG192745A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
CN105469805B (zh) * | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
-
2012
- 2012-03-01 CN CN201510991494.9A patent/CN105469805B/zh active Active
- 2012-03-01 CN CN201210051672.6A patent/CN103295578B/zh active Active
-
2013
- 2013-03-01 SG SG11201404954WA patent/SG11201404954WA/en unknown
- 2013-03-01 JP JP2014559077A patent/JP6010141B2/ja active Active
- 2013-03-01 EP EP16187948.1A patent/EP3193331B1/en active Active
- 2013-03-01 DK DK18199234.8T patent/DK3534365T3/da active
- 2013-03-01 SG SG10201608440XA patent/SG10201608440XA/en unknown
- 2013-03-01 RU RU2016115109A patent/RU2616557C1/ru active
- 2013-03-01 PL PL18199234T patent/PL3534365T3/pl unknown
- 2013-03-01 PT PT137545646T patent/PT2821993T/pt unknown
- 2013-03-01 ES ES18199234T patent/ES2867537T3/es active Active
- 2013-03-01 KR KR1020177002148A patent/KR101844199B1/ko active Active
- 2013-03-01 MX MX2014010376A patent/MX345604B/es active IP Right Grant
- 2013-03-01 EP EP13754564.6A patent/EP2821993B1/en active Active
- 2013-03-01 HU HUE18199234A patent/HUE053834T2/hu unknown
- 2013-03-01 PT PT16187948T patent/PT3193331T/pt unknown
- 2013-03-01 KR KR1020147025655A patent/KR101667865B1/ko active Active
- 2013-03-01 MY MYPI2014002393A patent/MY162423A/en unknown
- 2013-03-01 CA CA2865533A patent/CA2865533C/en active Active
- 2013-03-01 ES ES13754564.6T patent/ES2629135T3/es active Active
- 2013-03-01 WO PCT/CN2013/072075 patent/WO2013127364A1/zh active Application Filing
- 2013-03-01 IN IN1739KON2014 patent/IN2014KN01739A/en unknown
- 2013-03-01 TR TR2019/11006T patent/TR201911006T4/tr unknown
- 2013-03-01 MX MX2017001662A patent/MX364202B/es unknown
- 2013-03-01 KR KR1020167028242A patent/KR101702281B1/ko active Active
- 2013-03-01 EP EP18199234.8A patent/EP3534365B1/en active Active
- 2013-03-01 ES ES16187948T patent/ES2741849T3/es active Active
- 2013-03-01 RU RU2014139605/08A patent/RU2585987C2/ru active
- 2013-03-01 BR BR112014021407-7A patent/BR112014021407B1/pt active IP Right Grant
-
2014
- 2014-08-25 ZA ZA2014/06248A patent/ZA201406248B/en unknown
- 2014-08-27 US US14/470,559 patent/US9691396B2/en active Active
-
2016
- 2016-09-15 JP JP2016180496A patent/JP6378274B2/ja active Active
-
2017
- 2017-06-07 US US15/616,188 patent/US10013987B2/en active Active
-
2018
- 2018-06-28 US US16/021,621 patent/US10360917B2/en active Active
- 2018-07-26 JP JP2018140054A patent/JP6558748B2/ja active Active
-
2019
- 2019-06-28 US US16/457,165 patent/US10559313B2/en active Active
Non-Patent Citations (2)
Title |
---|
S.Ragot et al., ITU-T:AN 8-32 kbit/s scalable coder interoperable with G.729 for wideband telephony and voice over IP,ICASSP 2007, 15~20 Apr. 2007, pp.529~532(vol.4) * |
김현우 외, G.729.1 광대역멀티코덱 표준 기술 동향, ETRI 전자통신동향분석 제21권 제6호, 2006년 12월 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101702281B1 (ko) | 음성 주파수 신호 처리 방법 및 장치 | |
CN103220595B (zh) | 音频处理装置和音频处理方法 | |
KR101668401B1 (ko) | 오디오 신호를 인코딩하기 위한 방법 및 장치 | |
CN102044250A (zh) | 频带扩展方法及装置 | |
JP2014507681A (ja) | 帯域幅を拡張する方法および装置 | |
JP6612808B2 (ja) | 会話/音声信号処理方法および符号化装置 | |
CN105761724B (zh) | 一种语音频信号处理方法和装置 | |
US9111527B2 (en) | Encoding device, decoding device, and methods therefor | |
JP4269364B2 (ja) | 信号処理方法及び装置、並びに帯域幅拡張方法及び装置 | |
JP2012083775A (ja) | 信号処理装置および信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20161011 Application number text: 1020147025655 Filing date: 20140915 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20161027 |
|
A107 | Divisional application of patent | ||
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20170124 Application number text: 1020147025655 Filing date: 20140915 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170125 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170125 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20200103 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20200103 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210108 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20211215 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20231218 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20241216 Start annual number: 9 End annual number: 9 |