KR101196518B1 - 실시간 음성 활동 검출 장치 및 검출 방법 - Google Patents
실시간 음성 활동 검출 장치 및 검출 방법 Download PDFInfo
- Publication number
- KR101196518B1 KR101196518B1 KR1020110031066A KR20110031066A KR101196518B1 KR 101196518 B1 KR101196518 B1 KR 101196518B1 KR 1020110031066 A KR1020110031066 A KR 1020110031066A KR 20110031066 A KR20110031066 A KR 20110031066A KR 101196518 B1 KR101196518 B1 KR 101196518B1
- Authority
- KR
- South Korea
- Prior art keywords
- sound signal
- sound
- stored
- frame
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 132
- 238000001514 detection method Methods 0.000 claims abstract description 78
- 230000015654 memory Effects 0.000 claims abstract description 47
- 230000009977 dual effect Effects 0.000 claims abstract description 45
- 230000000737 periodic effect Effects 0.000 claims abstract description 42
- 230000003139 buffering effect Effects 0.000 claims abstract description 40
- 239000000872 buffer Substances 0.000 claims abstract description 21
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 206010019133 Hangover Diseases 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
도 2는 음향신호 버퍼링부의 세부 버퍼 구조를 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 실시간 음성 활동 검출 장치의 음성 활동 검출 결과와 지연된 음향신호를 나타낸 도면이다.
도 4는 주기성 연산부에서 저주파 필터를 통과한 후의 음향 신호를 저장하는 레지스터 쌍의 구조를 나타낸 도면이다.
도 5는 본 발명의 일실시예에 따른 실시간 음성 활동 검출 방법의 순서도이다.
도 6(a)는 S2 단계에 대한 세부 순서도이고, 도 6(b)는 S3 단계에 대한 세부 순서도이다.
도 7은 본 발명의 다른 실시예에 따른 실시간 음성 활동 검출 방법을 나타낸 순서도이다.
120 : 음향신호 버퍼링부 121 : 이중 포트 메몰
122 : 직류 성분 산출기 123 : 직류 성분 제거기
130 : 주기성 연산부 131 : 저주파 필터
132 : 레지스터 133 : 주기적 특징 확인부
140 : 에너지 연산부 150 : 음성 검출 출력부
160 : 샘플 지연 저장부
Claims (14)
- 음성 활동 검출 장치에 있어서,
음향신호를 입력받는 하나 이상의 마이크로폰 및 상기 마이크로폰으로 입력되는 아날로그 음향신호를 디지털 음향신호로 변환하는 변환기를 포함하는 음향신호 획득부;
이중 포트 메모리를 이용하여 상기 음향신호 획득부의 디지털 음향신호를 버퍼링하는 음향신호 버퍼링부;
상기 음향신호 버퍼링부에 저장된 음향신호에서 음향 프레임 단위로 주기적 특징이 존재하는지 여부를 연산하는 주기성 연산부;
상기 주기성 연산부의 연산 결과에 따라 음성 검출 신호를 출력하는 음성 검출 출력부; 및
상기 음향신호 버퍼링부에서 저장된 음향신호를 상기 음성 검출 출력부의 출력 신호와 싱크를 맞추어 출력하기 위해 기준시간 지연 저장하는 샘플 지연 저장부를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치. - 제1항에 있어서,
상기 음향신호 버퍼링부는 복수(N) 개의 이중 포트 메모리를 포함하고, 상기 이중 포트 메모리는 원형큐 구조를 갖는 것을 특징으로 하는 실시간 음성 활동 검출 장치. - 제1항에 있어서,
상기 음향신호 버퍼링부는
상기 음향신호의 샘플이 순차적으로 저장되는 N개의 이중 포트 메모리;
상기 이중 포트 메모리의 같은 행에 N개의 샘플이 저장되면 전체 N개의 샘플을 더한 후 N으로 나누어 직류 성분 산출하는 직류 성분 산출기; 및
상기 이중 포트 메모리에 저장된 음향신호의 샘플에서 상기 직류 성분을 제거하는 직류 성분 제거기를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치. - 제1항에 있어서,
상기 주기성 연산부는
상기 음향신호 버퍼링부에 저장된 음향신호에서 고주파 잡음을 제거하기 위한 저주파 필터;
상기 저주파 필터에서 고주파 잡음이 제거된 음향 신호를 하나의 음향 프레임 단위로 저장하는 복수 개의 레지스터; 및
상기 복수 개의 레지스터에 대해 동시에 주기적 특징이 존재하는지 여부를 확인하기 위한 연산을 수행하는 주기적 특징 확인부를 포함하되,
상기 레지스터는 동일한 음향 프레임의 음향신호가 저장되고, 각 레지스터가 복수(k) 개의 쌍을 이루어 상기 주기적 특징 확인부에서 주기적 특징 여부가 확인되는 것을 특징으로 하는 실시간 음성 활동 검출 장치.
(여기서 k는 "음향 프레임의 크기 - 1"인 값임) - 제1항에 있어서,
상기 실시간 음성 활동 검출 장치는
상기 음향신호 버퍼링부에 저장된 음향신호의 음향 프레임 단위별로 에너지 평균값을 연산하는 에너지 연산부를 더 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치. - 제6항에 있어서,
상기 음성 검출 출력부는
상기 주기성 연산부에서 연산된 값과 상기 에너지 연산부에서 연산된 값의 곱이 기준값 이상인 경우에 플래그(flag)를 1로 설정하고, 연속하는 10개의 음향 프레임에서 연속으로 플래그가 1로 설정된 경우 음성 검출 신호를 출력하는 것을 특징으로 하는 실시간 음성 활동 검출 장치. - 음성 활동 검출 방법에 있어서,
외부 음향신호가 디지털 음향신호로 변환되는 S1 단계;
상기 S1 단계에서 변환된 디지털 음향신호가 버퍼링을 위한 이중 포트 메모리에 저장되는 S2 단계;
상기 S2 단계의 이중 포트 메모리에 저장된 음향신호의 음향 프레임에 주기적 특징이 존재하는지 여부가 연산되는 S3 단계;
상기 S3 단계의 연산결과에 따라 음성 검출 신호가 출력되는 S4 단계를 포함하되,
상기 S2 단계의 이중 포트 메모리는 복수 개이고, 원형큐 구조를 갖는 것을 특징으로 하는 실시간 음성 활동 검출 방법. - 삭제
- 제8항에 있어서,
상기 S2 단계는
상기 음향신호의 샘플이 N개의 이중 포트 메모리에 순차적으로 저장되는 S2-1 단계;
상기 이중 포트 메모리의 같은 행에 N개의 샘플이 저장되면 전체 N개의 샘플을 더한 후 N으로 나누어 직류 성분이 산출되는 S2-2 단계; 및
상기 이중 포트 메모리에 저장된 음향신호의 샘플에서 상기 직류 성분이 제거되는 S2-3 단계를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 방법. - 제8항에 있어서,
상기 S3 단계는
상기 S2 단계의 이중 포트 메모리에 저장된 음향신호에서 고주파 잡음이 제거되는 S3-1 단계;
상기 S3-1 단계에서 고주파 잡음이 제고된 음향신호가 음향 프레임 단위로 복수 개의 레지스터에 저장되는 S3-2 단계; 및
상기 S3-2 단계의 복수 개의 레지스터에서 동시에 주기적 특징이 존재하는지 여부를 확인하기 위한 연산이 수행되는 S3-3 단계를 포함하되,
상기 상기 레지스터는 동일한 음향 프레임의 음향신호가 저장되고, 각 레지스터가 복수(k) 개의 쌍을 이루어 상기 S3-3 단계에서 주기적 특징 여부가 확인되는 것을 특징으로 하는 실시간 음성 활동 검출 방법. - 제8항에 있어서,
상기 실시간 음성 활동 검출 방법은
상기 S2 단계에서 저장된 음향신호의 음향 프레임 단위별로 에너지 평균값이 연산되는 S5 단계를 더 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 방법. - 제13항에 있어서,
상기 S4 단계는
상기 S3 단계에서 연산된 값과 상기 S5 단계에서 연산된 값의 곱이 기준값 이상인 경우에 플래그(flag)를 1로 설정하고, 연속하는 10개의 음향 프레임에서 연속으로 플래그가 1로 설정된 경우 음성 검출 신호가 출력되는 것을 특징으로 하는 실시간 음성 활동 검출 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110031066A KR101196518B1 (ko) | 2011-04-05 | 2011-04-05 | 실시간 음성 활동 검출 장치 및 검출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110031066A KR101196518B1 (ko) | 2011-04-05 | 2011-04-05 | 실시간 음성 활동 검출 장치 및 검출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120113382A KR20120113382A (ko) | 2012-10-15 |
KR101196518B1 true KR101196518B1 (ko) | 2012-11-01 |
Family
ID=47282944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110031066A Active KR101196518B1 (ko) | 2011-04-05 | 2011-04-05 | 실시간 음성 활동 검출 장치 및 검출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101196518B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003063138A1 (en) | 2002-01-24 | 2003-07-31 | Motorola Inc | Voice activity detector and validator for noisy environments |
-
2011
- 2011-04-05 KR KR1020110031066A patent/KR101196518B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003063138A1 (en) | 2002-01-24 | 2003-07-31 | Motorola Inc | Voice activity detector and validator for noisy environments |
Also Published As
Publication number | Publication date |
---|---|
KR20120113382A (ko) | 2012-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108010515B (zh) | 一种语音端点检测和唤醒方法及装置 | |
CN107393526B (zh) | 语音静音检测方法、装置、计算机设备和存储介质 | |
CN103903612B (zh) | 一种实时语音识别数字的方法 | |
CN109644192B (zh) | 具有语音检测周期持续时间补偿的音频传送方法和设备 | |
CN112802498B (zh) | 语音检测方法、装置、计算机设备和存储介质 | |
CN109065046A (zh) | 语音唤醒的方法、装置、电子设备及计算机可读存储介质 | |
CN111276124B (zh) | 一种关键词识别方法、装置、设备及可读存储介质 | |
CN105118501A (zh) | 语音识别的方法及系统 | |
CN106098079B (zh) | 音频信号的信号提取方法与装置 | |
KR20140031790A (ko) | 잡음 환경에서 강인한 음성 구간 검출 방법 및 장치 | |
CN109215647A (zh) | 语音唤醒方法、电子设备及非暂态计算机可读存储介质 | |
CN110060693A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN114495907B (zh) | 自适应的语音活动检测方法、装置、设备以及存储介质 | |
WO2020228107A1 (zh) | 一种音频修复方法、设备及可读存储介质 | |
TW202022855A (zh) | 語音處理方法及裝置 | |
CN105989846B (zh) | 一种多通道语音信号同步方法及装置 | |
KR20140015893A (ko) | 음원 위치 추정 장치 및 방법 | |
CN106504756B (zh) | 嵌入式语音识别系统及方法 | |
KR20100050114A (ko) | 실시간 음원 방향 감지 장치 및 그 방법 | |
CN111785302A (zh) | 说话人分离方法、装置及电子设备 | |
Lopatka et al. | Acceleration of decision making in sound event recognition employing supercomputing cluster | |
KR101196518B1 (ko) | 실시간 음성 활동 검출 장치 및 검출 방법 | |
CN113903328A (zh) | 基于深度学习的说话人计数方法、装置、设备及存储介质 | |
CN113436641A (zh) | 一种音乐转场时间点检测方法、设备及介质 | |
CN112562727A (zh) | 应用于音频监控的音频场景分类方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20110405 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20120327 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20121022 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20121025 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20121025 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20151026 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20151026 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20171011 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20171011 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190828 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20190828 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20201026 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20211014 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20220622 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20230627 Start annual number: 12 End annual number: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20240620 Start annual number: 13 End annual number: 13 |