KR20190042928A - 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 - Google Patents
소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 Download PDFInfo
- Publication number
- KR20190042928A KR20190042928A KR1020170134598A KR20170134598A KR20190042928A KR 20190042928 A KR20190042928 A KR 20190042928A KR 1020170134598 A KR1020170134598 A KR 1020170134598A KR 20170134598 A KR20170134598 A KR 20170134598A KR 20190042928 A KR20190042928 A KR 20190042928A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- unit
- output
- signal processing
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R19/00—Electrostatic transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/003—Mems transducers or their use
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 의한 반도체 장치를 나타내는 블록도.
도 3은 본 발명의 다른 실시예에 의한 반도체 장치를 나타내는 블록도.
도 4는 도 2의 신호 처리부의 상세 블록도.
도 5는 도 3의 특징 추출부의 상세 블록도.
도 6은 도 4의 인식부를 구현하는 신경망의 설명도.
도 7 내지 9는 도 2의 신호 처리부의 다른 실시예를 나타내는 상세 블록도.
100: 반도체 장치
110: 아날로그 디지털 변환기
111: 시그마 델타 변조기
112: 데시메이터
120: 증폭기
130: 인터페이스
200: 신호 처리부
210: 특징 추출부
220: 인식부
230: 디코더
240: 종료점 탐지부
250: 활성화 제어부
Claims (19)
- 입력 신호를 디지털 신호로 변환하는 아날로그 디지털 변환기;
상기 디지털 신호를 외부에서 입력된 동작 파라미터의 영향을 받아 처리하는 신호 처리부; 및
상기 아날로그 디지털 변환기의 출력 또는 상기 신호 처리부의 출력을 외부에 제공하는 인터페이스
를 포함하는 반도체 장치. - 청구항 1에 있어서, 상기 입력 신호를 증폭하여 상기 아날로그 디지털 변환기에 제공하는 증폭기를 더 포함하는 반도체 장치.
- 청구항 1에 있어서, 상기 인터페이스는 상기 아날로그 디지털 변환기의 출력 및 상기 신호 처리부의 출력을 외부에 제공하는 반도체 장치.
- 청구항 1에 있어서, 상기 동작 파라미터는 상기 인터페이스를 경유하여 상기 신호 처리부에 입력되는 반도체 장치.
- 청구항 1에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터에 대해서 소리 인식 기능을 수행하여 출력 벡터를 생성하는 인식부; 및
상기 출력 벡터를 디코딩하여 인식 결과를 출력하는 디코더
를 포함하는 반도체 장치. - 청구항 1에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터로부터 음향 신호의 종류를 나타내는 분류 신호를 출력하는 분류부; 및
상기 분류 신호를 후처리하여 분류 결과를 출력하는 후처리부
를 포함하는 반도체 장치. - 청구항 5에 있어서, 상기 인식부는 각각 다수의 뉴런을 포함하는 다수의 계층을 포함하는 신경망을 포함하고, 상기 동작 파라미터는 상기 다수의 뉴런을 연결하는 다수의 시냅스의 가중치와 상기 다수의 뉴런에 할당되는 바이어스 중 적어도 하나를 포함하되, 상기 인식부는 상기 가중치와 상기 바이어스를 자체적으로 학습하지 않는 반도체 장치.
- 청구항 5에 있어서, 상기 특징 벡터로부터 소리 신호의 종료 지점을 탐지하는 종료점 탐지부와 상기 종료점 탐지부의 탐지 결과에 따라 상기 인식부의 활성화를 제어하는 활성화 제어부를 더 포함하는 반도체 장치.
- 청구항 1에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터에 대해서 노이즈 신호와 음성 신호를 구별하는 마스킹부; 및
상기 마스킹부의 출력으로부터 음성 신호가 강화된 신호를 출력하는 재구성부
를 포함하는 반도체 장치. - 공기의 흐름에 대응하는 소리 신호를 생성하는 트랜스듀서; 및
상기 소리 신호를 디지털 신호로 변환하되 상기 디지털 신호를 외부에서 입력된 동작 파라미터의 영향을 받아 처리하는 반도체 장치;
상기 트랜스듀서와 상기 반도체 장치가 장착되는 기판; 및
상기 기판에 장착되어 상기 트랜스듀서와 상기 반도체 장치가 그 내부에 포함되도록 공간을 형성하는 케이스
를 포함하는 마이크 장치. - 청구항 10에 있어서, 상기 반도체 장치는
상기 소리 신호를 상기 디지털 신호로 변환하는 아날로그 디지털 변환기;
상기 디지털 신호를 외부에서 입력된 상기 동작 파라미터의 영향을 받아 처리하는 신호 처리부; 및
상기 아날로그 디지털 변환기의 출력 또는 상기 신호 처리부의 출력을 외부에 제공하는 인터페이스
를 포함하는 마이크 장치. - 청구항 11에 있어서, 상기 입력 신호를 증폭하여 상기 아날로그 디지털 변환기에 제공하는 증폭기를 더 포함하는 마이크 장치.
- 청구항 11에 있어서, 상기 인터페이스는 상기 아날로그 디지털 변환기의 출력 및 상기 신호 처리부의 출력을 외부에 제공하는 마이크 장치.
- 청구항 11에 있어서, 상기 동작 파라미터는 상기 인터페이스를 경유하여 상기 신호 처리부에 입력되는 마이크 장치.
- 청구항 11에 있어서, 상기 신호 처리부는 다수의 뉴런을 포함하는 다수의 계층을 포함하는 신경망을 포함하고, 상기 동작 파라미터는 상기 다수의 뉴런을 연결하는 다수의 시냅스의 가중치 및 상기 다수의 뉴런에 지정되는 바이어스 중 적어도 하나를 포함하되, 상기 신호 처리부는 상기 가중치 및 상기 바이어스를 자체적으로 학습하지 않는 마이크 장치.
- 청구항 11에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터에 대해서 소리 인식 기능을 수행하여 출력 벡터를 생성하는 인식부; 및
상기 출력 벡터를 디코딩하여 인식 결과를 출력하는 디코더
를 포함하는 마이크 장치. - 청구항 11에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터로부터 음향 신호의 종류를 나타내는 분류 신호를 출력하는 분류부; 및
상기 분류 신호를 후처리하여 분류 결과를 출력하는 후처리부
를 포함하는 마이크 장치. - 청구항 16에 있어서, 상기 신호 처리부는 상기 특징 벡터로부터 상기 소리 신호의 종료 지점을 탐지하는 종료점 탐지부와 상기 종료점 탐지부의 탐지 결과에 따라 상기 인식부의 활성화를 제어하는 활성화 제어부를 더 포함하는 마이크 장치.
- 청구항 11에 있어서, 상기 신호 처리부는
상기 디지털 신호에서 특징 벡터를 생성하는 특징 추출부;
상기 동작 파라미터의 영향을 받아 상기 특징 벡터에 대해서 노이즈 신호와 음성 신호를 구별하는 마스킹부; 및
상기 마스킹부의 출력으로부터 음성 신호가 강화된 신호를 출력하는 재구성부
를 포함하는 마이크 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170134598A KR20190042928A (ko) | 2017-10-17 | 2017-10-17 | 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 |
PCT/KR2018/012142 WO2019078567A1 (ko) | 2017-10-17 | 2018-10-16 | 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170134598A KR20190042928A (ko) | 2017-10-17 | 2017-10-17 | 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190042928A true KR20190042928A (ko) | 2019-04-25 |
Family
ID=66174163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170134598A Ceased KR20190042928A (ko) | 2017-10-17 | 2017-10-17 | 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20190042928A (ko) |
WO (1) | WO2019078567A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744748A (zh) * | 2021-08-06 | 2021-12-03 | 浙江大华技术股份有限公司 | 一种网络模型的训练方法、回声消除方法及设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2528297B2 (ja) | 1985-12-17 | 1996-08-28 | ハミルトン・ボナド−ツ・アクチエンゲゼルシヤフト | ピペツトとピペツト装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940007768B1 (ko) * | 1992-01-21 | 1994-08-25 | 조병관 | 겉껍데기와 속꺼풀에 싸여진 견과물(堅果物)의 박피방법 |
JP3410756B2 (ja) * | 1993-03-18 | 2003-05-26 | シャープ株式会社 | 音声認識装置 |
KR101082837B1 (ko) * | 2008-12-22 | 2011-11-11 | 한국전자통신연구원 | 잡음 제거 장치 및 방법 |
KR101452396B1 (ko) * | 2013-04-08 | 2014-10-27 | 싸니코전자 주식회사 | 복수의 음향통과홀을 구비한 멤스 마이크로폰 |
-
2017
- 2017-10-17 KR KR1020170134598A patent/KR20190042928A/ko not_active Ceased
-
2018
- 2018-10-16 WO PCT/KR2018/012142 patent/WO2019078567A1/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2528297B2 (ja) | 1985-12-17 | 1996-08-28 | ハミルトン・ボナド−ツ・アクチエンゲゼルシヤフト | ピペツトとピペツト装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744748A (zh) * | 2021-08-06 | 2021-12-03 | 浙江大华技术股份有限公司 | 一种网络模型的训练方法、回声消除方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019078567A1 (ko) | 2019-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3819903B1 (en) | Audio data processing method and apparatus, device and storage medium | |
CN109326302B (zh) | 一种基于声纹比对和生成对抗网络的语音增强方法 | |
US10504539B2 (en) | Voice activity detection systems and methods | |
CN111370014B (zh) | 多流目标-语音检测和信道融合的系统和方法 | |
US9881616B2 (en) | Method and systems having improved speech recognition | |
Kurzekar et al. | A comparative study of feature extraction techniques for speech recognition system | |
US10460729B1 (en) | Binary target acoustic trigger detecton | |
KR102270954B1 (ko) | 심층 신경망 및 순환 신경망의 복층 구조에 기반한 음성 검출 장치 및 방법. | |
EP1429314A1 (en) | Correction of energy as input feature for speech processing | |
CN105845139A (zh) | 一种离线语音控制方法和装置 | |
Chakravarty et al. | Spoof detection using sequentially integrated image and audio features | |
WO2000077772A2 (en) | Speech and voice signal preprocessing | |
KR20210000802A (ko) | 인공지능 음성 인식 처리 방법 및 시스템 | |
Kumar et al. | Speech-to-text Transfiguration in Language Numerals for Perpetual Deaf Patients | |
JPH02298998A (ja) | 音声認識装置とその方法 | |
CN110728993A (zh) | 一种变声识别方法及电子设备 | |
KR20190042928A (ko) | 소리 신호를 처리하는 반도체 장치 및 이를 포함하는 마이크 장치 | |
Soni et al. | Novel Subband Autoencoder Features for Detection of Spoofed Speech. | |
KR101361034B1 (ko) | 하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 | |
Marimuthu | Speech recognition using Taylor-gradient Descent political optimization based Deep residual network | |
Sailor et al. | Unsupervised Representation Learning Using Convolutional Restricted Boltzmann Machine for Spoof Speech Detection. | |
KR20180087038A (ko) | 화자 특성을 고려하는 음성합성 기능의 보청기 및 그 보청 방법 | |
KR100587260B1 (ko) | 음향 기기의 음성인식장치 | |
JP2002229592A (ja) | 音声認識装置 | |
JP4364493B2 (ja) | 信号抽出システム、信号抽出方法および信号抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20171017 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190726 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20200115 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20190726 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |