KR102364935B1 - 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 - Google Patents
5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 Download PDFInfo
- Publication number
- KR102364935B1 KR102364935B1 KR1020190176417A KR20190176417A KR102364935B1 KR 102364935 B1 KR102364935 B1 KR 102364935B1 KR 1020190176417 A KR1020190176417 A KR 1020190176417A KR 20190176417 A KR20190176417 A KR 20190176417A KR 102364935 B1 KR102364935 B1 KR 102364935B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice signal
- text information
- user
- voice
- data transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims description 26
- 238000000034 method Methods 0.000 title claims description 21
- 230000004044 response Effects 0.000 title claims description 21
- 238000004891 communication Methods 0.000 claims description 21
- 238000013473 artificial intelligence Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000036632 reaction speed Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 사용자의 음성 신호를 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법을 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치를 도시한 도면이다.
110: 사용자 단말
120: 클라우드 서버
400: 데이터 전송 장치
410: 통신부
420: 제어부
430: 저장부
Claims (12)
- 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 단계;
음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하는 단계;
상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계;
상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신하는 단계;
상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하는 단계;
상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하는 단계; 및
상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;
를 포함하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
- 제1항에 있어서,
상기 제1 음성 신호를 수신하는 단계는,
상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득하는 단계;
를 포함하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
- 삭제
- 삭제
- 제1항에 있어서,
상기 송신하는 단계는,
상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하는 단계; 및
상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;
를 포함하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
- 제1항에 있어서,
상기 추정하는 단계는,
상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계;
를 포함하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
- 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 통신부; 및
음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하고,
상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 제어부;
를 포함하고,
상기 통신부는, 상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신하고,
상기 제어부는, 상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하고, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하고,
상기 통신부는, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
- 제7항에 있어서,
상기 통신부는,
상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
- 삭제
- 삭제
- 제7항에 있어서,
상기 제어부는,
상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하고,
상기 통신부는,
상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
- 제7항에 있어서,
상기 제어부는,
상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는,
5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190176417A KR102364935B1 (ko) | 2019-12-27 | 2019-12-27 | 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190176417A KR102364935B1 (ko) | 2019-12-27 | 2019-12-27 | 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210083782A KR20210083782A (ko) | 2021-07-07 |
KR102364935B1 true KR102364935B1 (ko) | 2022-02-18 |
Family
ID=76862083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190176417A Active KR102364935B1 (ko) | 2019-12-27 | 2019-12-27 | 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102364935B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008268340A (ja) * | 2007-04-17 | 2008-11-06 | Honda Motor Co Ltd | 音声認識装置、音声認識方法、及び音声認識用プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102549204B1 (ko) | 2017-09-26 | 2023-06-30 | 주식회사 케이티 | 음성인식 서비스를 제공하는 단말, 서버 및 방법 |
KR20190092168A (ko) * | 2018-01-30 | 2019-08-07 | 주식회사 엘지유플러스 | 보이스 리스폰스를 제공하는 방법 및 그 장치 |
-
2019
- 2019-12-27 KR KR1020190176417A patent/KR102364935B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008268340A (ja) * | 2007-04-17 | 2008-11-06 | Honda Motor Co Ltd | 音声認識装置、音声認識方法、及び音声認識用プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20210083782A (ko) | 2021-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6828001B2 (ja) | 音声ウェイクアップ方法及び装置 | |
JP6613347B2 (ja) | 情報をプッシュする方法及び装置 | |
CN110049270B (zh) | 多人会议语音转写方法、装置、系统、设备及存储介质 | |
US11869487B1 (en) | Allocation of local and remote resources for speech processing | |
US11227129B2 (en) | Language translation device and language translation method | |
KR102611751B1 (ko) | 키 문구 사용자 인식의 증강 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
US20190392858A1 (en) | Intelligent voice outputting method, apparatus, and intelligent computing device | |
CN104766608A (zh) | 一种语音控制方法及装置 | |
US11790893B2 (en) | Voice processing method based on artificial intelligence | |
JP2015135494A (ja) | 音声認識方法及び装置 | |
KR20150063423A (ko) | Asr을 위한 개선된 하이브리드 컨트롤러 | |
CN109712610A (zh) | 用于识别语音的方法和装置 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN105206272A (zh) | 语音传输控制方法及系统 | |
KR20150145024A (ko) | 화자적응 음성인식 시스템의 단말 및 서버와 그 운용 방법 | |
KR20200074690A (ko) | 전자 장치 및 이의 제어 방법 | |
KR20210153165A (ko) | 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법 | |
CN113674742A (zh) | 人机交互方法、装置、设备以及存储介质 | |
JP2018045190A (ja) | 音声対話システムおよび音声対話方法 | |
US20230186036A1 (en) | Method and apparatus for providing interpretation situation information | |
KR102364935B1 (ko) | 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 | |
CN116075888A (zh) | 用于减少云服务中的延迟的系统和方法 | |
EP3839719B1 (en) | Computing device and method of operating the same | |
US20230282203A1 (en) | Information processing apparatus and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20191227 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210524 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211115 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220215 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220215 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20250203 Start annual number: 4 End annual number: 4 |