[go: up one dir, main page]

KR102364935B1 - 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 - Google Patents

5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 Download PDF

Info

Publication number
KR102364935B1
KR102364935B1 KR1020190176417A KR20190176417A KR102364935B1 KR 102364935 B1 KR102364935 B1 KR 102364935B1 KR 1020190176417 A KR1020190176417 A KR 1020190176417A KR 20190176417 A KR20190176417 A KR 20190176417A KR 102364935 B1 KR102364935 B1 KR 102364935B1
Authority
KR
South Korea
Prior art keywords
voice signal
text information
user
voice
data transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020190176417A
Other languages
English (en)
Other versions
KR20210083782A (ko
Inventor
조용석
Original Assignee
주식회사 포켓메모리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 포켓메모리 filed Critical 주식회사 포켓메모리
Priority to KR1020190176417A priority Critical patent/KR102364935B1/ko
Publication of KR20210083782A publication Critical patent/KR20210083782A/ko
Application granted granted Critical
Publication of KR102364935B1 publication Critical patent/KR102364935B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법은 (a) 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 단계; (b) 음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하는 단계; (c) 상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계; 및 (d) 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;를 포함할 수 있다.

Description

5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치{A method and apparatus for data transmission for improving 5G-based speech recognition response speed}
본 발명은 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치에 관한 것으로, 더욱 상세하게는 실시간 단어 분석을 통한 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치에 관한 것이다.
음성 인식 기술은 미리 수집된 음성데이터로부터 각 음소별 확률 모델을 미리 학습하고, 이후 입력된 음성데이터가 어느 음소에 가장 가까운지를 판단하여 이로부터 음소열을 추정하는 방식을 사용한다. 이때 사용하는 각 음소별 확률 모델을 음향모델이라고 부르며, 음향모델은 음성 인식 기술의 성능을 좌우하는 중요한 요소 중에 하나이다.
최근 음성 인식 기술의 관심이 집중되면서, 음성 인식을 용이하게 하기 위한 다양한 알고리즘이 제안되었다. 다만, 기존의 음성 인식 기술은 음성 인식을 어떠한 방식으로 수행할 것인지에 대한 연구만이 진행되고 있을 뿐, 음성인식 반응속도를 향상시키기 위한 방식을 제시하지 못하는 문제점이 있다.
[특허문헌 1] 한국공개특허 제10-2019-0035454호
본 발명은 전술한 문제점을 해결하기 위하여 창출된 것으로, 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치를 제공하는 것을 그 목적으로 한다.
본 발명은 사용자의 제1 음성 신호로부터 변환된 제1 텍스트 정보를 이용하여 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하기 위한 방법 및 장치를 제공하는 것을 그 목적으로 한다.
본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
상기한 목적들을 달성하기 위하여, 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법은 (a) 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 단계; (b) 음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하는 단계; (c) 상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계; 및 (d) 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;를 포함할 수 있다.
실시예에서, 상기 (a) 단계는, 상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득하는 단계;를 포함할 수 있다.
실시예에서, 상기 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법은 상기 (c) 단계와 (d) 단계 사이에, 상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신하는 단계;를 더 포함할 수 있다.
실시예에서, 상기 (d) 단계는, 상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하는 단계; 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하는 단계; 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;를 포함할 수 있다.
실시예에서, 상기 (d) 단계는, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하는 단계; 및 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;를 포함할 수 있다.
실시예에서, 상기 (c) 단계는, 상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계;를 포함할 수 있다.
실시예에서, 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치는 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 통신부; 및 음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하고, 상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 제어부;를 포함하고, 상기 통신부는, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
실시예에서, 상기 통신부는, 상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득할 수 있다.
실시예에서, 상기 통신부는, 상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신할 수 있다.
실시예에서, 상기 제어부는, 상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하고, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하고, 상기 통신부는, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
실시예에서, 상기 제어부는, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하고, 상기 통신부는, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
실시예에서, 상기 제어부는, 상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정할 수 있다.
상기한 목적들을 달성하기 위한 구체적인 사항들은 첨부된 도면과 함께 상세하게 후술될 실시예들을 참조하면 명확해질 것이다.
그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라, 서로 다른 다양한 형태로 구성될 수 있으며, 본 발명의 개시가 완전하도록 하고 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자(이하, "통상의 기술자")에게 발명의 범주를 완전하게 알려주기 위해서 제공되는 것이다.
본 발명의 일 실시예에 의하면, 사용자의 제1 음성 신호로부터 변환된 제1 텍스트 정보를 이용하여 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정함으로써, 음성인식 반응속도를 향상시킬 수 있다.
본 발명의 효과들은 상술된 효과들로 제한되지 않으며, 본 발명의 기술적 특징들에 의하여 기대되는 잠정적인 효과들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 음성인식 시스템을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 사용자의 음성 신호를 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법을 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치를 도시한 도면이다.
본 발명은 다양한 변경을 가할 수 있고, 여러 가지 실시예들을 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다.
청구범위에 개시된 발명의 다양한 특징들은 도면 및 상세한 설명을 고려하여 더 잘 이해될 수 있을 것이다. 명세서에 개시된 장치, 방법, 제법 및 다양한 실시예들은 예시를 위해서 제공되는 것이다. 개시된 구조 및 기능상의 특징들은 통상의 기술자로 하여금 다양한 실시예들을 구체적으로 실시할 수 있도록 하기 위한 것이고, 발명의 범위를 제한하기 위한 것이 아니다. 개시된 용어 및 문장들은 개시된 발명의 다양한 특징들을 이해하기 쉽게 설명하기 위한 것이고, 발명의 범위를 제한하기 위한 것이 아니다.
본 발명을 설명함에 있어서, 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 상세한 설명을 생략한다.
이하, 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치를 설명한다.
도 1은 본 발명의 일 실시예에 따른 음성인식 시스템(100)을 도시한 도면이다. 도 2는 본 발명의 일 실시예에 따른 사용자의 음성 신호를 도시한 도면이다.
도 1을 참고하면, 음성인식 시스템(100)은 사용자 단말(110)과 클라우드 서버(120)를 포함할 수 있다.
사용자에 의해 일정 데시벨(decibel, dB) 이상의 음성 신호가 발생되는 경우, 사용자 단말(110)은 해당 음성 신호를 일정 데시벨 이하로 측정될 때까지 획득할 수 있다.
이후, 사용자 단말(110)은 획득되는 음성 신호를 실시간으로 클라우드 서버(120)에게 송신할 수 있다.
클라우드 서버(120)는 실시간으로 수신된 음성 신호를 음성인식 분석하여, 음성 신호를 텍스트 정보로 변환하여 텍스트 정보를 사용자 단말(110)에게 송신할 수 있다.
예를 들어, 도 2를 참고하면, 클라우드 서버(120)는 사용자 단말(110)로부터 시간 구간 T1에서 획득된 음성 신호 A를 수신할 수 있다. 이후, 클라우드 서버(120)는 실시간으로 음성 신호 A를 텍스트 정보 A로 변환하여 사용자 단말(110)에게 송신할 수 있다.
또한, 클라우드 서버(120)는 사용자 단말(110)로부터 시간 구간 T2에서 획득된 음성 신호 B를 수신할 수 있다. 이후, 클라우드 서버(120)는 실시간으로 음성 신호 B를 텍스트 정보 B로 변환하여 사용자 단말(110)에게 송신할 수 있다.
즉, 본 발명에 따르면, 사용자의 음성 신호 전체를 수신한 후, 이를 음성 인식하는 것이 아니라, 실시간으로 획득된 음성 신호를 바로 음성 인식하여 분석 후, 해당 문장의 의미를 빠르게 파악할 수 있으며, 이로 인해, 음성 인식의 반응속도를 향상시킬 수 있다.
또한, 클라우드 서버(120)는 획득된 음성 신호 A와 음성 신호 B를 이용하여, 다음 시간 구간 T3에 수신될 것으로 예측되는 음성 신호 C를 추정할 수 있다. 즉, 기존 대화 내용(예: 음성 신호 A)와 현재 단어(예: 음성 신호 B)를 통해 미래 변환할 내용(예: 음성 신호 C)를 빠르게 예측하여 반응속도를 개선할 수 있다.
일 실시예에서, 사용자 단말(110)은 키오스크(kiosk), 스마트폰, 태블릿 PC, 노트북 등 다양한 형태로 구현될 수 있으나, 이에 제한되지 않는다.
도 3은 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법을 도시한 도면이다. 일 실시예에서, 도 3의 각 단계는 클라우드 서버(120)에 의해 수행될 수 있다.
도 3을 참고하면, S301 단계는, 사용자 단말(110)로부터 사용자의 제1 음성 신호를 수신하는 단계이다. 일 실시예에서, 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 사용자의 제1 음성 신호를 획득할 수 있다.
S303 단계는, 음성인식을 통해 제1 음성 신호를 제1 텍스트 정보로 변환하는 단계이다.
S305 단계는, 제1 텍스트 정보를 이용하여 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계이다. 일 실시예에서, 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정할 수 있다.
일 실시예에서, S305 단계와 S307 단계 사이에, 사용자 단말(110)로부터 사용자의 제2 음성 신호를 수신할 수 있다. 이후, 상기 추정된 제2 텍스트 정보를 제2 음성 신호로 역변환할 수 있다. 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단할 수 있다.
일 실시예에서, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 수신된 제2 음성 신호를 별도로 제2 텍스트 정보로 변환하는 음성인식 과정을 거치지 않고, 바로 사용자 단말(110)에게 상기 제1 텍스트 정보 및 상기 추정된 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
일 실시예에서, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환할 수 있다. 이후, 사용자 단말(110)에게 상기 제1 텍스트 정보 및 상기 변환된 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
S307 단계는, 사용자 단말(110)에게 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계이다.
일 실시예에서, 제1 텍스트 정보 및 제2 텍스트 정보를 이용하여, 사용자의 제1 음성 신호 및 제2 음성 신호에 대응하는 답변 메시지를 생성하고, 생성된 답변 메시지를 사용자 단말(110)에게 송신할 수 있다.
일 실시예에서, 종래와 같이, 사용자 단말(110)이 음성 분석(STT(Speech to Text) 이후 분석)을 기존에 다 끝나고, 클라우드 서버(120)로 보내서 한번에 분석하고, 다시 받아오는 형태(TTS(Text-to-Speech))가 아니라, 본 발명에 따르면, 핵심 단어부터 순차적으로 보내서, 실시간으로 바로 단어 분석 후, 해당 문장의 의미를 빠르게 파악해서, 답변하여 반응속도를 향상시킬 수 있다.
도 4는 본 발명의 일 실시예에 따른 5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치(400)를 도시한 도면이다.
도 4를 참고하면, 데이터 전송 장치(400)는 통신부(410), 제어부(420), 및 저장부(430)를 포함할 수 있다. 일 실시예에서, 데이터 전송 장치(400)는 클라우드 서버(120)를 포함할 수 있다.
통신부(410)는 사용자 단말(110)로부터 사용자의 제1 음성 신호를 수신할 수 있다. 일 실시예에서, 통신부(410)는 사용자 단말(110)에게 제1 음성 신호로부터 변환된 제1 텍스트 정보 및 제2 음성 신호에 대응하여 추정된 제2 텍스트 정보 중 적어도 하나를 송신할 수 있다.
일 실시예에서, 통신부(410)는 유선 통신 모듈 및 무선 통신 모듈 중 적어도 하나를 포함할 수 있다. 통신부(410)의 전부 또는 일부는 '송신부', '수신부' 또는 '송수신부(transceiver)'로 지칭될 수 있다.
제어부(420)는 음성인식을 통해 제1 음성 신호를 제1 텍스트 정보로 변환하고, 제1 텍스트 정보를 이용하여 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정할 수 있다.
일 실시예에서, 제어부(420)는 적어도 하나의 프로세서 또는 마이크로(micro) 프로세서를 포함하거나, 또는, 프로세서의 일부일 수 있다. 또한, 제어부(420)는 CP(communication processor)라 지칭될 수 있다. 제어부(420)는 본 발명의 다양한 실시예에 따른 데이터 전송 장치(400)의 동작을 제어할 수 있다.
저장부(430)는 사용자 단말(110)로부터 수신된 음성 신호들과 각 음성 신호에 대응하는 텍스트 정보를 저장할 수 있다. 일 실시예에서, 저장부(430)는 음성인식 인공지능 학습모델을 저장할 수 있다.
일 실시예에서, 저장부(430)는 휘발성 메모리, 비휘발성 메모리 또는 휘발성 메모리와 비휘발성 메모리의 조합으로 구성될 수 있다. 그리고, 저장부(430)는 제어부(420)의 요청에 따라 저장된 데이터를 제공할 수 있다.
도 4를 참고하면, 데이터 전송 장치(400)는 통신부(410), 제어부(420), 및 저장부(430)를 포함할 수 있다. 본 발명의 다양한 실시 예들에서 데이터 전송 장치(400)는 도 4에 설명된 구성들이 필수적인 것은 아니어서, 도 4에 설명된 구성들보다 많은 구성들을 가지거나, 또는 그보다 적은 구성들을 가지는 것으로 구현될 수 있다.
이상의 설명은 본 발명의 기술적 사상을 예시적으로 설명한 것에 불과한 것으로, 통상의 기술자라면 본 발명의 본질적인 특성이 벗어나지 않는 범위에서 다양한 변경 및 수정이 가능할 것이다.
따라서, 본 명세서에 개시된 실시예들은 본 발명의 기술적 사상을 한정하기 위한 것이 아니라, 설명하기 위한 것이고, 이러한 실시예들에 의하여 본 발명의 범위가 한정되는 것은 아니다.
본 발명의 보호범위는 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 이해되어야 한다.
100: 음성인식 시스템
110: 사용자 단말
120: 클라우드 서버
400: 데이터 전송 장치
410: 통신부
420: 제어부
430: 저장부

Claims (12)

  1. 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 단계;
    음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하는 단계;
    상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계;
    상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신하는 단계;
    상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하는 단계;
    상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하는 단계; 및
    상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;
    를 포함하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
  2. 제1항에 있어서,
    상기 제1 음성 신호를 수신하는 단계는,
    상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득하는 단계;
    를 포함하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 송신하는 단계는,
    상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하는 단계; 및
    상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는 단계;
    를 포함하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
  6. 제1항에 있어서,
    상기 추정하는 단계는,
    상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 단계;
    를 포함하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법.
  7. 사용자 단말로부터 사용자의 제1 음성 신호를 수신하는 통신부; 및
    음성인식을 통해 상기 제1 음성 신호를 제1 텍스트 정보로 변환하고,
    상기 제1 텍스트 정보를 이용하여 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는 제어부;
    를 포함하고,
    상기 통신부는, 상기 사용자 단말로부터 상기 사용자의 제2 음성 신호를 수신하고,
    상기 제어부는, 상기 추정된 제2 텍스트 정보를 상기 제2 음성 신호로 역변환하고, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는지 여부를 판단하고,
    상기 통신부는, 상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하는 경우, 상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
  8. 제7항에 있어서,
    상기 통신부는,
    상기 제1 음성 신호의 데시벨(decibel, dB)이 임계값 이상인 경우, 상기 사용자의 제1 음성 신호를 획득하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
  9. 삭제
  10. 삭제
  11. 제7항에 있어서,
    상기 제어부는,
    상기 역변환된 제2 음성 신호와 상기 수신된 제2 음성 신호가 일치하지 않는 경우, 상기 음성인식을 통해 상기 수신된 제2 음성 신호를 제2 텍스트 정보로 변환하고,
    상기 통신부는,
    상기 사용자 단말에게 상기 제1 텍스트 정보 및 제2 텍스트 정보 중 적어도 하나를 송신하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.
  12. 제7항에 있어서,
    상기 제어부는,
    상기 제1 텍스트 정보를 음성인식 인공지능 학습모델에 적용하여, 상기 사용자의 제2 음성 신호에 대응하는 제2 텍스트 정보를 추정하는,
    5G 기반의 음성인식 반응속도 개선을 위한 데이터 전송 장치.

KR1020190176417A 2019-12-27 2019-12-27 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치 Active KR102364935B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190176417A KR102364935B1 (ko) 2019-12-27 2019-12-27 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190176417A KR102364935B1 (ko) 2019-12-27 2019-12-27 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210083782A KR20210083782A (ko) 2021-07-07
KR102364935B1 true KR102364935B1 (ko) 2022-02-18

Family

ID=76862083

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190176417A Active KR102364935B1 (ko) 2019-12-27 2019-12-27 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102364935B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008268340A (ja) * 2007-04-17 2008-11-06 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識用プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102549204B1 (ko) 2017-09-26 2023-06-30 주식회사 케이티 음성인식 서비스를 제공하는 단말, 서버 및 방법
KR20190092168A (ko) * 2018-01-30 2019-08-07 주식회사 엘지유플러스 보이스 리스폰스를 제공하는 방법 및 그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008268340A (ja) * 2007-04-17 2008-11-06 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識用プログラム

Also Published As

Publication number Publication date
KR20210083782A (ko) 2021-07-07

Similar Documents

Publication Publication Date Title
JP6828001B2 (ja) 音声ウェイクアップ方法及び装置
JP6613347B2 (ja) 情報をプッシュする方法及び装置
CN110049270B (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
US11869487B1 (en) Allocation of local and remote resources for speech processing
US11227129B2 (en) Language translation device and language translation method
KR102611751B1 (ko) 키 문구 사용자 인식의 증강
CN110047481B (zh) 用于语音识别的方法和装置
US20190392858A1 (en) Intelligent voice outputting method, apparatus, and intelligent computing device
CN104766608A (zh) 一种语音控制方法及装置
US11790893B2 (en) Voice processing method based on artificial intelligence
JP2015135494A (ja) 音声認識方法及び装置
KR20150063423A (ko) Asr을 위한 개선된 하이브리드 컨트롤러
CN109712610A (zh) 用于识别语音的方法和装置
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN105206272A (zh) 语音传输控制方法及系统
KR20150145024A (ko) 화자적응 음성인식 시스템의 단말 및 서버와 그 운용 방법
KR20200074690A (ko) 전자 장치 및 이의 제어 방법
KR20210153165A (ko) 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법
CN113674742A (zh) 人机交互方法、装置、设备以及存储介质
JP2018045190A (ja) 音声対話システムおよび音声対話方法
US20230186036A1 (en) Method and apparatus for providing interpretation situation information
KR102364935B1 (ko) 5g 기반의 음성인식 반응속도 개선을 위한 데이터 전송 방법 및 장치
CN116075888A (zh) 用于减少云服务中的延迟的系统和方法
EP3839719B1 (en) Computing device and method of operating the same
US20230282203A1 (en) Information processing apparatus and information processing method

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20191227

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20210524

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20211115

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20220215

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20220215

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20250203

Start annual number: 4

End annual number: 4