[go: up one dir, main page]

KR101595090B1 - 음성 인식을 이용한 정보 검색 방법 및 장치 - Google Patents

음성 인식을 이용한 정보 검색 방법 및 장치 Download PDF

Info

Publication number
KR101595090B1
KR101595090B1 KR1020150061412A KR20150061412A KR101595090B1 KR 101595090 B1 KR101595090 B1 KR 101595090B1 KR 1020150061412 A KR1020150061412 A KR 1020150061412A KR 20150061412 A KR20150061412 A KR 20150061412A KR 101595090 B1 KR101595090 B1 KR 101595090B1
Authority
KR
South Korea
Prior art keywords
voice data
input
voice
microphone
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020150061412A
Other languages
English (en)
Inventor
박은민
정상우
김기영
Original Assignee
주식회사 아마다스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아마다스 filed Critical 주식회사 아마다스
Priority to KR1020150061412A priority Critical patent/KR101595090B1/ko
Application granted granted Critical
Publication of KR101595090B1 publication Critical patent/KR101595090B1/ko
Priority to US15/570,587 priority patent/US10403277B2/en
Priority to PCT/KR2016/002168 priority patent/WO2016175443A1/ko
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06F17/30743
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F17/30755
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 정보 검색 방법 및 장치에 관한 것으로서, 상세하게는 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 반복적으로 입력되는 경우 그 음성 데이터에 대응하는 정보를 검색하여 사용자에게 제공하는 음성 인식을 이용한 정보 검색 방법 및 장치에 관한 것이다. 이를 위하여, 본 발명에 따른 음성 인식을 이용한 정보 검색 방법은 마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와, 상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와, 상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와, 상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함한다.

Description

음성 인식을 이용한 정보 검색 방법 및 장치{Information searching method and apparatus using voice recognition}
본 발명은 정보 검색 방법 및 장치에 관한 것으로서, 상세하게는 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 반복적으로 입력되는 경우 그 음성 데이터에 대응하는 정보를 검색하여 사용자에게 제공하는 음성 인식을 이용한 정보 검색 방법 및 장치에 관한 것이다.
스마트폰은 휴대의 편이성과 함께 작은 크기에 집약된 데이터 통신, 일정관리, 인터넷 검색, 위치기반 서비스 등 다양한 기능으로 매우 대중적인 스마트기기가 되었다. 그런데 스마트폰을 대상으로 하는 데이터의 입력, 정보검색, 각종 기능조작 등은 작은 크기의 단말기 화면으로 인해 사용이 다소 불편한 점이 있다.
특히 사용자가 데이터 검색을 위해 텍스트 데이터를 입력하거나 각종 프로그램 등을 조작하고자 할 때 그 불편함이 가중된다. 이러한 사용자 인터페이스를 개선하기 위한 방법으로 음성 인식을 적용한 방법이 연구되고 있다. 이 방법은 사용자의 음성을 인식하여 기기상의 프로그램을 실행 또는 제어하거나 데이터의 입력을 가능하게 한다.
또한 최근에는 스마트폰에서 사용자의 음성을 인식하여 그 음성에 대응하는 각종 정보를 검색하여 제공하는 서비스가 실현되고 있다.
즉, 종래 음성인식 기반의 서비스는 사용자가 의식적으로 의도하여 발성한 음성을 입력받아 그 음성이 인식되면 즉각적으로 그에 대응하는 정보를 제공하는 것을 상정하고 있다.
그러나 이러한 방식에서는 사용자 음성이 인식되는 대로 계속해서 정보를 검색하여 제공하기 때문에, 사용자가 의도하지 않고 무심코 내뱉은 말도 인식이 되는 한 해당 정보가 출력되어 음성인식 모듈이 활성화된 상태에서는 음성인식에 따른 무차별 검색에 따라 그 제공되는 정보가 오히려 사용자에게 소음이나 공해가 될 수 있는 문제점이 있다.
등록특허 제10-1322394호
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 본 발명의 목적은 사용자 음성이 인식되는 대로 정보 검색이 모두 수행되어 오히려 원치 않은 정보를 제공받게 되는 상황을 방지할 수 있는 음성 인식을 이용한 정보 검색 및 장치를 제공하는 것이다.
본 발명의 다른 목적은 사용자가 의식적이든 무의식적이든 사용자의 음성을 통해 사용자가 관심 있어 하는 내용에 근접한 정보 검색을 수행할 수 있는 음성 인식을 이용한 정보 검색 및 장치를 제공하는 것이다.
이를 위하여, 본 발명에 따른 음성 인식을 이용한 정보 검색 방법은 마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와, 상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와, 상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와, 상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함한다.
또한 본 발명에 따른 음성 인식을 이용한 정보 검색 장치는 정보 검색의 대상이 되는 음성 데이터를 저장하는 사용자 정의 음성 데이터베이스와, 마이크를 통해 입력된 음성 데이터를 상기 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 음성 비교부와, 상기 마이크를 통해 입력된 음성 데이터를 임시 저장하는 메모리와, 검색 서버와 데이터를 송수신하는 통신부와, 상기 음성 비교부에 의한 비교 결과 일치하는 음성 데이터가 존재하고 음성 데이터의 반복 입력이 설정되어 있으면, 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하여 일치하는 음성 데이터가 존재하면 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 제어부를 포함한다.
상술한 바와 같이, 본 발명에 따르면 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 또한 반복적으로 입력되는 경우에 한하여 그 음성 데이터에 대응하는 정보를 검색하기 때문에 사용자가 무심코 내뱉은 말이나 의도하지 않은 말에 대하여 자동으로 정보가 검색되는 현상을 방지할 수 있다.
이에 따라 사용자는 의도적으로 검색하고자 하는 단어를 반복하든지 또는 의도하지 않더라도 관심 있어 하는 내용에 대해서는 무의식적으로 그 내용에 해당하는 단어를 반복할 개연성이 높기 때문에 불필요한 정보의 검색을 방지하고 사용자에게 최적의 정보를 신속하게 제공할 수 있는 효과가 있다.
도 1은 본 발명에 따른 정보 검색 시스템의 개략적 구성도.
도 2는 본 발명에 따른 음성 인식을 이용한 정보 검색 장치의 내부 구성도.
도 3은 본 발명에 따른 음성 인식을 이용한 정보 검색 방법의 순서도.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다.
본 발명의 상세한 설명에 앞서, 동일한 구성요소에 대해서는 다른 도면상에 표시되더라도 가능한 동일한 부호로 표시하며, 공지된 구성에 대해서는 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 구체적인 설명은 생략하기로 함에 유의한다.
도 1은 본 발명에 따른 음성 인식을 이용한 정보 검색 시스템의 개략적 구성을 나타낸 것이다.
도 1을 참조하면, 정보 검색 시스템은 사용자가 소지한 정보 검색 단말(100) 및 서비스업자가 보유한 검색 서버(200)로 구성되며, 정보 검색 단말(100)과 검색 서버(200)는 통신망을 통해 상호 접속되어 있다.
정보 검색 단말(100)은 음성인식 모듈을 구비하여 사용자의 음성을 인식하고 그 인식한 음성에 대응하는 각종 정보를 검색 서버(200)로부터 제공받아 사용자에게 출력하는 장치이다.
정보 검색 단말(100)은 스마트폰, 태블릿 PC, 노트북, 퍼스널 컴퓨터 등의 장치가 될 수 있으나, 이에 한정하는 것은 아니며 정보 검색을 위한 전용 장치이거나 또는 별도의 장치가 아닌 정보 검색 기능이 IoT 기반의 도어락, 자동차, 홈 네트워크 시스템 등에 내장되어 구현될 수 있다.
검색 서버(200)는 정보 검색 단말(100)로부터 음성 인식 기반의 정보 검색 요청을 받아 인식된 음성에 대응하는 정보를 검색 엔진을 통해 검색하여 검색된 정보를 정보 검색 단말(100)에 제공한다.
도 2는 본 발명에 따른 음성 인식을 이용한 정보 검색 장치의 내부 구성을 나타낸 것이다.
도 2를 참조하면, 음성 인식을 이용한 정보 검색 장치는 마이크(11), 음성 처리부(13), 표시부(15), 스피커(17), 사용자 정의 음성 DB(19), 메모리(21), 통신부(23), 음성 비교부(25), 제어부(27) 등을 포함한다.
마이크(11)는 사용자의 음성을 전기 신호로 변환하고, 음성 처리부(13)는 마이크(11)로부터 입력된 전기 신호를 처리하여 디지털 신호로 변환한다. 음성 처리부(13)에서 처리된 디지털 신호인 음성 데이터는 제어부(27)로 입력된다.
표시부(15)는 정보 검색 장치의 상태를 시각적으로 출력하는 부분으로, 특히 인식된 음성에 대응하는 각종 정보를 사용자에게 표시한다. 표시부(15)는 터치스크린으로 구현될 수 있으며, 이 경우 표시부(15)는 디스플레이 기능 외에 입력 인터페이스의 역할도 동시에 수행한다.
본 발명의 실시예에 따르면 사용자는 표시부(15)의 입력 인터페이스를 통해 반복 입력을 설정할 수 있다. 여기서, 반복 입력 설정이란 마이크(11)를 통해 입력되는 음성 데이터가 2번 이상 중복되는 경우에 한하여 정보 검색을 실행하도록 하기 위한 검색 설정 옵션을 말한다. 사용자는 입력 인터페이스를 통해 반복 입력을 설정하고 그 반복 횟수를 임의로 입력할 수 있다.
스피커(17)는 정보 검색 장치의 상태를 청각적으로 출력하는 부분으로, 특히 인식된 음성에 대응하는 정보를 검색하거나 검색한 정보를 제공할 때 이를 사용자에게 알리기 위해 기계음, 음향(예를 들어, '빙고'라는 소리) 등의 청각적 이벤트를 출력한다.
사용자 정의 음성 데이터베이스(DB)(19)는 사용자가 미리 정의해 놓은 검색 대상의 음성 데이터를 저장하고 있는 공간이다. 사용자 정의 음성 데이터베이스(19)는 정보 검색 장치 내에 존재할 수 있으나 검색 서버(200)나 인터넷상의 다른 공간에 존재할 수 있다. 사용자 정의 음성 데이터베이스(19)는 정보 검색 장치 내부에 존재하든 외부 서버에 존재하든 주기적으로 갱신된다.
메모리(21)는 각종 프로그램 및 데이터를 저장하는 부분으로, 롬(ROM), 램(RAM), 플래시 메모리 등을 포함하며, 메모리(21) 중에서 플래시 메모리는 마이크(11)를 통해 입력된 음성 데이터를 임시 저장하거나 사용자의 설정 정보(예를 들어, 상기 반복 입력 설정)를 저장한다.
통신부(23)는 검색 서버(200)와 데이터를 송수신하는 부분이다. 통신부(23)는 음성 데이터에 대응하는 정보 검색 요청 신호를 검색 서버(200)로 전송하고, 검색 서버(200)로부터 각종 정보를 수신한다. 통신부(23)는 데이터 통신을 위해 LTE, LTE-A 등의 이동통신모듈, Wi-Fi 등의 무선 인터넷 통신모듈, 이더넷 등의 유선 인터넷 통신모듈 등으로 구성될 수 있다.
음성 비교부(25)는 마이크(11)를 통해 입력된 음성 데이터와 사용자 정의 음성 데이터베이스(19)에 저장된 음성 데이터를 비교하는 부분이다. 즉, 음성 비교부(25)는 사용자 정의 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 동일한 음성 데이터가 존재하는지 확인한다.
제어부(27)는 음성 비교부(25)에 의한 비교 결과 일치하는 음성 데이터가 존재하는 것으로 확인되면 음성 데이터의 반복 입력이 설정되어 있는지 확인한다.
음성 데이터의 반복 입력이 설정되어 있으면, 제어부(27)는 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인한다.
메모리(21)에 일치하는 음성 데이터가 존재하면 제어부(27)는 사용자에게 정보 검색 또는 제공을 알리기 위한 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버(200)에 요청하기 위한 정보 검색 요청 신호를 생성한다. 만약 음성 데이터의 반복 입력이 설정되어 있지 않으면, 제어부(27)는 곧바로 이벤트를 출력하고 정보 검색 요청 신호를 생성한다.
제어부(27)는 통신부(23)를 통해 정보 검색 요청 신호를 전송한 후, 메모리(21)에 저장된 해당 음성 데이터를 삭제한다.
한편 메모리(21)에 일치하는 음성 데이터가 존재하지 않으면 제어부(27)는 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터를 저장하고, 다시 음성 데이터의 입력을 대기한다.
그리고 마이크(11)를 통해 메모리(21)에 저장된 음성 데이터와 일치하는 음성 데이터가 입력되면 상술한 바와 같이 정보 검색 요청 후에 음성 데이터를 삭제하고, 일치하는 음성 데이터가 입력되지 않으면 음성 데이터가 저장된 시점부터 일정 시간 경과 후에 메모리(21)에서 음성 데이터를 삭제한다.
이와 같이 구성된 본 발명에 따른 정보 검색 장치에서 음성 인식을 이용하여 정보 검색을 처리하는 과정을 도 3을 참조하여 구체적으로 설명한다.
도 3은 본 발명에 따른 음성 인식을 이용한 정보 검색 방법의 순서도를 나타낸 것이다.
먼저, 정보 검색 장치(100)에 구비된 마이크(11)를 통해 사용자의 음성 데이터가 입력되면(S10), 정보 검색 장치(100)는 내부에 구비되거나 또는 외부 서버에 존재하는 사용자 정의 음성 데이터베이스(19)에 접근하여 마이크(11)를 통해 입력된 음성 데이터와 사용자 정의 음성 데이터베이스(19)에 저장된 음성 데이터를 비교함으로써, 마이크(11)를 통해 입력된 음성 데이터가 사용자 정의 음성 데이터베이스(19)에 존재하는지 판단한다(S12).
사용자 정의 음성 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하면, 음성 데이터의 반복 입력이 설정되어 있는지 판단한다(S14). 만약 사용자 정의 음성 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면, 아무런 동작도 발생하지 않으며 다시 음성 데이터의 입력을 대기한다.
상기 단계(S14)의 판단 결과, 음성 데이터의 반복 입력이 설정되어 있으면, 내부 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인한다(S16). 만약 음성 데이터의 반복 입력이 설정되어 있지 않으면 바로 이벤트를 출력하고 그 음성 데이터에 대응하는 정보 검색을 요청한다(S20).
본 발명의 실시예에 따른 이벤트는 정보 검색 및 제공이 가능함을 나타내는 것으로 '빙고' 등 특정 음이 출력되는 청각적 이벤트일 수 있으나, LED 램프가 깜박이는 것과 같은 시각적 이벤트도 가능하며 두 요소가 동시에 출력될 수 있다.
상기 단계(S16)의 확인 결과, 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면, 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터를 저장하고(S18) 다시 음성 데이터의 입력을 대기한다.
만약 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 그 음성 데이터에 대응하는 정보 검색을 요청한다(S20).
음성 데이터에 대응하는 정보 검색을 요청한 후 메모리(21)에 저장된 해당 음성 데이터를 삭제한다(S22). 메모리(21)에 저장된 음성 데이터가 삭제되는 시점은 해당 음성 데이터에 대응하는 정보에 대한 검색 요청 이후이거나 음성 데이터가 메모리(21)에 저장된 다음 일정 시간이 지난 후이다.
이와 같이 사용자 정의 음성 데이터베이스(19)에 검색 대상이 되는 음성 데이터가 존재하되 그 음성 데이터의 반복 입력이 설정되어 있으면 음성 데이터가 일정 시간 안에 중복해서 입력되는 경우에 한하여 정보 검색을 실행함으로써 음성 인식에 따른 무차별적 정보 검색을 방지할 수 있다.
이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다.
따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.
11: 마이크 13: 음성 처리부
15: 표시부 17: 스피커
19: 사용자 정의 음성 DB 21: 메모리
23: 통신부 25: 음성 비교부
27: 제어부 100: 정보검색 단말
200: 검색 서버

Claims (9)

  1. 음성 인식 기반의 정보 검색 장치에서 음성 데이터에 대응하는 정보를 검색하는 방법에 있어서,
    마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와,
    상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와,
    상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와,
    상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함하는 음성 인식을 이용한 정보 검색 방법.
  2. 제1항에 있어서,
    상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있지 않으면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 더 포함하는 것을 음성 인식을 이용한 정보 검색 방법.
  3. 제1항에 있어서,
    상기 확인 결과 일치하는 음성 데이터가 존재하지 않으면 상기 내부 메모리에 상기 입력된 음성 데이터를 저장하는 단계와,
    상기 입력된 음성 데이터가 저장된 후 일정 시간이 지나면 상기 내부 메모리에서 음성 데이터를 삭제하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 방법.
  4. 제1항에 있어서,
    상기 검색 서버로 정보 요청 후 상기 내부 메모리에 저장된 음성 데이터를 삭제하는 단계를 더 포함하는 음성 인식을 이용한 정보 검색 방법.
  5. 정보 검색의 대상이 되는 음성 데이터를 저장하는 사용자 정의 음성 데이터베이스와,
    마이크를 통해 입력된 음성 데이터를 상기 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 음성 비교부와,
    상기 마이크를 통해 입력된 음성 데이터를 임시 저장하는 메모리와,
    검색 서버와 데이터를 송수신하는 통신부와,
    상기 음성 비교부에 의한 비교 결과 일치하는 음성 데이터가 존재하고 음성 데이터의 반복 입력이 설정되어 있으면, 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하여 일치하는 음성 데이터가 존재하면 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 제어부를 포함하는 음성 인식을 이용한 정보 검색 장치.
  6. 제5항에 있어서,
    상기 제어부는 상기 검색 서버로 정보 요청 후 상기 메모리에서 해당 음성 데이터를 삭제하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
  7. 제5항에 있어서,
    상기 제어부는 상기 음성 데이터의 반복 입력이 설정되어 있지 않으면 이벤트를 출력하고 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
  8. 제5항에 있어서,
    상기 제어부는 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터를 저장하고, 상기 마이크를 통해 입력된 음성 데이터가 저장된 후 일정 시간이 지나면 상기 메모리에서 음성 데이터를 삭제하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
  9. 제1항 내지 제4항 중 어느 한 항에 의한 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체.
KR1020150061412A 2015-04-30 2015-04-30 음성 인식을 이용한 정보 검색 방법 및 장치 Expired - Fee Related KR101595090B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020150061412A KR101595090B1 (ko) 2015-04-30 2015-04-30 음성 인식을 이용한 정보 검색 방법 및 장치
US15/570,587 US10403277B2 (en) 2015-04-30 2016-03-04 Method and apparatus for information search using voice recognition
PCT/KR2016/002168 WO2016175443A1 (ko) 2015-04-30 2016-03-04 음성 인식을 이용한 정보 검색 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150061412A KR101595090B1 (ko) 2015-04-30 2015-04-30 음성 인식을 이용한 정보 검색 방법 및 장치

Publications (1)

Publication Number Publication Date
KR101595090B1 true KR101595090B1 (ko) 2016-02-17

Family

ID=55457823

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150061412A Expired - Fee Related KR101595090B1 (ko) 2015-04-30 2015-04-30 음성 인식을 이용한 정보 검색 방법 및 장치

Country Status (3)

Country Link
US (1) US10403277B2 (ko)
KR (1) KR101595090B1 (ko)
WO (1) WO2016175443A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018078751A1 (ja) * 2016-10-26 2018-05-03 株式会社トヨタマップマスター 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
KR102594022B1 (ko) * 2016-11-24 2023-10-26 삼성전자주식회사 전자 장치 및 그의 채널맵 업데이트 방법
KR20180084392A (ko) * 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
US11204988B2 (en) * 2018-04-20 2021-12-21 Spotify Ab Association via voice

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060063420A (ko) * 2004-12-07 2006-06-12 에스케이 텔레콤주식회사 휴대단말기에서의 음성인식방법 및 이를 구비한 휴대단말기
KR101322394B1 (ko) 2011-05-16 2013-10-29 경북대학교 산학협력단 음성인식 정보검색 시스템 및 그 방법

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
DE69429200T2 (de) * 1993-02-15 2002-07-18 Mitsubishi Denki K.K., Tokio/Tokyo Datenwarteschlangenvorrichtung und ATM-Zellenvermittlung beruhend auf Schieben und Suchen
US6505153B1 (en) * 2000-05-22 2003-01-07 Compaq Information Technologies Group, L.P. Efficient method for producing off-line closed captions
US7072328B2 (en) * 2001-01-12 2006-07-04 Voicegenie Technologies Inc. Computer-implemented voice markup language-based server
US20030046071A1 (en) * 2001-09-06 2003-03-06 International Business Machines Corporation Voice recognition apparatus and method
US20040193425A1 (en) * 2002-11-12 2004-09-30 Tomes Christopher B. Marketing a business employing voice and speech recognition technology
TWI225638B (en) * 2003-09-26 2004-12-21 Delta Electronics Inc Speech recognition method
US8005668B2 (en) * 2004-09-22 2011-08-23 General Motors Llc Adaptive confidence thresholds in telematics system speech recognition
US7949533B2 (en) * 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
TWI298844B (en) * 2005-11-30 2008-07-11 Delta Electronics Inc User-defines speech-controlled shortcut module and method
JP4812029B2 (ja) * 2007-03-16 2011-11-09 富士通株式会社 音声認識システム、および、音声認識プログラム
JP2008309865A (ja) 2007-06-12 2008-12-25 Fujitsu Ten Ltd 音声認識装置および音声認識方法
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
US8140330B2 (en) * 2008-06-13 2012-03-20 Robert Bosch Gmbh System and method for detecting repeated patterns in dialog systems
US8965765B2 (en) * 2008-09-19 2015-02-24 Microsoft Corporation Structured models of repetition for speech recognition
US8990085B2 (en) * 2009-09-30 2015-03-24 At&T Intellectual Property I, L.P. System and method for handling repeat queries due to wrong ASR output by modifying an acoustic, a language and a semantic model
JP5158174B2 (ja) * 2010-10-25 2013-03-06 株式会社デンソー 音声認識装置
KR101789619B1 (ko) * 2010-11-22 2017-10-25 엘지전자 주식회사 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치
KR101208166B1 (ko) 2010-12-16 2012-12-04 엔에이치엔(주) 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법
US8489398B1 (en) * 2011-01-14 2013-07-16 Google Inc. Disambiguation of spoken proper names
KR101889836B1 (ko) * 2012-02-24 2018-08-20 삼성전자주식회사 음성인식을 통한 단말기의 잠금 상태 해제 및 조작 방법 및 장치
EP2645364B1 (en) * 2012-03-29 2019-05-08 Honda Research Institute Europe GmbH Spoken dialog system using prominence
KR101309794B1 (ko) * 2012-06-27 2013-09-23 삼성전자주식회사 디스플레이 장치, 디스플레이 장치의 제어 방법 및 대화형 시스템
KR102109381B1 (ko) * 2013-07-11 2020-05-12 삼성전자주식회사 전기기기 및 그 제어 방법
KR101351264B1 (ko) 2013-08-14 2014-01-13 김길원 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법
KR102155482B1 (ko) * 2013-10-15 2020-09-14 삼성전자 주식회사 디스플레이장치 및 그 제어방법
US9653073B2 (en) * 2013-11-26 2017-05-16 Lenovo (Singapore) Pte. Ltd. Voice input correction
US20150199965A1 (en) * 2014-01-16 2015-07-16 CloudCar Inc. System and method for recognition and automatic correction of voice commands
US9589562B2 (en) * 2014-02-21 2017-03-07 Microsoft Technology Licensing, Llc Pronunciation learning through correction logs
US9430186B2 (en) * 2014-03-17 2016-08-30 Google Inc Visual indication of a recognized voice-initiated action
JP6233650B2 (ja) * 2014-05-20 2017-11-22 パナソニックIpマネジメント株式会社 操作補助装置および操作補助方法
US9715875B2 (en) * 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9503688B1 (en) * 2014-06-13 2016-11-22 Google Inc. Techniques for automatically scheduling and providing time-shifted communication sessions
US10446141B2 (en) * 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9921725B2 (en) * 2015-06-16 2018-03-20 International Business Machines Corporation Displaying relevant information on wearable computing devices
US20170092278A1 (en) * 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
US10354642B2 (en) * 2017-03-03 2019-07-16 Microsoft Technology Licensing, Llc Hyperarticulation detection in repetitive voice queries using pairwise comparison for improved speech recognition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060063420A (ko) * 2004-12-07 2006-06-12 에스케이 텔레콤주식회사 휴대단말기에서의 음성인식방법 및 이를 구비한 휴대단말기
KR101322394B1 (ko) 2011-05-16 2013-10-29 경북대학교 산학협력단 음성인식 정보검색 시스템 및 그 방법

Also Published As

Publication number Publication date
WO2016175443A1 (ko) 2016-11-03
US10403277B2 (en) 2019-09-03
US20180137859A1 (en) 2018-05-17

Similar Documents

Publication Publication Date Title
US11064248B2 (en) Systems and methods for routing content to an associated output device
US10068571B2 (en) Voice control method and voice control system
US10079014B2 (en) Name recognition system
US10832686B2 (en) Method and apparatus for pushing information
US11790890B2 (en) Learning offline voice commands based on usage of online voice commands
US10827067B2 (en) Text-to-speech apparatus and method, browser, and user terminal
EP3190512B1 (en) Display device and operating method therefor
US20180285068A1 (en) Processing method of audio control and electronic device thereof
US9854439B2 (en) Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
CN108694947B (zh) 语音控制方法、装置、存储介质及电子设备
US10811005B2 (en) Adapting voice input processing based on voice input characteristics
US10931999B1 (en) Systems and methods for routing content to an associated output device
KR20170032096A (ko) 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
US9852773B1 (en) Systems and methods for activating subtitles
CN103442130A (zh) 语音操控方法、移动终端装置及语音操控系统
KR101595090B1 (ko) 음성 인식을 이용한 정보 검색 방법 및 장치
WO2015149359A1 (zh) 一种自动调节音量的方法、音量调节装置及电子设备
US10269347B2 (en) Method for detecting voice and electronic device using the same
US20160004502A1 (en) System and method for correcting speech input
CN110992937B (zh) 语言离线识别方法、终端及可读存储介质
CN109741749B (zh) 一种语音识别的方法和终端设备
CN110875036A (zh) 语音分类方法、装置、设备及计算机可读存储介质
CN112863499B (zh) 语音识别方法及装置、存储介质
WO2019228140A1 (zh) 指令执行方法、装置、存储介质及电子设备
WO2017092322A1 (zh) 智能电视的浏览器操作方法及智能电视

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20150430

PA0201 Request for examination
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20160115

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20160211

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20160211

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20190211

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20190211

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20200107

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20200107

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20210817

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20220221

Start annual number: 7

End annual number: 7

PR1001 Payment of annual fee

Payment date: 20230130

Start annual number: 8

End annual number: 8

PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20241122