[go: up one dir, main page]

KR101584887B1 - Method and system of supporting multitasking of speech recognition service in in communication device - Google Patents

Method and system of supporting multitasking of speech recognition service in in communication device Download PDF

Info

Publication number
KR101584887B1
KR101584887B1 KR1020140026926A KR20140026926A KR101584887B1 KR 101584887 B1 KR101584887 B1 KR 101584887B1 KR 1020140026926 A KR1020140026926 A KR 1020140026926A KR 20140026926 A KR20140026926 A KR 20140026926A KR 101584887 B1 KR101584887 B1 KR 101584887B1
Authority
KR
South Korea
Prior art keywords
recognition application
communication terminal
application
speech recognition
voice
Prior art date
Application number
KR1020140026926A
Other languages
Korean (ko)
Other versions
KR20150104930A (en
Inventor
조세나
김용태
Original Assignee
주식회사 엘지유플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지유플러스 filed Critical 주식회사 엘지유플러스
Priority to KR1020140026926A priority Critical patent/KR101584887B1/en
Publication of KR20150104930A publication Critical patent/KR20150104930A/en
Application granted granted Critical
Publication of KR101584887B1 publication Critical patent/KR101584887B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명의 실시예는 음성 인식 서비스의 멀티태스크를 지원하는 방법 및 시스템에 관한 것이다. 통신 단말기에서 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법에 있어서, 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 단계; 상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시키는 단계; 상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하는 단계; 및 상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법이 제공될 수 있다.Embodiments of the present invention relate to a method and system for supporting multitasking of speech recognition services. A method of supporting multitasking of a speech recognition application in a communication terminal, the method comprising: operating a speech recognition application in an execution standby mode with operation of a first application; Receiving a predetermined awake up command of the speech recognition application and operating the speech recognition application in an execution mode; Transmitting voice data recorded by a user through voice recognition application to a server; And receiving the execution result corresponding to the recorded data from the server and operating the communication terminal. [0031] According to another aspect of the present invention, there is provided a method for supporting multitasking of a voice recognition application in a communication terminal.

Description

통신 단말기에서 음성 인식 서비스의 멀티태스킹을 지원하는 방법 및 시스템{METHOD AND SYSTEM OF SUPPORTING MULTITASKING OF SPEECH RECOGNITION SERVICE IN IN COMMUNICATION DEVICE}TECHNICAL FIELD [0001] The present invention relates to a method and system for supporting multitasking of a voice recognition service in a communication terminal,

본 발명의 실시예는 멀티태스킹을 지원하는 음성 인식 서비스 제공 방법 및 상기 서비스를 제공하는 통신 단말기에 관한 것이다.
An embodiment of the present invention relates to a method of providing a voice recognition service supporting multitasking and a communication terminal providing the service.

최근의 디지털 기술의 발달과 함께 휴대폰, 태블릿 PC 등의 전자 기기들이 보편화되고 있으며, 이러한 전자 기기들은 음성 통화, 영상 통화, 메시지 송수신, 동영상 재생, 인터넷, 전자상거래 음악 재생, 소셜 네트워크 서비스(SNS) 등의 다양한 기능을 실행할 수 있다.Electronic devices such as mobile phones and tablet PCs are becoming popular with the recent development of digital technology. Such electronic devices are used for voice communication, video call, message transmission and reception, video reproduction, Internet, electronic commerce music reproduction, social network service (SNS) And so on.

전자 기기의 사용자로 하여금 더욱 편리하게 사용할 수 있도록 디지털 기술이 발전하고 있는 바, 음성 인식 서비스도 나날이 그 정확도와 편의성이 증대되고 있다.Digital technology has been developed to enable users of electronic devices to use them more conveniently, and the accuracy and convenience of speech recognition services are increasing day by day.

이에, 전자 기기에 음성 인식 기술을 도입하고 있으며, 이미 세계의 주요 IT 기업이 핵심 제품과 서비스에 음성 인식 기술을 적용하고 있다.We are introducing voice recognition technology into electronic devices, and major IT companies around the world are applying voice recognition technology to core products and services.

이전의 음성 인식 기술은 인식률이 낮아 통신 기기의 제어에 사용되기 어려운 점이 있었으나 관련 기술의 지속적인 발전으로 음성 인식률이 상당 부분 제고되었다. 이를 통해 음성 인식을 이용하여 사용자의 통신 단말기에 대한 물리적 조작 없이 통신 단말기를 조작할 수 있으며, 이동 및 작업 중 음성을 통한 정보 입력이 더욱 쉬워 지고 있다. Previous speech recognition techniques have been difficult to use for controlling communication devices due to low recognition rate, but the speech recognition rate has been greatly improved due to the continuous development of related technologies. Accordingly, it is possible to operate the communication terminal without physical manipulation of the user's communication terminal by using the voice recognition, and inputting information through voice during movement and work is becoming easier.

사용자로부터 입력된 음성을 인식하기 위해 단말에 설치되는 기존의 음성 인식 어플리케이션은 멀티태스킹을 지원하고 있지 않다. 따라서, 음성 인식 어플리케이션을 통해 통신 단말기를 조작하기 위해서는, 현재 구동 중인 어플리케이션을 종료하고 음성 인식 어플리케이션을 새로 구동하여야 했다. 이러한 문제로 인해, 게임 또는 독서 등 다른 어플리케이션을 이용하는 도중, 음성 인식을 통해 통신 단말기를 조작할 수 없었다.
Existing speech recognition applications installed in the terminal for recognizing a voice input from a user do not support multitasking. Therefore, in order to operate the communication terminal through the voice recognition application, the currently running application has to be terminated and the voice recognition application has to be newly activated. Due to this problem, it has not been possible to operate the communication terminal through voice recognition while using other applications such as games or reading.

본 발명의 실시예에 있어서, 통신 단말기 내에서 음성 인식 어플리케이션의 멀티태스킹이 제공되지 않던 문제점을 해결하고, 다른 어플리케이션이 동작하는 중에도 음성 인식 어플리케이션을 통해 음성 인식 서비스를 제공할 수 있도록 한다.
In an embodiment of the present invention, a problem that multitasking of a voice recognition application is not provided in a communication terminal is solved, and a voice recognition service can be provided through a voice recognition application even while another application is operating.

통신 단말기에서 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법에 있어서, 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 단계; 상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시키는 단계; 상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하는 단계; 및 상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법이 제공될 수 있다.A method of supporting multitasking of a speech recognition application in a communication terminal, the method comprising: operating a speech recognition application in an execution standby mode with operation of a first application; Receiving a predetermined awake up command of the speech recognition application and operating the speech recognition application in an execution mode; Transmitting voice data recorded by a user through voice recognition application to a server; And receiving the execution result corresponding to the recorded data from the server and operating the communication terminal. [0031] According to another aspect of the present invention, there is provided a method for supporting multitasking of a voice recognition application in a communication terminal.

일측에 있어서, 상기 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션이 실행 대기 모드로 동작하는 단계는, 상기 제1 어플리케이션을 상기 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시하면서 상기 제1 어플리케이션을 동작시키는 단계; 및 상기 음성인식 어플리케이션을 백그라운드(back-ground)에서 실행 대기 모드로 동작시키는 단계를 포함할 수 있다.The step of operating the voice recognition application in the execution standby mode together with the operation of the first application may include displaying the first application on the uppermost layer of the display of the communication terminal, ; And operating the speech recognition application in a standby mode at a back-ground.

또 다른 측면에 있어서, 상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시키는 단계는, 상기 음성인식 어플리케이션의 웨이크업(awake up) 명령을 입력 받는 단계; 상기 음성인식 어플리케이션의 웨이크업(awake up) 명령이 상기 미리 정해진 음성인식 어플리케이션의 웨이크업(awake up) 명령에 해당하는지 판단하는 단계; 및 상기 음성인식 어플리케이션의 웨이크업(awake up) 명령이 미리 정해진 음성인식 어플리케이션의 웨이크업(awake up) 명령에 해당한다고 판단한 경우, 상기 음성인식 어플리케이션을 실행모드로 동작시키는 단계를 포함할 수 있다.In another aspect of the present invention, the step of operating the voice recognition application in the execution mode by receiving a predetermined awake up command of the voice recognition application may include receiving an awake up command of the voice recognition application step; Determining whether a wake-up command of the speech recognition application corresponds to a wake-up command of the predetermined speech recognition application; And operating the speech recognition application in an execution mode when it is determined that the awake up command of the speech recognition application corresponds to a wake up command of a predetermined speech recognition application.

또 다른 측면에 있어서, 상기 음성인식 어플리케이션을 실행모드로 동작시키는 단계는, 상기 제1 어플리케이션이 상기 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시되도록 상기 제1 어플리케이션의 동작을 유지하면서, 백그라운드(back-ground)에서 상기 음성인식 어플리케이션을 실행 모드로 동작시키는 단계를 포함할 수 있다.In another aspect of the present invention, the step of operating the voice recognition application in the execution mode may include the steps of maintaining the operation of the first application such that the first application is displayed on the uppermost layer of the display of the communication terminal, and operating the speech recognition application in an execution mode at a back-ground.

또 다른 측면에 있어서, 상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령은, 상기 음성인식 어플리케이션을 실행시키기 위한 미리 정해진 음성인식 어플리케이션 실행 명령일 수 있다.In yet another aspect, the predetermined awake up command of the speech recognition application may be a predetermined speech recognition application execution command for executing the speech recognition application.

또 다른 측면에 있어서, 상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령은, 사용자로부터 수신되는 음성 또는 상기 음성인식 어플리케이션의 실행 대기 모드에서 호 수신, 문자 수신, 메신저 수신 중 적어도 하나의 이벤트로 설정될 수 있다.In yet another aspect, the predetermined awake up command of the speech recognition application may include at least one of a voice received from a user or a call reception, a character reception, and a messenger reception in an execution standby mode of the voice recognition application Lt; / RTI >

또 다른 측면에 있어서, 상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하는 단계는, 상기 통신 단말기 내에 저장된 주소록 데이터를 함께 상기 서버로 전송하는 단계를 포함할 수 있다.According to another aspect of the present invention, the step of transmitting the recorded voice data recorded by the voice recognition application to the server may include transmitting the address book data stored in the communication terminal to the server together.

또 다른 측면에 있어서, 상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는, 전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 중 적어도 하나의 동작을 실행하는 단계를 포함할 수 있다.In another aspect, the step of receiving an execution result corresponding to the recorded data from the server and operating the communication terminal may include executing at least one of a phone call, a phone call, a message transmission, a message reception, or a messenger reception .

또 다른 측면에 있어서, 상기 전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 동작에 대응하는 메시지를 상기 음성인식 어플리케이션과 연관된 창(window)에 표시하는 단계를 더 포함할 수 있다.In another aspect, the method may further include displaying a message corresponding to the call origination, the call reception, the message origination, the message reception, or the messenger reception operation on a window associated with the voice recognition application.

또 다른 측면에 있어서, 상기 전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 동작에 대응하는 메시지를 상기 음성인식 어플리케이션과 연관된 창(window)에 표시하는 단계는, 상기 음성인식 어플리케이션과 연관된 창을 반투명으로 상기 제1 어플리케이션에 오버랩(overlap)하여 상기 통신 단말기의 디스플레이 상에 표시하는 단계를 포함할 수 있다.In another aspect, the step of displaying a message corresponding to the call origination, call reception, message origination, message reception, or messenger reception operation on a window associated with the voice recognition application comprises: And overlapping the first application with a translucent display on the display of the communication terminal.

또 다른 측면에 있어서, 상기 핸즈프리 어플리케이션과 연관된 창(window)을 반투명으로 상기 제1 어플리케이션에 오버랩(overlap)하여 표시하는 단계는, 상기 창(window)의 크기를 상기 음성 데이터에 대응하는 텍스트 데이터의 길이에 따라 적응적으로 조절하여 표시하는 단계를 포함할 수 있다.According to another aspect of the present invention, the step of overlapping and displaying a window associated with the hands-free application in a translucent manner with respect to the first application may include the step of displaying the size of the window as text data corresponding to the voice data And adjusting and displaying the information according to the length.

또 다른 측면에 있어서, 상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는, 상기 통신 단말기의 주변 소음 크기를 측정하는 단계; 상기 주변 소음 크기 및 상기 통신 단말기의 스피커 볼륨 크기를 비교하는 단계; 및 상기 스피커 볼륨 크기를 상기 주변 소음 크기에 기초하여 적응적으로 조절하는 단계를 포함할 수 있다.According to another aspect of the present invention, the step of receiving an execution result corresponding to the recording data from the server and operating the communication terminal comprises: measuring an ambient noise level of the communication terminal; Comparing the ambient noise magnitude and the speaker volume magnitude of the communication terminal; And adaptively adjusting the speaker volume size based on the ambient noise magnitude.

또 다른 측면에 있어서, 상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는, 상기 음성인식 어플리케이션과 상기 제1 어플리케이션의 출력 볼륨 크기를 적응적으로 조절하는 단계를 포함할 수 있다.
According to another aspect of the present invention, the step of receiving an execution result corresponding to the recording data from the server and operating the communication terminal includes adaptively adjusting an output volume size of the voice recognition application and the first application .

통신 단말기에서 음성 인식 어플리케이션의 멀티태스킹이 제공되지 않던 문제점을 해결하고, 다른 어플리케이션이 동작하는 중에도 음성 인식 어플리케이션을 통해 음성 인식 서비스를 제공할 수 있다.
It is possible to solve the problem that multitasking of the voice recognition application is not provided in the communication terminal and to provide the voice recognition service through the voice recognition application while another application is operating.

도 1은 본 발명의 일실시예에 있어서, 음성 인식 서비스의 멀티태스킹을 지원하는 방법에 대해 설명하기 위한 흐름도이다.
도 2는 본 발명의 일실시예에 있어서, 멀티태스킹을 지원하는 음성 인식 서비스가 제공되는 일례를 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 있어서, 멀티태스킹을 지원하는 음성 인식 서비스가 제공되는 일례를 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 멀티태스킹을 지원하는 음성 인식 서비스 중 텍스트 창이 제공되는 방법에 대해 설명하기 위한 도면이다.
FIG. 1 is a flowchart illustrating a method of supporting multitasking of a speech recognition service according to an exemplary embodiment of the present invention. Referring to FIG.
2 is a view for explaining an example in which a voice recognition service supporting multitasking is provided according to an embodiment of the present invention.
3 is a diagram for explaining an example in which a voice recognition service supporting multitasking is provided according to an embodiment of the present invention.
4 is a diagram for explaining a method of providing a text window among voice recognition services supporting multitasking according to an embodiment of the present invention.

이하, 통신 단말기에서 음성 인식 서비스의 멀티태스킹을 지원하는 방법에 대해서 첨부된 도면을 참조하여 자세히 설명하도록 한다.Hereinafter, a method of supporting multitasking of a voice recognition service in a communication terminal will be described in detail with reference to the accompanying drawings.

앞서 설명한 바와 같이, 본 발명은 음성 인식 서비스를 제공하는 데에 있어서, 사용자가 단말을 이용하는 여러 가지 상황에서도 언제든지 음성 인식 서비스를 이용할 수 있도록 멀티태스킹을 제공하기 위한 것이다.
As described above, the present invention is intended to provide multitasking in order to provide a voice recognition service so that a user can use voice recognition service at any time in various situations using the terminal.

<사용자의 시작 명령 음성에 따라 동작하는 시나리오><Scenario that operates according to user's start command voice>

도 1은 본 발명의 일실시예에 있어서, 음성 인식 서비스의 멀티태스킹을 지원하는 방법에 대해 설명하기 위한 흐름도이다.FIG. 1 is a flowchart illustrating a method of supporting multitasking of a speech recognition service according to an exemplary embodiment of the present invention. Referring to FIG.

단계(110)에서, 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시킬 수 있다. 여기서, 제1 어플리케이션은 단말 내의 음성인식 어플리케이션 이외에 다른 어플리케이션에 대한 것으로, 제1 어플리케이션의 동작은 예컨대 게임을 하거나, 동영상을 보거나 문서를 작성 중인 상태 등에 해당할 수 있다.In step 110, the voice recognition application may be operated in the standby mode together with the operation of the first application. Here, the first application is for an application other than the voice recognition application in the terminal, and the operation of the first application may correspond to, for example, a state in which a game, a moving picture, or a document is being created.

실시예에서, 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 것은 음성인식 서비스를 제공하는 음성인식 어플리케이션을 실행시키는 명령에 대해서 대기시키는 것을 의미한다.In the embodiment, operating the speech recognition application in the execution standby mode means waiting for an instruction to execute the speech recognition application that provides the speech recognition service.

제1 어플리케이션을 동작시킬 때, 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시하면서 제1 어플리케이션을 동작시키고, 제1 어플리케이션의 동작과는 독립적으로 음성인식 어플리케이션은 백그라운드(back-ground)에서 실행 대기 모드로 동작할 수 있다. 실시예에서, 제1 어플리케이션의 동작 여부와 상관없이 음성인식 어플리케이션은 실행 대기 모드로 동작할 수 있다.When the first application is operated, the first application is operated while being displayed on the uppermost layer of the display of the communication terminal, and the speech recognition application is executed in the background (back-ground) independently of the operation of the first application Mode. In an embodiment, the voice recognition application may operate in a standby mode regardless of whether the first application is operating or not.

실시예에 따른 단계(110)는 제1 어플리케이션의 동작 상태뿐만 아니라, 통신 단말기의 스크린이 오프(off)되어 있는 상태, 통신 단말기가 록 오프(lock off)되어 있는 상태, 통신 단말기의 아이들(idle) 상태, 통신 단말기가 음성 호(call)를 수신한 상태, 및 통신 단말기가 문자 메시지를 수신한 상태 등에서 음성인식 어플리케이션을 실행 대기 모드로 동작시킬 수 있다.The step 110 according to the embodiment may include not only the operation state of the first application but also a state where the screen of the communication terminal is turned off, a state where the communication terminal is locked off, ) State, a state in which the communication terminal has received a voice call, and a state in which the communication terminal has received a text message, or the like.

단계(120)에서, 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시킬 수 있다.In step 120, a predetermined awake up command of the speech recognition application may be received to operate the speech recognition application in the execution mode.

실시예에서, 음성인식 어플리케이션이 실행 모드로 동작할 때, 제1 어플리케이션의 동작은 통신 단말기의 디스플레이의 최상위 레이어에 표시되도록 그대로 유지될 수 있으며, 음성인식 어플리케이션은 백그라운드로 동작하면서 멀티캐스팅을 제공할 수 있다.In an embodiment, when the speech recognition application operates in an execution mode, the operation of the first application may remain as it is displayed in the top layer of the display of the communication terminal, and the speech recognition application may provide multicasting .

이를 위하여, 통신 단말기의 마이크 등의 입력 수단을 통해 사용자로부터 웨이크업 명령에 대한 음성을 수신할 수 있다. 통신 단말기에서 사용자로부터 입력된 음성이 미리 정해진 웨이크업 명령과 대응하는지 여부를 확인할 수 있다. 실시예에 있어서, 미리 정해진 웨이크업 명령은 짧은 텍스트로 예컨대 ‘하이유와’같은 음성일 수 있다. "대응"한다는 것은 두 음성이 완전히 동일한 경우는 물론, 두 음성을 비교 분석 시 미리 정해진 오차 범위 내에서 실질적으로 동일한 음성으로 판단될 수 있는 경우를 의미한다.For this purpose, a voice for a wake-up command can be received from a user through input means such as a microphone of a communication terminal. The communication terminal can confirm whether or not the voice input from the user corresponds to a predetermined wake-up command. In an embodiment, the predefined wakeup command may be a voice with a short text, for example " lower ". The "correspondence" means not only the case where two voices are completely equal but also the case where two voices can be judged to be substantially the same voice within a predetermined error range in a comparative analysis.

판단 결과, 통신 단말기에서 수신된 사용자의 음성이 미리 정해진 웨이크업 명령과 대응하는 경우, 본 발명의 일실시예에 따른 음성인식 어플리케이션을 실행 모드로 동작시킬 수 있다.As a result of the determination, when the voice of the user received in the communication terminal corresponds to a predetermined wake-up command, the voice recognition application according to the embodiment of the present invention can be operated in the execution mode.

음성인식 어플리케이션은 실행 대기 모드로 동작하다가 사용자로부터 입력된 웨이크업 명령을 통해 실행 모드로 동작할 수 있다.The speech recognition application may operate in the execution standby mode and operate in the execution mode through the wakeup command input by the user.

실시예에서, 음성인식 어플리케이션은 통신 단말기로 호 수신, 문자 수신, 메신저 수신 등의 이벤트 중 적어도 하나의 이벤트가 발생하는 경우, 해당 이벤트를 웨이크업 명령으로 입력 받아 음성인식 어플리케이션을 실행 대기 모드에서 실행 모드로 동작시킬 수 있다.In the embodiment, when at least one event such as call reception, text reception, messenger reception, etc. is generated in the communication terminal, the voice recognition application receives the event as a wake up command and executes the voice recognition application in the execution standby mode Mode.

일측에 있어서, 실행 모드로 동작하는 음성인식 어플리케이션은 멀티태스킹을 지원한다. 즉, 통신 단말기는 제1 어플리케이션을 계속적으로 실행하면서, 예컨대 게임을 하면서, 동영상을 감상하면서, 웹 서핑을 하면서, 음성인식 어플리케이션을 통해 사용자에게 음성 인식 서비스를 제공할 수 있다.On one side, speech recognition applications operating in the execution mode support multitasking. That is, the communication terminal can provide the voice recognition service to the user through the voice recognition application while continuously surfing the web while watching the moving picture while playing the first application, for example, playing a game.

실시예에서, 제1 어플리케이션이 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시되도록 제1 어플리케이션의 동작을 유지하면서, 음성인식 어플리케이션을 백그라운드(back-ground)에서 실행 모드로 동작시킬 수 있다.In an embodiment, the voice recognition application may be operated in a back-ground execution mode while maintaining the operation of the first application so that the first application is displayed on the uppermost layer of the display of the communication terminal.

실시예에서, 음성인식 어플리케이션은 실행 모드로 동작함과 함께, 통신 단말기의 디스플레이의 일부 영역에 사용자의 음성을 입력 받기 위한 마이크 아이콘 또는 ‘무엇을 도와드릴까요?’ 등의 음성 입력 요청 메시지를 함께 표시할 수 있다.In the embodiment, the voice recognition application operates in the execution mode and sends a voice input request message such as a microphone icon for receiving voice of a user to a partial area of the display of the communication terminal or 'What can I do?' Can be displayed.

단계(130)에서, 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송할 수 있다.In step 130, the user can transfer the recorded voice data of the user through the voice recognition application to the server.

일측에 따르면, 음성 데이터는 사용자로부터 통신 단말기의 마이크를 통해 입력되는 음성에 해당할 수 있다. 음성인식 어플리케이션은 사용자로부터 음성 데이터를 수신하고, 수신된 음성 데이터를 녹음하여 녹음 데이터를 생성할 수 있다.According to one aspect, the voice data may correspond to voice input from the user through the microphone of the communication terminal. The speech recognition application can receive voice data from a user and record the received voice data to generate voice data.

사용자로부터 수신된 음성 데이터는 호 수신, 문자/IM 메시지 수신 및 송신, 또는 제1 어플리케이션의 실행 명령 등을 포함하는 음성일 수 있다. 상기 녹음 데이터는 서버로 전송될 수 있다. 이때, 녹음 데이터는 통신 단말기와 연결된 유무선 네트워크를 통해 서버로 전송될 수 있다.The voice data received from the user may be voice including call reception, text / IM message reception and transmission, or execution instruction of the first application. The recording data may be transmitted to a server. At this time, the recorded data can be transmitted to the server through the wired / wireless network connected to the communication terminal.

단계(130)에서 통신 단말기는 사용자로부터 입력된 음성에 대응하는 녹음 데이터를 서버로 전송할 때, 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 녹음 데이터와 함께 서버로 전송할 수 있다. 다른 일측에 따르면, 상기 주소록 데이터 또는 통화 기록 정보는 녹음 데이터와 별도로 서버로 전송될 수도 있다.In step 130, when the communication terminal transmits the recording data corresponding to the voice input from the user to the server, the communication terminal may transmit the address book data or the call recording information stored in the communication terminal together with the recording data to the server. According to another aspect, the address book data or call record information may be transmitted to the server separately from the recorded data.

이 경우, 서버는 녹음 데이터와 함께 전송된 주소록 데이터 또는 통화 기록 정보를 이용하여 텍스트 데이터를 가공할 수 있다. 예컨대, 호 및 메시지 발신에 대한 음성 데이터가 입력된 경우, 주소록 데이터를 녹음 데이터와 함께 서버로 전송함으로써 서버에서 호 및 메시지 발신의 대상을 검색할 수 있다.In this case, the server can process the text data using the address book data or call record information transmitted together with the recording data. For example, when voice data for call and message transmission is input, the address book data may be transmitted to the server together with the recording data so that the server can search for a destination of the call and message transmission.

단계(140)에서, 녹음 데이터에 대응하는 실행 결과를 서버로부터 수신하여 통신 단말기를 동작시킬 수 있다.In step 140, the execution result corresponding to the recorded data can be received from the server to operate the communication terminal.

서버는 STT(Speech to text) 기술을 이용하여 상기 녹음 데이터를 텍스트 데이터로 변환할 수 있다. 서버가 녹음 데이터로부터 텍스트 데이터를 생성할 때에, 녹음 데이터를 분석하여 녹음 데이터에 포함된 사용자 음성 데이터의 특징을 추출하여 이를 로그 값으로 저장함으로써 이후 전송되는 녹음 데이터에 대한 사용자 음성 데이터 인식 시 참조 값으로 사용할 수 있다. 서버는 텍스트 데이터로 변환된 상기 녹음 데이터를 삭제할 수 있다.The server uses STT (Speech to text ) technology to convert the recorded data into text data. When the server generates the text data from the recording data, the recording data is analyzed to extract the characteristics of the user voice data included in the recording data and stores it as a log value, so that when the user voice data is recognized Can be used. The server can delete the recorded data converted into text data.

통신 단말기는 서버로부터 전송된 텍스트 파일을 수신할 수 있다. 음성인식 어플리케이션은 녹음 데이터에 대한 실행 결과로 서버로부터 전송된 텍스트 데이터를 수신할 수 있다. 어플리케이션은 수신된 텍스트 데이터에 따라 통신 단말기를 동작시킬 수 있다. 이에 따른 통신 단말기의 동작은 전화 발신, 문자 작성 및 송신, 다른 어플리케이션의 실행 중 어느 하나일 수 있다.The communication terminal can receive the text file transmitted from the server. The speech recognition application can receive the text data transmitted from the server as a result of execution on the recorded data. The application can operate the communication terminal according to the received text data. Accordingly, the operation of the communication terminal may be any one of telephone call, text creation and transmission, and execution of another application.

다양한 변형 시나리오는 아래에서 상세히 설명된다.
Various variant scenarios are described in detail below.

<변형 시나리오들><Modification Scenarios>

일측에 따르면, 서버는 사용자로부터 입력된 음성 데이터 변환 결과, 주소록 데이터 상에 동일한 텍스트 데이터로 변환된 대상자가 둘 이상(동명이인)인 경우, 텍스트 데이터에 둘 이상의 대상자에 대한 주소록 데이터를 포함시킬 수 있다. 이 경우, 서버는 통화 기록 정보를 참조하여, 둘 이상의 대상자에 대한 정보를 최근 통화 순 또는 자주 통화하는 순으로 소팅하여 통신 단말기에게 제공할 수 있다.According to one aspect of the present invention, the server may include the address data for two or more subjects in the text data when the result of the conversion of the voice data inputted by the user is that two or more persons (same name) are converted into the same text data on the address book data . In this case, the server refers to the call record information, and can sort information on two or more subjects in order of recent call or frequent call, and provide the information to the communication terminal.

다른 일측에 따르면, 서버는 녹음 데이터 변환 결과, 주소록 데이터 상에 대상자의 연락처가 둘 이상(집 전화, 휴대 전화 등)인 경우, 통화 기록 정보를 참조하여, 자주 통화한 연락처를 선택하여 텍스트 데이터로 변환할 수 있다. 또한, 서버는 둘 이상의 연락처를 모두 포함하여 텍스트 데이터로 변환할 수 있고, 통신 단말기는 화면 상에 둘 이상의 연락처를 리스트 형태로 표시할 수 있다.According to another aspect of the present invention, the server refers to the call record information when the contact information of the target is two or more (home phone, mobile phone, etc.) on the address book data as a result of conversion of the recorded data, Can be converted. In addition, the server can convert all of the two or more contacts into text data, and the communication terminal can display two or more contacts on the screen in the form of a list.

다른 일측에 따르면, 서버는 녹음 데이터 변환 결과, 통신 단말기가 사용자로부터 부재중 전화를 확인하라는 음성 데이터가 확인되는 경우, 통신 단말기 내의 부재중 전화가 있는지 확인 받아, 한 통 이상 있는 경우, 서버는 사용자가 확인할 수 있도록 음성 안내와 함께 리스트 업(List up)시키거나, 음성으로 발신 안내와 함께 부재중 전화의 발신자에게 자동으로 전화를 발신할 수 있다.According to another aspect of the present invention, the server confirms whether there is a missed call in the communication terminal when voice data indicating that the communication terminal confirms the missed call from the user is confirmed as a result of the recording data conversion. The user can make a list up with a voice guidance or send a call automatically to a caller of a missed call with voice guidance.

또 다른 일측에 따르면, 음성인식 어플리케이션은 상기 서버로부터 수신된 텍스트 데이터를 화면 상에 출력할 수 있다. 이때 어플리케이션은 상기 텍스트 데이터의 길이를 측정하여, 상기 텍스트 데이터가 통신 단말기의 화면 상에 출력될 때 텍스트 데이터를 화면 상에서 구분되게 표시하는 말풍선 형태의 창(window)의 크기를 적응적으로 조절할 수 있다. 예를 들어, 텍스트 데이터의 길이가 클수록 창의 크기를 크게 하고, 작을 수로 창의 크기를 줄여서 창 내에 배치되는 텍스트 데이터가 적절한 여백으로 배치될 수 있도록 할 수 있다.According to another aspect, the speech recognition application can output the text data received from the server on the screen. In this case, the application measures the length of the text data and adaptively adjusts the size of a bubble-shaped window for displaying the text data on the screen when the text data is output on the screen of the communication terminal . For example, the larger the length of the text data, the larger the size of the window, and the smaller the size of the window, the smaller the size of the text data placed in the window.

일측에 따르면, 음성인식 어플리케이션은 통신 단말기의 마이크를 통해 입력되는 주변 소음 크기를 측정하고, 측정된 주변 소음 크기에 따라서 통신 단말기의 출력 스피커의 볼륨을 적응적으로(adaptively) 조절할 수 있다. 이때, 음성인식 어플리케이션은, 주변 소음 크기와 통신 단말기의 출력 스피커의 볼륨 크기의 수치를 비교할 수 있고, 비교 결과 주변 소음 크기가 출력 스피커의 볼륨 크기보다 더 큰 경우, 통신 단말기의 스피커 볼륨 크기를 주변 소음 크기보다 높도록 적응적으로 조절할 수 있다. 비교 결과, 주변 소음 크기가 출력 스피커의 볼륨 크기 보다 더 작은 경우, 통신 단말기의 스피커 볼륨의 크기를 낮출 수 있다. According to one aspect of the present invention, the voice recognition application may measure the ambient noise input through the microphone of the communication terminal and may adaptively adjust the volume of the output speaker of the communication terminal according to the measured ambient noise level. At this time, the voice recognition application can compare the numerical value of the ambient noise size and the volume size of the output speaker of the communication terminal. If the comparison result indicates that the ambient noise size is larger than the volume size of the output speaker, Can be adaptively adjusted to be higher than the noise magnitude. As a result of comparison, if the ambient noise size is smaller than the volume size of the output speaker, the speaker volume of the communication terminal can be reduced.

일측에 따르면, 주변 소음 크기가 미리 정해진 스피커 볼륨의 한계치보다 큰 경우, 통신 단말기에 설치된 음성인식 어플리케이션은 음성 인식 서비스를 일시 중지할 수 있다.According to one aspect, if the ambient noise magnitude is greater than the predetermined speaker volume limit, the speech recognition application installed in the communication terminal may suspend the speech recognition service.

또 다른 일측에 따르면, 게임, 동영상 등의 어플리케이션을 실행 중일 경우, 통신 단말기의 스피커를 통해 출력되는 음성과 음성인식 어플리케이션의 동작 중 출력되는 음성과 중첩되어 출력되는 문제점이 발생할 수 있다. 이에, 본 발명의 실시예에서는 실행 결과에 따라 통신 단말기를 동작시킬 때, 통신 단말기에서 실행 중이었던 제1 어플리케이션의 출력의 볼륨과, 제1 어플리케이션과 동시에 실행되는 음성인식 어플리케이션의 출력의 볼륨 중 음성인식 어플리케이션의 출력 볼륨이 일정 레벨 더 크도록 제1 어플리케이션의 출력의 볼륨의 크기가 자동으로 조절될 수 있다.
According to another aspect of the present invention, when an application such as a game or a moving picture is being executed, a problem may arise in which a voice output through a speaker of a communication terminal and a voice output during operation of a voice recognition application are output. Therefore, in the embodiment of the present invention, when the communication terminal is operated according to the execution result, the volume of the output of the first application which was being executed in the communication terminal and the volume of the output of the speech recognition application executed simultaneously with the first application The size of the volume of the output of the first application can be automatically adjusted so that the output volume of the recognition application is higher than a certain level.

<전화 수신에 따라 동작을 시작하는 시나리오><Scenarios in which an operation is started upon receiving a call>

앞서 설명한 바와 같이, 음성인식 어플리케이션은 사용자의 음성이 입력되지 않아도, 호가 수신되는 경우, 실행 모드로 동작할 수 있다. 실시예에서, 음성인식 어플리케이션이 실행 모드로 동작하면서, 통신 단말기의 디스플레이는 제1 어플리케이션의 동작을 그대로 표시할 수 있다.As described above, the voice recognition application can operate in the execution mode when a call is received even if the voice of the user is not inputted. In the embodiment, while the speech recognition application operates in the execution mode, the display of the communication terminal can display the operation of the first application as it is.

수신되는 호를 연결하기 위해서 사용자로부터 음성 데이터를 수신할 수 있다. 이를 위해서, 음성인식 어플리케이션의 실행 모드 동작과 함께 호 연결에 대해 사용자에게 문의하는 음성 데이터를 통신 단말기의 스피커를 통해 출력할 수 있다. And receive voice data from the user to connect the received call. To this end, voice data for inquiring the user about the call connection together with the execution mode operation of the voice recognition application can be outputted through the speaker of the communication terminal.

이하의 설명은 통신 단말기로 호(Call)가 수신되었을 때에 수행되는 본 발명의 실시예에 대한 것이다. 통신 단말기에 호 수신이 감지되는 경우, 통신 단말기는 백그라운드로 동작하거나, 실행되고 있지 않던 상태의 어플리케이션을 실행 모드로 동작시킬 수 있다. 실행 모드로 동작하는 어플리케이션을 통해 음성 인식 서비스가 제공될 수 있다.The following description relates to an embodiment of the present invention performed when a call is received by a communication terminal. In the case where call reception is detected in the communication terminal, the communication terminal can operate in the background or in an execution mode in which the application is not running. A voice recognition service can be provided through an application operating in the execution mode.

통신 단말기에서 호 수신이 감지되는 경우, 호의 연결 여부에 관하여 통신 단말기의 사용자에게 문의하는 음성 데이터를 스피커를 통해 출력할 수 있다. 수신된 호를 연결할 것인지에 대해서 사용자의 의견을 묻기 위한 것이다.When the call reception is detected by the communication terminal, voice data for inquiring the user of the communication terminal as to whether or not the call is connected can be outputted through the speaker. This is to ask the user's opinion on whether to connect the received call.

실시예에 있어서, 통신 단말기에서 호 수신이 감지되는 경우, 통신 단말기는 호의 발신 번호(Caller ID 등) 및 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 서버로 전송할 수 있다. 서버는 통신 단말기로부터 전송된 발신 번호 및 주소록 데이터 또는 통화 기록 정보를 참조하여, 호 수신 음성 데이터를 생성할 수 있다. 예를 들어, 전화번호가 010-111-1111인 홍길동으로부터 호가 수신된 경우, 통신 단말기는 전화번호 및 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 서버로 전송한다.In an embodiment, when a call reception is detected in the communication terminal, the communication terminal can transmit the calling number (Caller ID, etc.) of the call and the address book data or call log information stored in the communication terminal to the server. The server can generate call reception voice data by referring to the calling number and address book data or call recording information transmitted from the communication terminal. For example, when a call is received from Hong Gil Dong, whose telephone number is 010-111-1111, the communication terminal transmits the telephone number and the address book data or call record information stored in the communication terminal to the server.

서버는 해당 전화번호 및 주소록 데이터를 참조하여 홍길동으로부터 수신된 호임을 확인하고, "홍길동 님으로부터 전화가 왔습니다. 받으시겠습니까?" 등의 음성 데이터를 생성하여 생성된 음성 데이터를 통신 단말기로 전송한다.The server refers to the corresponding phone number and address book data and confirms that the call is received from Hong Kil-dong, and "A call from Hong Gil-dong is received. Do you want to receive it?" And transmits the generated voice data to the communication terminal.

호의 발신 번호에 대응하는 발신자의 명칭을 통신 단말기에 저장된 주소록 데이터로부터 검색하고, 검색된 발신자의 명칭과 대응되는 음성 데이터와, 미리 정해진 호 수신 음성 데이터가 결합된 안내 음성 데이터를 출력할 수 있다. 예컨대, 발신자의 명칭이 ‘홍길동’인 경우, ‘홍길동’에 해당하는 음성 데이터와 ‘~님에게 전화가 왔습니다. 연결할까요?’ 등의 호 수신 음성 데이터를 결합하여, '홍길동님에게 전화가 왔습니다. 연결할까요?' 등의 안내 음성 데이터를 함께 출력하여 사용자에게 호 수신을 알릴 수 있다.The name of the caller corresponding to the calling number of the call is retrieved from the address book data stored in the communication terminal and the voice data corresponding to the name of the searched caller and the announcement voice data combined with the predetermined call reception voice data can be outputted. For example, if the name of the caller is 'Hong Gil Dong', the voice data corresponding to 'Hong Gil Dong' and '~' are called. 'Would you like to connect?', Combined with the voice data received, 'Hong Gil-dong called. Do you want to connect? ' And can announce the call reception to the user.

이후 통신 단말기는 사용자로부터 상기 음성 데이터에 대한 확인 입력을 대기한다. 여기서 확인 입력은 호 연결 요청에 대한 긍정 또는 부정에 대한 응답이 될 수 있다.Thereafter, the communication terminal waits for confirmation input of the voice data from the user. Here, the acknowledgment input may be a positive or negative response to the call connection request.

통신 단말기는 사용자로부터 확인 입력이 음성 데이터로 수신되면, 해당 음성을 녹음하여 녹음 데이터를 생성할 수 있다. 통신 단말기는 생성된 녹음 데이터를 서버로 전송한다. 서버는 STT(Speech to text) 기술을 이용하여 녹음 데이터를 텍스트 데이터로 변환할 수 있다. 서버는 생성된 텍스트 데이터를 통신 단말기로 전송할 수 있다.When the confirmation input is received as voice data from the user, the communication terminal can record the voice and generate the voice data. The communication terminal transmits the generated recording data to the server. The server uses STT (Speech to text ) technology to convert the recorded data into text data. The server can transmit the generated text data to the communication terminal.

이에 음성인식 어플리케이션은 녹음 데이터에 대한 실행 결과로서 텍스트 데이터를 수신할 수 있다. 여기서, 텍스트 데이터는 호 연결 긍정을 의미하는 ‘네’, ‘예’, ‘응’, ‘그래’ 등의 텍스트가 포함되거나 호 연결 부정을 의미하는 ‘아니’, ‘싫어’, ‘안돼’ 등의 텍스트가 포함될 수 있다.Accordingly, the speech recognition application can receive text data as a result of execution on the recorded data. Here, the text data includes texts such as 'Yes', 'Yes', 'Yes', 'Yes', etc. indicating the call connection affirmation, or 'No', 'No', 'No' May be included.

음성인식 어플리케이션은 상기 호 연결 긍정 및 호 연결 부정에 관한 텍스트 데이터를 인식하여 호 연결 요청을 수락하거나 거부할 수 있다. 실시예에 있어서, 어플리케이션에는 호 연결 긍정 및 부정에 대한 텍스트 데이터 각각에 대응하는 동작이 미리 지정되어 있을 수 있다. 따라서, 호 연결 긍정의 경우 수신된 전화를 연결하고, 호 연결 부정의 경우 호를 끊거나 호를 연결하지 않은 상태로 그대로 유지할 수 있다.
The speech recognition application may recognize the call connection affirmation and the text data regarding the call connection negation and accept or reject the call connection request. In an embodiment, the application may be predefined for each of the text data for call connection affirmation and negation. Therefore, it is possible to connect the received call in case of call connection affirmation, and to leave the call in case of negative call connection or leave it unconnected.

<문자 메시지 수신에 따라 동작을 시작하는 시나리오>&Lt; Scenario in which an operation is started upon receiving a text message >

위에서 설명한 전화를 수신하는 실시예와 유사하게, 통신 단말기는 문자 메시지의 수신에 기초하여 음성인식 어플리케이션을 실행 모드로 동작시킬 수 있다. 앞선 실시예와 마찬가지로, 음성인식 어플리케이션이 실행 모드로 동작하면서, 통신 단말기의 디스플레이는 제1 어플리케이션의 동작을 그대로 표시할 수 있다.Similar to the embodiment for receiving the telephone described above, the communication terminal can operate the speech recognition application in the execution mode based on the reception of the text message. As in the previous embodiment, while the speech recognition application operates in the execution mode, the display of the communication terminal can display the operation of the first application as it is.

통신 단말기는 문자 메시지의 발신 번호(Caller ID 등) 및 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 서버로 전송할 수 있다. 서버는 통신 단말기로부터 전송된 발신 번호 및 주소록 데이터 또는 통화 기록 정보를 참조하여, 문자 메시지 수신 음성 데이터를 생성할 수 있다. 예를 들어, 전화번호가 010-111-1111인 홍길동으로부터 문자 메시지가 수신된 경우, 통신 단말기는 상기 전화번호 및 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 서버로 전송한다.The communication terminal can transmit the calling number (Caller ID, etc.) of the text message and the address book data or the call recording information stored in the communication terminal to the server. The server can generate the text message reception voice data by referring to the calling number, address book data or call log information transmitted from the communication terminal. For example, when a text message is received from Hong Gil Dong having a telephone number 010-111-1111, the communication terminal transmits the telephone number and the address book data or call record information stored in the communication terminal to the server.

서버는 상기 전화번호 및 주소록 데이터를 참조하여 홍길동으로부터 수신된 문자 메시지임을 확인하고, "홍길동 님으로부터 문자 메시지가 왔습니다. 읽을까요?" 등의 음성 데이터를 생성하여 생성된 음성 데이터를 통신 단말기로 전송한다.The server confirms that the text message is received from Hong Kil Dong by referring to the telephone number and the address book data, and the message " And transmits the generated voice data to the communication terminal.

이후 통신 단말기는 사용자로부터 상기 음성 데이터에 대한 확인 입력을 대기한다. 여기서 확인 입력은 문자 메시지 열람 요청에 대한 긍정 또는 부정에 대한 응답이 될 수 있다. 사용자로부터 확인 입력이 음성으로 수신되면, 해당 음성을 녹음하여 녹음 데이터를 생성할 수 있다. 통신 단말기는 생성된 녹음 데이터를 서버로 전송한다.Thereafter, the communication terminal waits for confirmation input of the voice data from the user. Here, the confirmation input may be a response to a positive or negative response to a request for viewing a text message. When the confirmation input is received from the user by voice, the voice can be recorded to generate the recorded data. The communication terminal transmits the generated recording data to the server.

서버는 녹음 데이터로부터 텍스트 데이터를 생성할 수 있다. 서버는 STT(Speech to text) 기술을 이용하여 녹음 데이터를 텍스트 데이터로 변환할 수 있다. 서버는 생성된 텍스트 데이터를 통신 단말기로 전송할 수 있다. 이에 통신 단말기의 음성인식 어플리케이션은 녹음 데이터에 대한 결과 값으로서 서버로부터 전송된 텍스트 데이터를 수신할 수 있다. 여기서, 텍스트 데이터는 문자 메시지 읽기에 대한 긍정을 의미하는 ‘네’, ‘예’, ‘응’, ‘그래’ 등의 텍스트가 포함되거나 문자 메시지 읽기에 대한 부정을 의미하는 ‘아니’, ‘싫어’, ‘안돼’ 등의 텍스트가 포함될 수 있다.The server can generate text data from the recorded data. The server can convert the recorded data into text data using STT (Speech to text ) technology. The server can transmit the generated text data to the communication terminal. Accordingly, the voice recognition application of the communication terminal can receive the text data transmitted from the server as a result value for the recorded data. Here, the text data includes texts such as 'Yes', 'Yes', 'Yes', 'Yes', etc. indicating the affirmation of reading a text message, or 'No' or 'No'',' No ', and so on.

통신 단말기의 음성인식 어플리케이션은 상기 문자 메시지 읽기 긍정 및 부정에 관한 텍스트 데이터를 인식하여 텍스트 데이터가 문자 메시지 읽기 긍정에 대응하는지 문자 메시지 읽기 부정에 대응하는지에 따라 통신 단말기를 동작시킬 수 있다.The voice recognition application of the communication terminal recognizes the text data related to the positive and negative readings of the text message so that the communication terminal can operate according to whether the text data corresponds to a text message read affirmation or a text message read negative.

만약, 서버로부터 수신된 텍스트 데이터가 문자 메시지 읽기 부정에 대응하는 경우, 통신 단말기는 아무 동작도 수행하지 않고 다시 대기 상태로 돌아가 다른 문자 메시지 수신을 대기할 수 있다. 반면, 문자 메시지 읽기 긍정에 대응하는 경우, 통신 단말기는 수신된 문자 메시지의 텍스트 데이터를 서버로 전송할 수 있다.If the text data received from the server corresponds to an illegal reading of a text message, the communication terminal can return to the standby state without waiting for any operation and wait for another text message reception. On the other hand, in the case of responding to a text message read affirmation, the communication terminal can transmit the text data of the received text message to the server.

서버는 문자 메시지의 텍스트 데이터로부터 음성 데이터를 생성할 수 있다. 서버는 STT 기능을 통해 문자 메시지의 텍스트 데이터를 음성 데이터로 변환할 수 있으며, 서버는 생성된 음성 데이터를 다시 통신 단말기로 전송할 수 있다. 실시예에 따르면, 상기 STT 기능을 수행하는 서버는 TTS 기능을 수행하는 서버와 물리적으로 별개의 서버로 구현될 수 있고, 물리적으로 하나의 서버로 구현될 수 있다.The server can generate the voice data from the text data of the text message. The server can convert the text data of a text message into voice data through the STT function, and the server can transmit the generated voice data to the communication terminal again. According to the embodiment, the server performing the STT function may be implemented as a server physically separate from the server performing the TTS function, and may be physically implemented as one server.

음성인식 어플리케이션은 서버로부터 수신된 음성 데이터를 통신 단말기의 스피커로 출력되도록 한다. 통신 단말기가 수신된 문자 메시지를 음성 데이터를 출력함으로써, 운전 중이거나 운동 중과 같이 통신 단말기를 조작하기 어려운 상황에서도 사용자는 수신된 문자 메시지를 쉽게 확인할 수 있다.
The voice recognition application causes the voice data received from the server to be output to the speaker of the communication terminal. The user can easily check the received text message even in a situation where the communication terminal outputs the received text message as voice data and the communication terminal is difficult to operate, such as during operation or during exercise.

<음성인식 어플리케이션의 UI 예><Example of UI of speech recognition application>

이하, 도 2 내지 도 3을 통해 본 발명의 음성 인식 서비스가 제공되는 일례를 설명한다. 도 2 내지 도 3의 실시예는 웨이크업 명령을 통해 음성인식 어플리케이션이 백그라운드로 동작한 이후에 수행될 수 있다.
Hereinafter, an example in which the speech recognition service of the present invention is provided will be described with reference to FIG. 2 through FIG. The embodiments of FIGS. 2 to 3 may be performed after the voice recognition application operates in the background through a wake-up command.

도 2는 본 발명의 일실시예에 있어서, 멀티태스킹을 지원하는 음성 인식 서비스가 제공되는 일례를 설명하기 위한 도면이다.2 is a view for explaining an example in which a voice recognition service supporting multitasking is provided according to an embodiment of the present invention.

통신 단말기가 사용자의 시작 명령 음성을 수신하여, 통신 단말기에서 수신된 사용자의 음성이 미리 정해진 웨이크업 명령인지 여부를 확인하고, 확인 결과 통신 단말기에서 수신된 음성이 미리 정해진 웨이크업 명령인 경우, 본 발명의 실시예에 따른 음성인식 어플리케이션을 실행 모드로 동작시킬 수 있다.When the communication terminal receives the user's start command voice and confirms whether the voice of the user received at the communication terminal is a predetermined wake up command and if the voice received at the communication terminal is a predetermined wake up command, The speech recognition application according to the embodiment of the present invention can be operated in the execution mode.

이때, 음성인식 어플리케이션은 통신 단말기에서 실행 중인 제1 어플리케이션이 통신 단말기의 최상위 레이어에 표시되도록 동작을 그대로 유지하면서 백그라운드로 동작할 수 있다.At this time, the voice recognition application can operate in the background while keeping the operation so that the first application being executed in the communication terminal is displayed in the uppermost layer of the communication terminal.

실시예에 있어서, 음성인식 어플리케이션이 실행 모드로 백그라운드에서 동작하게 되면, 사용자로부터 수신되는 음성 데이터 입력에 대한 안내 메시지(210)를, 음성인식 어플리케이션과 연관된 창(Window)을 통신 단말기의 화면의 일부에 디스플레이 할 수 있다. 이때, 창은 통신 단말기의 화면의 일부에 반투명으로 제1 어플리케이션을 실행하는 상태 그대로 오버랩(overlap)하여 표시시킬 수 있다. 안내 메시지(210)는 생략되거나 음성으로 출력될 수도 있다. 도 2에 도시된 바와 같이, 안내 메시지(210)가 화면 일부에 표시될 때에 창을 삭제하기 위한 삭제 버튼이 제공될 수 있다.In the embodiment, when the speech recognition application is operated in the background in the execution mode, the guidance message 210 for inputting the voice data received from the user is transmitted to a part of the screen of the communication terminal As shown in FIG. At this time, the window may overlap and display a part of the screen of the communication terminal in a state of executing the first application in a translucent manner. The guidance message 210 may be omitted or output as a voice. As shown in FIG. 2, when the guidance message 210 is displayed on a part of the screen, a delete button for deleting the window may be provided.

통신 단말기의 음성인식 어플리케이션은 사용자로부터 수신되는 음성을 녹음 데이터로 생성한다. 통신 단말기는 녹음 데이터를 서버로 전송한다. 녹음 데이터를 서버로 전송할 때, 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 녹음 데이터와 함께 서버로 전송할 수 있다. 주소록 데이터 또는 통화 기록 정보는 녹음 데이터와 별도로 전송될 수도 있다.The voice recognition application of the communication terminal generates a voice that is received from the user as recording data. The communication terminal transmits the recording data to the server. When transmitting the recorded data to the server, the address book data or the call record information stored in the communication terminal can be transmitted to the server together with the recorded data. The address book data or call record information may be transmitted separately from the recorded data.

서버에서는, 녹음 데이터를 분석하여 녹음 데이터에 포함되어 있는 ‘전화 발신’에 대한 텍스트 데이터를 생성할 수 있다. 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 수신한 서버는 전화 발신의 발신자에 대한 정보를 녹음 데이터, 주소록 데이터 또는 통화 기록 정보로부터 획득하여 텍스트 데이터를 가공할 수 있다. 서버는 변환된 텍스트 데이터를 통신 단말기로 전송한다. 통신 단말기의 음성인식 어플리케이션은 서버로부터 수신된 텍스트 데이터를 인식하여 전화 발신 동작을 수행할 수 있다.The server can analyze the recorded data and generate text data for the 'telephone call' included in the recorded data. The server receiving the address book data or the call record information stored in the communication terminal can process the text data by obtaining the information on the caller of the telephone call from the recorded data, the address book data or the call record information. The server transmits the converted text data to the communication terminal. The voice recognition application of the communication terminal can recognize the text data received from the server and perform a telephone call operation.

다른 실시예에 있어서, 통신 단말기의 음성인식 어플리케이션은 발신자를 포함하는 전화 발신 음성이 녹음된 녹음 데이터를 서버로 전송하고, 서버로부터 수신한 텍스트 데이터에 포함된 발신자를 통신 단말기 내 연락처에서 검색하여 해당 발신자에게 호가 연결되도록 할 수 있다. 또 다른 실시예에 있어서, 녹음 데이터에 발신자가 포함되지 않은 경우 서버로부터 텍스트 데이터를 수신한 어플리케이션은 통신 단말기의 디스플레이에 다이얼 창을 띄울 수 있으며, 또는 발신자를 요청하는 메시지를 출력할 수도 있다.In another embodiment, the voice recognition application of the communication terminal transmits the recorded voice data recorded with the telephone call voice containing the caller to the server, retrieves the caller included in the text data received from the server from the contact in the communication terminal, The caller can be connected to the call. In another embodiment, an application that receives text data from a server when the sender is not included in the recorded data may launch a dial window on the display of the communication terminal, or may output a message requesting the caller.

음성인식 어플리케이션은 사용자로부터 입력된 음성 데이터에 따라 통신 단말기가 동작하도록 할 수 있다. 도 2에 따르면, 통신 단말기의 음성인식 어플리케이션은 ‘김수현에게 전화’ 동작을 수행하여, ‘김수현’에게 호 발신이 되도록 할 수 있다. 도 2를 참조하면, 음성인식 어플리케이션은 서버로부터 수신한 텍스트 데이터를 통신 단말기 화면의 일부 영역(220)에 표시할 수 있다.
The voice recognition application can cause the communication terminal to operate according to the voice data input from the user. 2, the voice recognition application of the communication terminal can perform a 'call to Kim Soo-hyun' to make a call to 'Kim Soo-hyun'. 2, the voice recognition application can display the text data received from the server in a partial area 220 of the communication terminal screen.

도 3은, 도 2와 비슷한 일례로, 멀티태스킹을 지원하는 음성 인식 서비스가 제공되는 일례를 설명하기 위한 도면이다.FIG. 3 is a diagram similar to FIG. 2 for explaining an example in which a voice recognition service supporting multitasking is provided.

실시예에 따르면, 통신 단말기가 사용자의 시작 명령 음성을 수신하여, 통신 단말기에서 사용자로부터 수신된 음성이 미리 정해진 웨이크업 명령인지 여부를 확인하고, 확인 결과 통신 단말기에서 수신한 음성이 미리 정해진 웨이크업 명령인 경우, 본 발명의 실시예에 따른 음성인식 어플리케이션을 실행 모드로 동작할 수 있다. 이때, 음성인식 어플리케이션은 제1 어플리케이션의 동작을 통신 단말기의 최상위 레이어에 표시하면서 통신 단말기의 백그라운드로 동작할 수 있다.According to the embodiment, the communication terminal receives the start command voice of the user, confirms whether or not the voice received from the user at the communication terminal is a predetermined wake up command, and if the voice received at the communication terminal is a predetermined wake up Command, the speech recognition application according to the embodiment of the present invention can operate in the execution mode. At this time, the voice recognition application can operate in the background of the communication terminal while displaying the operation of the first application on the uppermost layer of the communication terminal.

실시예에 있어서, 도 3의 단말 상태는 음성인식 어플리케이션이 실행 모드로 백그라운드에서 동작하는 상태에서, 도 2와는 달리 안내 메시지를 출력하지 않을 수 있다. 사용자로부터 ‘김수현에게 온 문자 읽고 전화 연결해줘’라는 음성 데이터를 수신한다.In the embodiment, the terminal status of FIG. 3 may not output a guidance message, unlike FIG. 2, in a state in which the voice recognition application operates in the background in the execution mode. The user receives the voice data 'Let character read from Kim Doo-Hyun and make a phone call' from the user.

통신 단말기의 음성인식 어플리케이션은 사용자로부터 수신되는 음성 데이터를 녹음 데이터로 생성한다. 통신 단말기는 녹음 데이터를 서버로 전송한다. 녹음 데이터를 서버로 전송할 때, 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 녹음 데이터와 함께 서버로 전송할 수 있다. 주소록 데이터 또는 통화 기록 정보는 녹음 데이터와 별도로 전송될 수도 있다.The voice recognition application of the communication terminal generates voice data received from the user as voice data. The communication terminal transmits the recording data to the server. When transmitting the recorded data to the server, the address book data or the call record information stored in the communication terminal can be transmitted to the server together with the recorded data. The address book data or call record information may be transmitted separately from the recorded data.

서버에서는, 녹음 데이터를 분석하여 녹음 데이터에 포함되어 있는 ‘문자 읽고' 및 "전화 연결'에 대한 텍스트 데이터를 생성할 수 있다. 통신 단말기에 저장된 주소록 데이터 또는 통화 기록 정보를 수신한 서버는 전화 발신의 발신자에 대한 정보를 녹음 데이터, 주소록 데이터 또는 통화 기록 정보로부터 획득하여 텍스트 데이터를 가공할 수 있다. 서버는 변환된 텍스트 데이터를 통신 단말기로 전송한다. 통신 단말기의 음성인식 어플리케이션은 서버로부터 수신된 텍스트 데이터를 인식하여 위에서 설명한 방식으로 서버와의 연동을 통한 문자 메시지의 음성 데이터 출력 및 전화 발신 동작을 수행할 수 있다.The server analyzes the recorded data and can generate text data for the 'character reading' and the 'telephone connection' included in the recorded data. The server receiving the address book data or the call log information stored in the communication terminal, The address book data, or the call log information, and the text data may be processed by the server. The server transmits the converted text data to the communication terminal. The text data can be recognized and the voice data output of the text message and the telephone call operation can be performed through interlocking with the server in the above-described manner.

도 3을 참조하면, 음성인식 어플리케이션은 서버로부터 수신한 텍스트 데이터를 통신 단말기 화면의 일부 영역(310)에 표시할 수 있다
3, the voice recognition application can display the text data received from the server in a partial area 310 of the communication terminal screen

실시예에서, 통신 단말기는 사용자로부터 종료 음성 명령을 수신할 수 있으며, 사용자로부터 입력된 종료 음성 명령이 미리 정해진 종료 명령 음성과 일치하는지 확인할 수 있다. 만약, 통신 단말기로 입력된 종료 음성 명령이 미리 정해진 종료 음성 명령과 일치하는 경우, 실행 중인 음성인식 어플리케이션을 종료시킬 수 있다. 음성인식 어플리케이션의 종료는 어플리케이션이 완전히 종료되거나 다시 슬립 모드로 돌아가는 것 중 하나의 동작을 포함할 수 있다. 미리 정해진 종료 음성 명령은 짧은 텍스트로 예컨대 ‘굿바이유와’ 같은 음성에 해당할 수 있다.
In an embodiment, the communication terminal may receive a termination voice command from a user and verify that the termination voice command entered from the user matches a predetermined termination command voice. If the end voice command input to the communication terminal matches the predetermined end voice command, the running voice recognition application can be terminated. The termination of the speech recognition application may include an operation of one of the applications terminating completely or returning to the sleep mode again. The predetermined ending voice command may correspond to a voice in short text, for example, &quot; Goodbye &quot;.

<통신 단말기 화면 상에 표시되는 UI 변형예>&Lt; Modification of UI displayed on communication terminal screen >

도 4는 본 발명의 일실시예에 있어서, 멀티태스킹을 지원하는 음성 인식 서비스 중 텍스트 창이 제공되는 방법에 대해 설명하기 위한 도면이다.4 is a diagram for explaining a method of providing a text window among voice recognition services supporting multitasking according to an embodiment of the present invention.

도 4와 같은 음성인식 어플리케이션에 연관된 텍스트 창이 제공될 수 있는데, 창의 크기는 텍스트의 길이에 따라서 결정될 수 있다. 도 4의 텍스트 창은 도 2의 텍스트 데이터(220) 및 도 3의 텍스트 데이터(310)를 포함하는 텍스트 창이다.A text window associated with the speech recognition application as shown in FIG. 4 may be provided, the size of the window may be determined according to the length of the text. The text window of FIG. 4 is a text window containing the text data 220 of FIG. 2 and the text data 310 of FIG.

실시예에서, ‘김수현님께 전화’라는 음성 데이터에 대한 텍스트 창이 제공될 수 있으며, 음성 버튼(410)을 탭 하게 되면, 입력된 내용에 대해서 다시 입력할 수 있도록 화면(411)과 같은 가장 작은 크기의 텍스트 창이 제공될 수 있다.In the embodiment, a text window for the voice data 'Call to Kim Soo Hyun' may be provided. If the voice button 410 is tapped, the smallest size such as the screen 411 May be provided.

또한, 텍스트(420)를 탭 하게 되면, 작성되어 있는 텍스트를 수정할 수 있도록 화면(421)과 같은 자판이 제공될 수 있으며, 사용자가 직접 입력하는 텍스트의 길이 또는 크기에 따라 텍스트 창의 크기가 적응적으로 조절될 수 있다.In addition, if the text 420 is tapped, a keyboard such as the screen 421 can be provided so that the created text can be modified, and the size of the text window can be adaptively adjusted according to the length or size of the text directly input by the user Lt; / RTI &gt;

일측에 따르면, 음성인식 어플리케이션은 상기 서버로부터 수신된 텍스트 데이터를 화면 상에 출력할 때 상기 텍스트 데이터의 길이를 측정하여, 상기 텍스트 데이터가 통신 단말기의 화면 상에 출력될 때 텍스트 데이터를 화면 상에서 구분되게 표시하는 말풍선 형태의 창(window)의 크기를 적응적으로 조절할 수 있다. 예를 들어, 텍스트 데이터의 길이가 클수록 창의 크기를 크게 하고, 작을 수로 창의 크기를 줄여서 창 내에 배치되는 텍스트 데이터가 적절한 여백으로 배치될 수 있도록 할 수 있다.
According to one aspect of the present invention, the voice recognition application measures the length of the text data when outputting the text data received from the server on the screen, and when the text data is outputted on the screen of the communication terminal, The size of the speech bubble-like window to be displayed can be adaptively adjusted. For example, the larger the length of the text data, the larger the size of the window, and the smaller the size of the window, the smaller the size of the text data placed in the window.

이상과 같은 음성 인식 서비스의 멀티태스킹을 지원하는 시스템이 제공될 수 있다. 실시예에 따른 시스템은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 시스템 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.A system supporting multitasking of the speech recognition service as described above can be provided. A system according to an embodiment may be implemented with hardware components, software components, and / or a combination of hardware components and software components. For example, the system and components may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), a programmable logic unit ), A microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, the processing apparatus may be described as being used singly, but those skilled in the art will recognize that the processing apparatus may have a plurality of processing elements and / As shown in FIG. For example, the processing unit may comprise a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. The software and / or data may be in the form of any type of machine, component, physical device, virtual equipment, computer storage media, or device , Or may be permanently or temporarily embodied in a transmitted signal wave. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

상기와 같은 실시예를 통해, 기존에 제공되던 음성 인식 서비스를 보완하여, 단말 내에서 멀티태스킹이 이루어지지 않던 문제점을 해결하고, 제1 어플리케이션이 동작하는 중에 음성 인식 서비스를 제공하는 음성 인식 어플리케이션을 멀티태스킹으로 동작시킬 수 있다.
Through the above-described embodiment, a voice recognition application that solves the problem that multitasking is not performed in the terminal by supplementing the voice recognition service that has been provided, and provides a voice recognition service while the first application is operating It can be operated by multitasking.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI &gt; or equivalents, even if it is replaced or replaced.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (16)

통신 단말기에서 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법에 있어서,
제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 단계;
상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시키는 단계;
상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하는 단계; 및
상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계
를 포함하고,
상기 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션이 실행 대기 모드로 동작하는 단계는,
상기 제1 어플리케이션을 상기 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시하면서 상기 제1 어플리케이션을 동작시키는 단계; 및
상기 음성인식 어플리케이션을 백그라운드(back-ground)에서 실행 대기 모드로 동작시키는 단계
를 포함하는, 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법..
A method for supporting multitasking of a speech recognition application in a communication terminal,
Operating the speech recognition application in an execution standby mode with the operation of the first application;
Receiving a predetermined awake up command of the speech recognition application and operating the speech recognition application in an execution mode;
Transmitting voice data recorded by a user through voice recognition application to a server; And
Receiving the execution result corresponding to the recording data from the server and operating the communication terminal
Lt; / RTI &gt;
Wherein the step of operating the speech recognition application in the execution standby mode together with the operation of the first application comprises:
Operating the first application while displaying the first application on a top layer of a display of the communication terminal; And
Operating the voice recognition application in a standby standby mode from a back-
A method for supporting multitasking of a speech recognition application in a communication terminal, comprising:
삭제delete 제1항에 있어서,
상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령을 입력 받아 음성인식 어플리케이션을 실행 모드로 동작시키는 단계는,
상기 음성인식 어플리케이션의 웨이크업(awake up) 명령을 입력 받는 단계;
상기 음성인식 어플리케이션의 웨이크업(awake up) 명령이 상기 미리 정해진 음성인식 어플리케이션의 웨이크업(awake up) 명령에 해당하는지 판단하는 단계; 및
상기 음성인식 어플리케이션의 웨이크업(awake up) 명령이 미리 정해진 음성인식 어플리케이션의 웨이크업(awake up) 명령에 해당한다고 판단한 경우, 상기 음성인식 어플리케이션을 실행모드로 동작시키는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Wherein the step of operating the voice recognition application in the execution mode by receiving a predetermined awake up command of the voice recognition application comprises:
Receiving an awake up command of the speech recognition application;
Determining whether a wake-up command of the speech recognition application corresponds to a wake-up command of the predetermined speech recognition application; And
If it is determined that the awake up command of the speech recognition application corresponds to a wake up command of a predetermined speech recognition application,
The method comprising the steps of: receiving a voice recognition application;
제3항에 있어서,
상기 음성인식 어플리케이션을 실행모드로 동작시키는 단계는,
상기 제1 어플리케이션이 상기 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시되도록 상기 제1 어플리케이션의 동작을 유지하면서, 백그라운드(back-ground)에서 상기 음성인식 어플리케이션을 실행 모드로 동작시키는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method of claim 3,
Wherein the step of operating the speech recognition application in an execution mode comprises:
Operating the voice recognition application in an execution mode on a back-ground while maintaining the operation of the first application so that the first application is displayed on a top layer of a display of the communication terminal
The method comprising the steps of: receiving a voice recognition application;
제3항에 있어서,
상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령은,
상기 음성인식 어플리케이션을 실행시키기 위한 미리 정해진 음성인식 어플리케이션 실행 명령인
통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method of claim 3,
The predetermined awake up command of the speech recognition application may include:
A predetermined speech recognition application execution instruction for executing the speech recognition application
A method for supporting multitasking of speech recognition applications in a communication terminal.
제3항에 있어서,
상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령은,
사용자로부터 수신되는 음성 또는 상기 음성인식 어플리케이션의 실행 대기 모드에서 호 수신, 문자 수신, 메신저 수신 중 적어도 하나의 이벤트로 설정되는
통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method of claim 3,
The predetermined awake up command of the speech recognition application may include:
And is set to at least one of a voice received from the user or a call reception, a character reception, and a messenger reception in the standby mode of the voice recognition application
A method for supporting multitasking of speech recognition applications in a communication terminal.
제1항에 있어서,
상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하는 단계는,
상기 통신 단말기 내에 저장된 주소록 데이터를 함께 상기 서버로 전송하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Wherein the step of transmitting the voice data recorded by the user through the voice recognition application to the server comprises:
Transmitting the address book data stored in the communication terminal together to the server
The method comprising the steps of: receiving a voice recognition application;
제1항에 있어서,
상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는,
전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 중 적어도 하나의 동작을 실행하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Receiving the execution result corresponding to the recording data from the server and operating the communication terminal,
Executing at least one of an operation of calling a telephone, receiving a telephone call, sending a message, receiving a message, or receiving a messenger
The method comprising the steps of: receiving a voice recognition application;
제8항에 있어서,
상기 전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 동작에 대응하는 메시지를 상기 음성인식 어플리케이션과 연관된 창(window)에 표시하는 단계
를 더 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
9. The method of claim 8,
Displaying a message corresponding to the call origination, call reception, message origination, message reception or messenger reception operation on a window associated with the voice recognition application
The method comprising the steps of: providing a voice recognition application in a communication terminal;
제9항에 있어서,
상기 전화 발신, 전화 수신, 메시지 발신, 메시지 수신 또는 메신저 수신 동작에 대응하는 메시지를 상기 음성인식 어플리케이션과 연관된 창(window)에 표시하는 단계는,
상기 음성인식 어플리케이션과 연관된 창을 반투명으로 상기 제1 어플리케이션에 오버랩(overlap)하여 상기 통신 단말기의 디스플레이 상에 표시하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
10. The method of claim 9,
The step of displaying a message corresponding to the call origination, call reception, message origination, message reception or messenger reception operation on a window associated with the voice recognition application,
Overlapping a window associated with the speech recognition application with the first application in a semitransparent manner and displaying on the display of the communication terminal
The method comprising the steps of: receiving a voice recognition application;
제10항에 있어서,
상기 음성인식 어플리케이션과 연관된 창(window)을 반투명으로 상기 제1 어플리케이션에 오버랩(overlap)하여 상기 통신 단말기의 디스플레이 상에 표시하는 단계는,
상기 창(window)의 크기를 상기 음성 데이터에 대응하는 텍스트 데이터의 길이에 따라 적응적으로 조절하여 표시하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
11. The method of claim 10,
The step of overlapping the window associated with the speech recognition application with the first application translucently and displaying the overlap on the display of the communication terminal,
Adaptively adjusting the size of the window according to the length of the text data corresponding to the voice data and displaying the adjusted size;
The method comprising the steps of: receiving a voice recognition application;
제1항에 있어서,
상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는,
상기 통신 단말기의 마이크를 통해 주변 소음 크기를 측정하는 단계;
상기 주변 소음 크기 및 상기 통신 단말기의 스피커 볼륨 크기를 비교하는 단계; 및
상기 스피커 볼륨 크기를 상기 주변 소음 크기에 기초하여 조절하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Receiving the execution result corresponding to the recording data from the server and operating the communication terminal,
Measuring an ambient noise magnitude through a microphone of the communication terminal;
Comparing the ambient noise magnitude and the speaker volume magnitude of the communication terminal; And
Adjusting the speaker volume size based on the ambient noise magnitude
The method comprising the steps of: receiving a voice recognition application;
제1항에 있어서,
상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 상기 통신 단말기를 동작시키는 단계는,
상기 음성인식 어플리케이션과 상기 제1 어플리케이션의 출력 볼륨 크기를 적응적으로 조절하는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Receiving the execution result corresponding to the recording data from the server and operating the communication terminal,
Adaptively adjusting an output volume size of the speech recognition application and the first application
The method comprising the steps of: receiving a voice recognition application;
제1항에 있어서,
상기 제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 단계는,
상기 통신 단말기의 스크린이 오프(off),
상기 통신 단말기가 록 오프(lock off),
상기 통신 단말기가 아이들(idle) 상태,
상기 통신 단말기가 음성 호(call)를 수신한 상태; 및
상기 통신 단말기가 문자 메시지를 수신한 상태
중 적어도 하나의 상태에서도 상기 음성인식 어플리케이션을 실행 대기 모드로 동작시키는 단계
를 포함하는 통신 단말기에서의 음성인식 어플리케이션의 멀티태스킹을 지원하는 방법.
The method according to claim 1,
Wherein the step of operating the voice recognition application in the standby mode, together with the operation of the first application,
The screen of the communication terminal is turned off,
When the communication terminal is locked off,
Wherein the communication terminal is in an idle state,
A state in which the communication terminal receives a voice call; And
When the communication terminal receives a text message
Operating the speech recognition application in a standby mode even in at least one of
The method comprising the steps of: receiving a voice recognition application;
제1항 및 제3항 내지 제14항 중 어느 한 항의 방법을 실행하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체.
A computer-readable recording medium storing a program for executing the method of any one of claims 1 to 14.
음성인식 어플리케이션이 기록된 메모리; 및
상기 음성인식 어플리케이션의 실행을 제어하는 프로세서
를 포함하고,
상기 프로세서는,
제1 어플리케이션의 동작과 함께 음성인식 어플리케이션을 실행 대기 모드로 동작시키고,
상기 음성인식 어플리케이션의 미리 정해진 웨이크업(awake up) 명령에 의하여 상기 음성인식 어플리케이션을 실행 모드로 동작시키고,
상기 음성인식 어플리케이션을 통해 사용자의 음성 데이터를 녹음한 녹음 데이터를 서버로 전송하고,
상기 녹음 데이터에 대응하는 실행 결과를 상기 서버로부터 수신하여 통신 단말기를 동작시키고,
상기 실행 대기 모드는,
상기 제1 어플리케이션을 상기 통신 단말기의 디스플레이의 최상위 레이어(Layer)에 표시하면서 상기 제1 어플리케이션을 동작시키고, 상기 음성인식 어플리케이션을 백그라운드(back-ground)에서 동작하는,
통신 단말기.
A memory in which a speech recognition application is recorded; And
A processor for controlling execution of the speech recognition application;
Lt; / RTI &gt;
The processor comprising:
The voice recognition application is operated in the execution standby mode together with the operation of the first application,
Operating the speech recognition application in an execution mode by a predetermined awake up command of the speech recognition application,
Transmitting voice data recorded by a user through voice recognition application to a server,
Receiving an execution result corresponding to the recording data from the server to operate the communication terminal,
The execution standby mode includes:
The first application is operated while displaying the first application on a top layer of the display of the communication terminal, and the voice recognition application is operated in the back-
Communication terminal.
KR1020140026926A 2014-03-07 2014-03-07 Method and system of supporting multitasking of speech recognition service in in communication device KR101584887B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140026926A KR101584887B1 (en) 2014-03-07 2014-03-07 Method and system of supporting multitasking of speech recognition service in in communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140026926A KR101584887B1 (en) 2014-03-07 2014-03-07 Method and system of supporting multitasking of speech recognition service in in communication device

Publications (2)

Publication Number Publication Date
KR20150104930A KR20150104930A (en) 2015-09-16
KR101584887B1 true KR101584887B1 (en) 2016-01-22

Family

ID=54244461

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140026926A KR101584887B1 (en) 2014-03-07 2014-03-07 Method and system of supporting multitasking of speech recognition service in in communication device

Country Status (1)

Country Link
KR (1) KR101584887B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018194268A1 (en) * 2017-04-19 2018-10-25 Samsung Electronics Co., Ltd. Electronic device and method for processing user speech

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016201341B4 (en) 2015-02-09 2021-11-25 Samsung Electro-Mechanics Co., Ltd. MULTI-BAND ANTENNA WITH EXTERNAL CONDUCTOR AND ELECTRONIC DEVICE INCLUDING THIS
KR102369309B1 (en) 2017-03-24 2022-03-03 삼성전자주식회사 Electronic device for performing an operation for an user input after parital landing
KR102365649B1 (en) * 2017-06-28 2022-02-22 삼성전자주식회사 Method for controlling display and electronic device supporting the same
CN109584879B (en) * 2018-11-23 2021-07-06 华为技术有限公司 Voice control method and electronic equipment
KR102694162B1 (en) * 2021-11-29 2024-08-12 주식회사 엔씨소프트 Method and apparatus for providing voice information of application

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020173344A1 (en) * 2001-03-16 2002-11-21 Cupps Bryan T. Novel personal electronics device
KR101074048B1 (en) * 2009-12-07 2011-10-17 엘지전자 주식회사 Mobile Terminal And Method Of Controlling The Same
KR101912409B1 (en) * 2012-01-06 2018-10-26 엘지전자 주식회사 Mobile terminal and mothod for controling of the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
카탈로그: 시리

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018194268A1 (en) * 2017-04-19 2018-10-25 Samsung Electronics Co., Ltd. Electronic device and method for processing user speech
KR20180117485A (en) * 2017-04-19 2018-10-29 삼성전자주식회사 Electronic device for processing user utterance and method for operation thereof
US10803862B2 (en) 2017-04-19 2020-10-13 Samsung Electronics Co., Ltd Electronic device and method for processing user speech
KR102414122B1 (en) 2017-04-19 2022-06-29 삼성전자주식회사 Electronic device for processing user utterance and method for operation thereof

Also Published As

Publication number Publication date
KR20150104930A (en) 2015-09-16

Similar Documents

Publication Publication Date Title
US11721320B2 (en) Method and user device for providing context awareness service using speech recognition
CN105378708B (en) Context aware dialog policy and response generation
TWI644307B (en) Method, computer readable storage medium and system for operating a virtual assistant
KR101584887B1 (en) Method and system of supporting multitasking of speech recognition service in in communication device
CN110085222B (en) Interactive apparatus and method for supporting voice conversation service
US9444423B2 (en) Method for adjusting volume and electronic device thereof
KR101944416B1 (en) Method for providing voice recognition service and an electronic device thereof
US20160072948A1 (en) Electronic device and method for extracting incoming/outgoing information and managing contacts
US9444927B2 (en) Methods for voice management, and related devices
US20190304455A1 (en) Electronic device for processing user voice
KR20130068303A (en) Apparatus for performing voice command, mobile terminal having the same and method for performing voice command
KR20190122457A (en) Electronic device for performing speech recognition and the method for the same
KR102217301B1 (en) Contact control of artificial intelligence reflecting personal schedule and lifestyle
CN105446695B (en) A kind of sweep-out method and device of notification message
KR101643808B1 (en) Method and system of providing voice service using interoperation between application and server
CN104851446A (en) voice management method and system
KR101379405B1 (en) Method of processing voice communication and mobile terminal performing the same
KR20140116642A (en) Apparatus and method for controlling function based on speech recognition
KR20140105340A (en) Method and Apparatus for operating multi tasking in a terminal
US20140257808A1 (en) Apparatus and method for requesting a terminal to perform an action according to an audio command
US20170013118A1 (en) Electronic device and notification method thereof
CN101848259A (en) Speech processing method and system for digital family fixed telephone
KR101621136B1 (en) Method and communication terminal of providing voice service using illumination sensor
CN115130478A (en) Intention decision method and device, and computer readable storage medium
KR101654301B1 (en) Apparatus And Computer-Readable Recording Medium with Program for Providing Sticker Information

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20140307

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20150518

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20151127

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20160106

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20160106

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20181211

Year of fee payment: 6

PR1001 Payment of annual fee

Payment date: 20181211

Start annual number: 4

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20241209

Start annual number: 10

End annual number: 12