[go: up one dir, main page]

KR20170046958A - 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 - Google Patents

전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 Download PDF

Info

Publication number
KR20170046958A
KR20170046958A KR1020150147226A KR20150147226A KR20170046958A KR 20170046958 A KR20170046958 A KR 20170046958A KR 1020150147226 A KR1020150147226 A KR 1020150147226A KR 20150147226 A KR20150147226 A KR 20150147226A KR 20170046958 A KR20170046958 A KR 20170046958A
Authority
KR
South Korea
Prior art keywords
voice
electronic device
user input
input
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020150147226A
Other languages
English (en)
Inventor
강상기
백성환
이지민
김경태
전용준
강두석
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020150147226A priority Critical patent/KR20170046958A/ko
Priority to EP16195089.4A priority patent/EP3160150A1/en
Priority to US15/332,282 priority patent/US20170116987A1/en
Priority to PCT/KR2016/011972 priority patent/WO2017069595A1/en
Priority to CN201680048426.1A priority patent/CN107924288A/zh
Publication of KR20170046958A publication Critical patent/KR20170046958A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • H04M1/72522
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

다양한 실시예에 따른, 전자 장치는, 제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징; 외부로부터 소리를 수신하도록 배치된 마이크; 상기 하우징에 배치된 적어도 하나의 입력 장치; 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이; 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서; 및 상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하고, 상기 메모리는, 실행시에, 상기 프로세서가, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하고, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장할 수 있다. 또한, 다양한 실시예가 가능하다.

Description

전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법{Electronic apparatus and Method for executing function using speech recognition thereof}
본 발명의 다양한 실시예들은 전자 장치 및 음성 인식을 이용하여 전자 장치의 기능을 용이하게 실행할 수 있는 방법에 관한 것이다.
정보통신 기술과 반도체 기술 등의 눈부신 발전에 힘입어 전자 장치의 보급과 이용이 급속도로 증가하고 있다. 또한, 최근의 전자 장치들은 각자의 전통적인 고유 영역에 머무르지 않고 다양한 단말기들과 컨버전스(convergence)되고 있다. 예를 들어, 이동통신 단말기의 경우 음성통화나 메시지 송수신과 같은 일반적인 통신 기능 외에도 TV 시청 기능(예컨대, DMB(Digital Multimedia Broadcasting)나 DVB(Digital Video Broadcasting)와 같은 이동 방송), 음악 재생 기능(예컨대, MP3(MPEG Audio Layer-3), 인터넷 접속 기능, 라디오 수신 기능 등 다양한 기능들을 제공하고 있다.
한편, 최근에는 음성 인식 기술이 발전하며, 음성 인식 기술은 음성 입력 장치(예,마이크)를 구비하는 다양한 전자 장치에서 구현될 수 있다. 이러한 음성 인식 기술은 최근 전자 장치에서 물리적 입력을 대체하고, 음성으로 전자 장치를 제어하기 위해 사용되고 있다.
그러나, 음성 입력을 통해 전자 장치를 제어하기 위해서, 사용자는 전자 장치를 활성화시키고, 음성 인식 기능을 활성화시켜야 하며, 음성 정보를 입력해야 하는 다수의 과정을 순차적으로 수행해야 한다. 따라서, 사용자는 음성 입력을 통해 전자 장치의 제어에 번거로움을 느낄 수 있다. 특히, 보안을 위해 전자 장치가 잠금 설정된 경우 사용자는, 음성으로 전자 장치를 제어하기 이전에 잠금 설정을 해제해야 하는 과정이 추가로 요구된다. 이는 음성 인식 기능의 활용도를 저하시키는 요인으로 작용할 수 있다.
이에 따라, 최근에는 음성 입력을 통해 전자 장치가 제공하는 다양한 기능들을 용이하게 실행하기 위한 방안이 요구되고 있다.
본 발명의 다양한 실시예들은 다양한 사용자 입력에 따라 음성 인식 기능을 활성화하여 특정 도메인(기능)에 대한 음성 명령을 보다 용이하게 수행할 수 있는 전자 장치 및 음성 인식을 이용한 기능 실행 방법을 제공할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는, 제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징; 외부로부터 소리를 수신하도록 배치된 마이크; 상기 하우징에 배치된 적어도 하나의 입력 장치; 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이; 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서; 및 상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제1소프트웨어 프로그램을 저장하고, 상기 메모리는, 실행시에, 상기 프로세서가, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하고, 상기 제 2 사용자 입력에 대응하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제1소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는 하우징; 외부로부터 소리를 수신하도록 배치된 마이크; 상기 하우징의 외부 면에 배치된 적어도 하나의 유저 인터페이스; 상기 마이크 및 상기 유저 인터페이스와 전기적으로 연결된 프로세서; 및 상기 프로세서와 전기적으로 연결되며, 제 1 사용자 입력에 응답하여 트리거(trigger) 가능한, 제1소프트웨어 프로그램을 저장하는 메모리를 포함하고, 상기 메모리는, 실행시에, 상기 프로세서가, 상기 적어도 하나의 유저 인터페이스를 통하여, 상기 제 1 사용자 입력과 상이한 제 2 사용자 입력을 수신하고, 상기 제2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제1소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법은 사용자 입력을 수신하는 동작; 상기 수신된 사용자 입력이 음성 인식 활성화 조건을 만족하는 경우, 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작; 상기 마이크를 통해 외부로부터 음성 정보를 수신하는 동작; 상기 사용자 입력을 기반으로 특정 기능 실행 도메인을 확인하는 동작; 및 상기 확인된 기능 실행 도메인으로 제한하여 상기 수신된 음성 정보를 이용해 음성 명령을 처리하는 동작을 포함을 포함할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법은 제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징, 외부로부터 소리를 수신하도록 배치된 마이크, 상기 하우징에 배치된 적어도 하나의 입력 장치, 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이, 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서, 및 상기 프로세서와 전기적으로 연결되고, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하는 메모리를 포함하는 전자 장치에 의하여, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하는 동작; 상기 전자 장치에 의하여, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작; 상기 전자 장치에 의하여, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하는 동작; 상기 전자 장치에 의하여, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하는 동작을 포함할 수 있다.
본 발명의 다양한 실시예는 전자 장치에 구비된 입력 장치를 기반으로 음성 인식 기능을 실행하고, 입력된 음성을 특정 도메인(기능)과 관련하여 처리하여 음성 입력을 통해 특정 기능을 용이하고, 신속하게 실행할 수 있다. 이에 따라, 전자 장치는 다수 번의 사용자 입력 없이도, 음성 인식 기능을 용이하게 활성화하고, 입력된 음성에 대해 미리 설정된 특정 어플리케이션에 제한된 음성 명령으로 처리하여 음성 인식의 효율성을 개선할 수 있다.
도 1은 다양한 실시예에 따른 전자 장치의 네트워크 구성을 도시한다.
도 2는 다양한 실시예에 따른 전자 장치의 프로세서의 구성을 도시한다.
도 3은 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시하는 순서도이다.
도 4는 다양한 실시예에 따른 전자 장치의 프로세서의 구성을 도시한다.
도5는 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시한 흐름도이다.
도6은 다양한 실시예에 따른 전자 장치의 화면 제어 방법을 도시한 순서도이다.
도 7은 다양한 실시예에 따른 전자 장치의 화면 제어 방법을 설명하기 위한 예시도이다.
도 8a 내지 8d는 다양한 실시예에 따른 음성 인식을 트리거링 하는 다양한 사용자 입력 방법들을 도시한다.
도 9는 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시한 순서도이다.
도 10은 다양한 실시예에 따른 키 입력 시간에 따른 도메인 결정 방법을 도시한 순서도이다.
도 11은 다양한 실시예에 따른 키 입력 시간에 따른 도메인 결정 방법을 설명하기 위한 화면 예시도이다.
도 12는 다양한 실시예에 따른 아이콘을 이용하여 음성 인식을 트리거링하는 방법을 설명하기 위한 화면 예시도이다.
도 13은 다양한 실시예에 따른 음성 인식 실패를 통지하는 화면 예시도이다.
도 14는 다양한 실시예에 따른 잠금 설정 시 전자 장치의 음성 인식을 이용한 기능 실행 방법을 설명하기 위한 도면이다.
도 15는 다양한 실시예에 따른 프로그램 모듈의 블록도이다.
도 16은 다양한 실시예에 따른 전자 장치의 블록도이다.
이하, 본 문서의 다양한 실시예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 문서의 실시예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
본 문서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
본 문서에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.
본 문서에서 사용된 "제 1," "제 2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제 1 사용자 기기와 제 2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 바꾸어 명명될 수 있다.
어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제 3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.
본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.
본 문서에서 사용된 용어들은 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 다른 실시예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은, 관련 기술의 문맥상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시예들을 배제하도록 해석될 수 없다.
본 문서의 다양한 실시예들에 따른 전자 장치는, 예를 들면, 스마트폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 영상 전화기, 전자책 리더기(e-book reader), 데스크탑 PC(desktop personal computer), 랩탑 PC(laptop personal computer), 넷북 컴퓨터(netbook computer), 워크스테이션(workstation), 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라(camera), 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있다. 다양한 실시예에 따르면, 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식형(예: implantable circuit) 중 적어도 하나를 포함할 수 있다.
어떤 실시예들에서, 전자 장치는 가전 제품(home appliance)일 수 있다. 가전 제품은, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), 홈 오토매이션 컨트롤 패널(home automation control panel), 보안 컨트롤 패널(security control panel), TV 박스(예: 삼성 HomeSyncTM, 애플TVTM, 또는 구글 TVTM), 게임 콘솔(예: XboxTM, PlayStationTM), 전자 사전, 전자 키, 캠코더(camcorder), 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시예에서, 전자 장치는, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션(navigation) 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트(infotainment) 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 금융 기관의 ATM(automatic teller's machine), 상점의 POS(point of sales), 또는 사물 인터넷 장치(internet of things)(예: 전구, 각종 센서, 전기 또는 가스 미터기, 스프링클러 장치, 화재경보기, 온도조절기(thermostat), 가로등, 토스터(toaster), 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.
어떤 실시예에 따르면, 전자 장치는 가구(furniture) 또는 건물/구조물의 일부, 전자 보드(electronic board), 전자 사인 수신 장치(electronic signature receiving device), 프로젝터(projector), 또는 각종 계측 기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 다양한 실시예에서, 전자 장치는 전술한 다양한 장치들 중 하나 또는 그 이상의 조합일 수 있다. 어떤 실시예에 따른 전자 장치는 플렉서블 전자 장치일 수 있다. 또한, 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않으며, 기술 발전에 따른 새로운 전자 장치를 포함할 수 있다.
이하, 첨부 도면을 참조하여, 다양한 실시예에 따른 전자 장치가 설명된다. 본 문서에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.
도 1은, 다양한 실시예에 따른 전자 장치의 네트워크 구성을 도시한다.
도 1을 참조하여, 다양한 실시예에서의, 네트워크 환경(100) 내의 전자 장치(101)가 기재된다. 전자 장치(101)는 버스(110), 프로세서(120), 메모리(130), 입출력 인터페이스(150), 디스플레이(160), 및 통신 인터페이스(170)를 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)는, 구성요소들 중 적어도 하나를 생략하거나 다른 구성요소를 추가적으로 구비할 수 있다.
버스(110)는, 예를 들면, 구성요소들(110-170)을 서로 연결하고, 구성요소들 간의 통신(예: 제어 메시지 및/또는 데이터)을 전달하는 회로를 포함할 수 있다.
프로세서(120)는, 중앙처리장치(central processing unit(CPU)), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 하나 또는 그 이상을 포함할 수 있다. 프로세서(120)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 후술하는 도 2를 통하여 상기 프로세서(120)기능에 대한 추가적인 정보가 제공된다.
메모리(130)는, 휘발성 및/또는 비휘발성 메모리를 포함할 수 있다. 메모리(130)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있다. 한 실시예에 따르면, 메모리(130)는 소프트웨어 및/또는 프로그램(140)을 저장할 수 있다. 프로그램(140)은, 예를 들면, 커널(141), 미들웨어(143), 어플리케이션 프로그래밍 인터페이스(application programming interface(API))(145), 및/또는 어플리케이션 프로그램(또는 "어플리케이션")(147) 등을 포함할 수 있다. 커널(141), 미들웨어(143), 또는 API(145)의 적어도 일부는, 운영 시스템(operating system(OS))으로 지칭될 수 있다.
커널(141)은, 예를 들면, 다른 프로그램들(예: 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147))에 구현된 동작 또는 기능을 실행하는 데 사용되는 시스템 리소스들(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)을 제어 또는 관리할 수 있다. 또한, 커널(141)은 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147)에서 전자 장치(101)의 개별 구성요소에 접근함으로써, 시스템 리소스들을 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.
미들웨어(143)는, 예를 들면, API(145) 또는 어플리케이션 프로그램(147)이 커널(141)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다.
또한, 미들웨어(143)는 어플리케이션 프로그램(147)으로부터 수신된 하나 이상의 작업 요청들을 우선 순위에 따라 처리할 수 있다. 예를 들면, 미들웨어(143)는 어플리케이션 프로그램(147) 중 적어도 하나에 전자 장치(101)의 시스템 리소스(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)를 사용할 수 있는 우선 순위를 부여할 수 있다. 예컨대, 미들웨어(143)는 상기 적어도 하나에 부여된 우선 순위에 따라 상기 하나 이상의 작업 요청들을 처리함으로써, 상기 하나 이상의 작업 요청들에 대한 스케쥴링 또는 로드 밸런싱 등을 수행할 수 있다.
API(145)는, 예를 들면, 어플리케이션(147)이 커널(141) 또는 미들웨어(143)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일 제어, 창 제어, 영상 처리, 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(예: 명령어)를 포함할 수 있다.
입출력 인터페이스(150)는, 예를 들면, 사용자 또는 다른 외부 기기로부터 입력된 명령 또는 데이터를 전자 장치(101)의 다른 구성요소(들)에 전달할 수 있는 인터페이스의 역할을 할 수 있다. 또한, 입출력 인터페이스(150)는 전자 장치(101)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 사용자 또는 다른 외부 기기로 출력할 수 있다.
예를 들면, 입출력 인터페이스(150)는 숫자 또는 문자 정보를 입력 받거나, 전자 장치(101)의 각종 기능들을 설정하기 위한 터치 패널, 펜 센서 및 키(key) 중 적어도 하나를 포함할 수 있다. 입출력 인터페이스(150)는, 전자 장치(101)를 키거나 끄도록 제어하는 파워 키(power key), 화면 켜기를 제어하는 홈 키(home key), 소리 크기를 제어하는 볼륨 키(volume key)와 같은 물리적 하드 키와, 터치 센서를 통한 터치 입력을 제어하는 터치 키, 소프트 키를 포함할 수 있다.
다른 예를 들어, 입출력 인터페이스(150)는 오디오 신호를 처리하고 오디오 신호의 입출력을 제어하는 오디오 처리 모듈(미도시)을 포함할 수 있다.
디스플레이(160)는, 예를 들면, 액정 디스플레이(liquid crystal display(LCD)), 발광 다이오드(light-emitting diode(LED)) 디스플레이, 유기 발광 다이오드(organic light-emitting diode(OLED)) 디스플레이, 또는 마이크로 전자기계 시스템(microelectromechanical systems(MEMS)) 디스플레이, 또는 전자종이(electronic paper) 디스플레이를 포함할 수 있다. 디스플레이(160)는, 예를 들면, 사용자에게 각종 콘텐츠(예: 텍스트, 이미지, 비디오, 아이콘, 또는 심볼 등)을 표시할 수 있다. 디스플레이(160)는, 터치 스크린을 포함할 수 있으며, 예를 들면, 터치 스크린은 전자 펜 또는 사용자의 신체의 일부를 이용한 터치, 제스쳐, 근접, 또는 호버링 입력을 수신할 수 있다.
통신 인터페이스(170)는, 예를 들면, 전자 장치(101)와 외부 장치(예: 제 1 외부 전자 장치(102), 제 2 외부 전자 장치(104), 또는 서버(106)) 간의 통신을 설정할 수 있다. 예를 들면, 통신 인터페이스(170)는 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 외부 장치(예: 제 2 외부 전자 장치(104) 또는 서버(106))와 통신할 수 있다.
무선 통신은, 예를 들면, 셀룰러 통신 프로토콜로서, 예를 들면, LTE(long-term evolution), LTE-A(LTE Advance), CDMA(code division multiple access), WCDMA(wideband CDMA), UMTS(universal mobile telecommunications system), WiBro(Wireless Broadband), 또는 GSM(Global System for Mobile Communications) 등 중 적어도 하나를 사용할 수 있다. 또한, 무선 통신은, 예를 들면, 근거리 통신(164)을 포함할 수 있다. 근거리 통신(164)은, 예를 들면, WiFi(wireless fidelity), 블루투스(Bluetooth), NFC(near field communication) 등 중 적어도 하나를 포함할 수 있다. 또는, 상기 무선 통신은 GNSS(global navigation satellite system)를 포함할 수 있다. 상기 GNSS는 사용 지역 또는 대역폭 등에 따라, 예를 들면, GPS(Global Positioning System), Glonass(Global Navigation Satellite System), Beidou Navigation Satellite System(이하 "Beidou") 또는 Galileo, the European global satellite-based navigation system 중 적어도 하나를 포함할 수 있다. 이하, 본 문서에서는, "GPS"는 "GNSS"와 혼용되어 사용(interchangeably used)될 수 있다. 유선 통신은, 예를 들면, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard232), 또는 POTS(plain old telephone service) 등 중 적어도 하나를 포함할 수 있다. 네트워크(162)는 통신 네트워크(telecommunications network), 예를 들면, 컴퓨터 네트워크(computer network)(예: LAN 또는 WAN), 인터넷, 또는 전화 망(telephone network) 중 적어도 하나를 포함할 수 있다.
제 1 및 제 2 외부 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 한 실시예에 따르면, 서버(106)는 하나 또는 그 이상의 서버들의 그룹을 포함할 수 있다. 다양한 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 다른 하나 또는 복수의 전자 장치(예: 전자 장치(102,104), 또는 서버(106)에서 실행될 수 있다.
한 실시예에 따르면, 전자 장치(101)가 음성 인식 기능 또는 음성 인식 서비스를 자동으로 또는 요청에 의하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 그와 연관된 적어도 일부 기능을 다른 장치(예: 전자 장치(102, 104), 또는 서버(106))에게 요청할 수 있다. 통신 인터페이스(170)는 음성 인식 기능이 활성화된 경우, 오디오 입력 장치(예, 마이크)를 통해 전달된 오디오 신호 및/ 또는 음성 신호를 음성 인식 기능을 수행하는 서버로 전달할 수 있다.
다른 전자 장치(예: 전자 장치(102, 104), 또는 서버(106))는 요청된 기능 또는 추가 기능을 실행하고, 그 결과를 전자 장치(101)로 전달할 수 있다. 예를 들어, 서버(106)는, 전자 장치(101)로부터 전달된 오디오 신호 및/ 또는 음성 신호에 대해 음성 인식을 수행하고 이에 대한 인식 결과를 전자 장치(101)로 제공할 수 있다. 다양한 실시예에 따라, 서버(106)는 음성 인식이 성공한 경우, 음성 신호를 텍스트 정보로 변환하고, 변환된 텍스트 정보에 기반한 음성 명령 정보 또는 음성 명령에 대응하는 기능 실행 정보를 전자 장치(101)로 전달할 수 있다. 다양한 실시예에 따라, 서버(106)는 음성 인식이 실패한 경우, 음성 인식 실패 정보를 전자 장치(101)로 전달할 수도 있다.
전자 장치(101)는 서버(106)로부터 음성 인식 결과를 수신하고, 이를 그대로 또는 추가적으로 처리하여 요청된 기능이나 서비스를 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
도 2는 다양한 실시예에 따른 전자 장치의 프로세서의 구성을 도시한다.
도 2를 참조하면, 상기 전자 장치(101)의 프로세서(120)는, 트리거 인식 모듈(121), 음성 명령 인식 모듈(122), 영상 처리 모듈(123), 기능 제어 모듈(124), 및 음성 출력 모듈(125)을 포함할 수 있다.
상기 트리거 인식 모듈(121)은, 전자 장치(101)에 구비된 다양한 입력 장치를 통해 사용자 입력이 검출된 경우, 음성 인식 활성화 조건이 발생됐는지를 판단할 수 있다. 음성 인식 활성화 조건은 전자 장치에 구비된 입력 장치의 동작 별로 상이하게 설정될 수 있다. 예를 들면, 상기 트리거 인식 모듈(121)은 전자 장치에 구비된 버튼 방식의 키(예컨대 전원 키, 볼륨 키, 홈 키) 또는 터치 키(예컨대 메뉴 키, 취소 키 등)와 같은 물리적 하드 키 또는 소프트 키 등의 숏(short) 또는 롱 프레스(long press) 입력을 검출하거나, 압력 센서 또는 모션 센서를 통해 특정 모션 입력(또는 제스처 입력)이 검출된 경우, 사용자 입력에 기반한 음성 인식 활성화 조건이 발생됐다고 판단할 수 있다. 어떤 실시예에 따르면, 상기 트리거 인식 모듈(121)은 외부 장치(예컨대 근거리 무선 통신 연결된 웨어러블 장치)로부터 트리거 입력을 수신할 수 있다.
상기 트리거 인식 모듈(121)은, 사용자 입력에 대해 음성 인식 활성화 조건이 발생된 경우, 음성 명령 인식 모듈(122)의 활성화 요청 및 사용자 입력 타입에 따른 트리거 정보를 확인하고, 이를 음성 명령 인식 모듈(122)로 전달할 수 있다. 여기서, 트리거 정보는, 입력된 하드 키 또는 소프트 키의 종류, 하드 키 또는 소프트 키의 입력 시간, 제스처 방향, 전자 장치의 현재 위치 정보, 외부 장치의 연결 여부 등을 지시하는 정보일 수 있다. 또는 상기 트리거 정보는 상기 사용자 입력 타입에 따라 결정된 특정 기능 도메인(예컨대 메시지 도메인, 통화 도메인, 연락처 도메인, 음악 재생 도메인, 카메라 도메인 등)을 지시하는 정보일 수 있다.
일 실시예에 따르면, 상기 트리거 인식 모듈(121)은, 음성 명령 인식 모듈(122)을 트리거하기 위한 트리거 음성을 인식하는 기능을 수행할 수도 있다. 예를 들면, 상기 트리거 음성은 지정된 단어(예, '하이 갤럭시'와 같은 고립 단어 또는 키워드(keyword))일 수 있다. 상기 트리거 인식 모듈(121)은, 트리거 음성이 인식된 이후에 추가적으로 입력되는 음성 신호를 음성 명령 인식 모듈(122)로 전달할 수 있다.
상기 음성 명령 인식 모듈(122)은 트리거 인식 모듈(121)의 활성화 요청에 따라 활성화 될 수 있으며, 수신되는 음성 신호를 명령어로 인식할 수 있다.
상기 음성 명령 인식 모듈(122)은 음성 인식 모듈(127)과 음성 이해 모듈(128)을 포함할 수 있다. 상기 음성 인식 모듈(127)는 음성을 텍스트로 변환할 수 있다. 예를 들어, 상기 음성 인식 모듈(127)는 STT(Speech To Text) 모듈일 수 있다. 상기 음성 이해 모듈(128)는 상기 변환된 텍스트의 의미를 판단할 수 있다. 예를 들어, 상기 음성 이해 모듈(128)은 변환된 텍스트를 기반으로 고립 단어 인식, 연속어 인식 또는 자연어 인식을 수행하여 상기 수신된 음성 신호를 명령어로 인식(이해)할 수 있다. 상기 음성 이해 모듈(128)은 변환된 텍스트로부터 데이터 또는 명령어 중 적어도 하나를 추출할 수 있다.
어떤 실시예에 따르면, 상기 전자 장치(101)는 수신된 음성 신호에 대한 자연어 인식을 위하여 서버로 음성 신호를 전달하고, 이에 대한 음성 인식 수행을 요청할 수도 있다.
상기 음성 명령 인식 모듈(122)은 오디오 입력 장치(예, 마이크)를 통해 전달된 사용자의 음성 신호를 인식/이해하고, 이에 대응하는 응답(response) 명령을 생성할 수 있다.
일 실시예에 따르면, 상기 음성 명령 인식 모듈(122)은, 입력된 사용자의 음성 신호를 인식/이해하는 동작만으로 구현하거나, 음성 신호에 대응하는 응답 명령을 생성하거나 어플리케이션을 실행하는 동작을 포함하여 구현할 수 있다.
상기 영상 처리 모듈(123)은 사용자 입력에 대응하여 사용자 인터페이스(UI) 화면을 표시하도록 디스플레이를 제어할 수 있다. 상기 영상 처리 모듈(123)은, 사용자 입력에 대응하는 일반 기능 실행 화면과 특정 기능 도메인에 대한 음성 인식 실행 화면을 구분하여 제공할 수 있다. 상기 영상 처리 모듈(123)은, 음성 입력의 수신을 대기 중임을 나타내는 알림 정보, 음성 인식 중 임을 나타내는 알림 정보, 인식 결과 정보, 인식 실패 정보, 특정 기능 도메인에 대한 음성 인식이 활성화됐음을 지시하는 알림 정보 중 적어도 하나를 화면 상에 제공할 수 있다.
상기 기능 처리 모듈(124)은, 음성 명령 인식 모듈(122)에서 인식된 음성 결과를 기반으로 음성 명령에 대응되는 기능을 제어 또는 처리(실행)할 수 있다. 상기 기능 처리 모듈(124)은, 음성 명령 인식 모듈(122)에서, 수신된 음성 신호를 이용해 특정 기능 도메인으로 제한된 음성 명령(command)이 생성되면, 음성 명령(command)에 대응되는 기능을 실행할 수 있다. 예를 들어, 상기 사용자 입력에 따른 특정 기능 도메인이 통화 발신을 지시하는 통화 도메인이고, 수신된 사용자의 음성이 "홍길동" 인 경우, 상기 기능 처리 모듈(124)은, 통화 앱을 실행하여 홍길동에게 전화 통화 연결을 시도하도록 통화 앱을 제어할 수 있다.
상기 음성 출력 모듈(125)은 텍스트를 음성으로 변환하여 출력할 수 있다. 예를 들어, 상기 음성 출력 모듈(125)은 TTS(Text To Speech) 모듈일 수 있다.
도 3은 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시한 순서도이다.
상세한 설명에 앞서, 본 발명의 실시예에 따른 전자 장치의 메모리는 사용자 입력(제1사용자 입력)에 응답하여 트리거(trigger) 가능한 제1소프트웨어 프로그램을 저장할 수 있다. 상기 제1사용자 입력은 특정 프로그램 또는 기능을 실행하기 위하여 기존에 설정된 입력(예컨대 통화 아이콘의 터치 입력)을 포함할 수 있다. 상기 제1소프트웨어 프로그램은 응용(application) 프로그램 또는 선택된 음성 명령들을 수행하는 소프트웨어 프로그램들 중 적어도 하나를 포함할 수 있다.
도 3을 참조하면, 310 동작에서, 상기 전자 장치의 프로세서(120)는 센서 또는 키 입력에 기반한 사용자 입력(제2사용자 입력)을 검출한다. 상기 제2사용자 입력은 제1사용자 입력과 상이하다. 예를 들면, 상기 프로세서(120)는 전자 장치에 구비된 하드 키 또는 터치 키를 선택하는 사용자 입력을 검출하거나, 압력 센서 또는 모션 센서를 통해 특정 모션 입력(또는 제스처 입력)을 검출할 수 있다. 어떤 실시예에 따르면, 상기 전자 장치가 외부 장치(예, 웨어러블 장치)와 연결된 경우, 상기 프로세서(120)는, 외부 장치로부터 외부 장치에서 사용자 입력이 발생됐음을 알림하는 입력 정보를 수신할 수도 있다.
320동작에서, 상기 프로세서(120)는, 사용자 입력이 음성 인식 활성화 조건에 대응하는지를 판단하고, 음성 인식 활성화 조건에 대응하는 경우, 330동작으로 진행한다. 예를 들어, 상기 프로세서(120)는, 키 프레스(press) 입력이 설정된 시간 이상 동안 유지되거나, 설정된 특정 모션 입력, 외부 장치로부터 특정 입력 정보가 수신된 경우 음성 인식 활성화 조건에 대응하는 것으로 판단 할 수 있다. 음성 인식 활성화 조건은 이에 한정하지 않으며, 다양하게 설정될 수 있다.
330동작에서, 상기 프로세서(120)는, 음성 인식 활성화 조건에 대응하는 경우, 사용자 입력에 응답하여 음성 명령 인식 모듈을 활성화하고, 사용자 입력 타입에 따른 트리거 정보 (예, 특정 키가 지정된 시간 이상 입력된 정보(trigger category=Power key_long press))를 확인한다. 예컨대, 전자 장치는 음성 명령 인식 모듈을 활성화함에 따라, 오디오 입력 장치(예, 마이크)를 활성화하여 음성 입력을 대기하는 상태(또는 모드)로 전환할 수 있다.
340동작에서, 상기 프로세서(120)는, 오디오 입력 장치를 통해 입력되는 사용자의 음성 정보(예, 음성 신호/ 데이터)를 수신한다. 350 동작에서, 상기 프로세서(120)는, 트리거 정보를 기반으로 특정 기능으로의 실행/접근을 위한 특정 기능 도메인을 결정한다. 여기서, 일 실시예에 따르면, 340동작 및 350 동작이 순차적으로 동작하는 것으로 도시되어 있으나, 이에 한정하지 않고, 350 동작을 수행하고, 340 동작을 수행하거나, 동시에 수행될 수도 있다.
특정 기능 도메인은 특정 응용 프로그램, 또는 특정 기능에 대한 실행/접근이 가능하도록 설정된 정보일 수 있다. 특정 기능 도메인은 사용자 입력 타입에 따라 결정될 수 있다. 예를 들어, 상기 특정 기능 도메인은 하드 키 또는 소프트 키의 종류, 키 입력 종류(예컨대, 일정 시간 이내의 키 입력(예, 숏 터치 또는 프레스), 일정 시간 이상의 키 입력(예, 롱 터치 또는 롱 프레스), 일정 시간 이내의 다수 입력(예, 더블 터치 또는 더블 클릭)), 제스처의 종류 또는 방향 중 하나 또는 이들의 조합 별로 각각 상이하게 설정될 수 있다. 예를 들면, 전자 장치는, 전원 키에 대한 음성 인식 활성화 조건에 대응하여 통화 앱 실행을 지시하는 통화 도메인을 설정하거나, 볼륨 키에 대한 음성 인식 활성화 조건에 대응하여 음악 앱 실행을 지시하는 음악 재생 도메인을 설정할 수 있다. 또는, 전자 장치는, 전원 키를 일정 시간 이하로 누르는 전원 키의 숏 프레스 입력에 대응하여 문자 도메인, 통화 도메인 및 연락처 도메인 등 다수의 도메인을 설정하고, 전원 키의 롱 프레스 입력에 대응하여 통화 도메인을 설정할 수 있다. 또는, 전자 장치는 좌측 이동 후 상측으로 이동하는 제스처 입력에 대응하여 통화 도메인을 설정하고, 좌측 이동 후 하측으로 이동하는 제스처 입력에 대응하여 음악 재생 도메인을 설정할 수 있다. 이에 대한 상세한 설명은 후술하기로 한다.
일 실시예에 따르면, 상기 프로세서(120)는, 상기 음성 명령 인식 모듈을 활성화한 경우, 음성 인식 활성화를 나타내는 알림 정보 또는 특정 기능 도메인에 대한 음성 인식 활성화를 나타내는 알림 정보를 UI 화면에 제공할 수 있다.
360동작에서, 상기 프로세서(120)는 입력된 음성 정보에 대응하여 특정 기능 도메인으로 제한된 음성 명령(command)을 수행한다. 상세하게는, 상기 프로세서(120)는, 수신된 음성 정보에 대해 음성 인식을 수행하여 음성 정보를 텍스트로 변환하고, 변환된 텍스트 정보를 기반으로 특정 기능 도메인으로 제한된 음성 명령을 수행할 수 있다. 예를 들면, 특정 기능 도메인이 전화 연결 실행을 지시하는 도메인이고, 수신된 사용자의 음성이 "홍길동" 인 경우, 상기 프로세서(120)는, 음성 인식을 통해 사용자의 음성 "홍길동"에 대한 텍스트 정보를 인식한 후, 전화 번호부에 홍길동이 포함되어 있음을 확인하고, 통화 앱을 실행하여 홍길동에게 전화 통화 연결 동작을 수행할 수 있다. 상기 전화 통화 연결 동작을 수행한 후 상기 텍스트 정보는 삭제될 수 있다. 이는 상기 텍스트 정보 "홍길동"가 다른 프로그램에 의해 사용되는 것을 방지하기 위함이다.
한편, 음성 인식 활성화 조건을 만족하지 않는 경우 상기 프로세서(120)는, 370동작으로 진행하여 사용자 입력에 대응하는 일반 기능을 수행한다. 예를 들어, 상기 프로세서(120)는, 사용자 입력이 볼륨 키에 대한 숏 프레스(short press) 입력일 경우, 볼륨 키에 대응하여 전자 장치의 음량을 조절할 수 있다. 상기 프로세서(120)는, 화면이 꺼진 상태에서 사용자 입력이 전원 키(power key)또는 홈 키(home key)에 대한 숏 프레스(short press) 입력일 경우, 디스플레이를 구동하여 잠금 화면 또는 홈 화면을 표시할 수 있다.
도 4는 다양한 실시예에 따른 전자 장치의 프로세서의 구성을 도시한다.
도 4를 참조하면, 다양한 실시예에 따른 전자 장치는, 트리거 음성 인식을 지원하는 저전력 프로세서(426)를 추가적으로 구성할 수도 있다. 예컨대, 도면에 도시되지는 않았으나, 도 4의 실시예에 따른 전자 장치는 도 1의 전자 장치의 구성(예, 버스, 메모리, 입출력 인터페이스, 디스플레이, 통신 인터페이스 등)을 포함하며, 도 1의 구성과 동일한 버스, 메모리, 입출력 인터페이스, 디스플레이, 통신 인터페이스에 대한 구체적인 설명은 생략하기로 한다.
다양한 실시예에 따르면, 상기 프로세서(420)는 음성 명령 인식 모듈(422), 영상 처리 모듈(423), 기능 처리 모듈(424), 음성 출력 모듈(425)을 포함하고, 상기 저전력 프로세서(426)는, 트리거 인식 모듈(421)을 포함할 수 있다. 저전력 프로세서(426)는, 상기 프로세서(420)와 독립적으로, 또는 종속적으로 동작할 수 있으며, 슬립 모드 또는 동작 모드로 운용될 수 있다. 음성 명령 인식 모듈(422)은 음성 인식 모듈(427) 및 자연어 이해 모듈(428)를 포함할 수 있다.
상기 저전력 프로세서(426)는, 상기 트리거 인식 모듈(421)을 통해 사용자 입력에 대한 음성 인식 활성화 조건이 발생됐음이 검출되는 경우, 상기 프로세서(420)를 깨우고, 음성 명령 인식 모듈(422)의 활성화를 요청(예, 구동(wake-up) 신호를 전송)하고, 트리거 정보를 전달할 수 있다. 이후, 저전력 프로세서(426)는 음성 명령 인식 모듈(422)이 활성화되면, 오디오 입력 장치를 통해 수신된 음성 정보를 상기 프로세서(420)의 음성 명령 인식 모듈(422)로 전달할 수 있다. 그러면, 상기 프로세서(420)의 음성 명령 인식 모듈(422)은 전달된 사용자의 음성 신호를 인식/이해하고, 트리거 정보에 기반하여 특정 기능 도메인으로 제한하는 응답(response) 명령을 생성하고, 응답 명령에 대응되는 기능을 처리 또는 제어할 수 있다.
일 실시예에 따르면, 상기 저전력 프로세서(426)는, 오디오 입출력을 제어하는 오디오 처리 모듈(예, 오디오 코덱)일 수도 있다. 저전력 프로세서(426)가 오디오 처리 모듈인 경우, 저전력 프로세서(426)는 아날로그 신호를 디지털 신호로 변환하거나 디지털 신호를 아날로그 신호로 변환하는 기능, 오디오 입출력 전/후처리 기능을 수행할 수 있으며, 트리거 인식 모듈(421)의 기능을 수행할 수 있다.
일 실시예에 따르면, 상기 저전력 프로세서(426)는, 음성 명령 인식 모듈(422)을 트리거하기 위한 트리거 음성을 인식하는 기능을 수행할 수도 있다. 예를 들면, 트리거 음성은 지정된 단어(예, '하이 갤럭시'와 같은 고립 단어)일 수 있다. 상기 저전력 프로세서(426)는, 트리거 음성을 인식한 이후, 추가적으로 입력되는 음성 정보를 상기 프로세서(420)로 전달한다. 그러면 상기 프로세서(420)는 수신되는 음성 정보를 명령어로 인식할 수 있다. 이 경우, 음성 명령 인식 모듈(422)은 음성 인식 판단을 위한 리소스(예, 메모리, 계산량, 유사도 측정 등)를 트리거 음성을 인식하는 경우보다 상대적으로 많이 사용하며, 음성 정보를 실행 명령어로 이해하는 시스템일 수 있다.
이하에서는, 전자 장치에서 트리거 인식 모듈(421)이 상기 프로세서(420)와 분리되어 구성된 경우, 음성 인식을 통한 기능 실행 동작에 대해 설명하기로 한다. 그러나 본 발명의 다양한 실시예에서 음성 인식을 통한 기능 실행 동작은 이에 한정하지 않는다. 예를 들어, 도2와 같이 트리거 인식 모듈이 프로세서 내부에 존재하는 구성에서도 가능하다.
본 발명의 다양한 실시 예에 따른 전자 장치는 제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징, 외부로부터 소리를 수신하도록 배치된 마이크, 상기 하우징에 배치된 적어도 하나의 입력 장치, 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이, 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서, 및 상기 프로세서와 전기적으로 연결된 메모리를 포함하고, 상기 메모리는, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하고, 상기 메모리는, 실행시에, 상기 프로세서가, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하고, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장할 수 있다.
다양한 실시 예에 따르면, 상기 제 1 소프트웨어 프로그램은 응용(application) 프로그램 또는 선택된 음성 명령들을 수행하는 소프트웨어 프로그램들 중 적어도 하나를 포함할 수 있다.
다양한 실시 예에 따르면, 상기 메모리는, 제 3 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 2 소프트웨어 프로그램을 저장하고, 상기 인스트럭션들은, 실행시에, 상기 프로세서가, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 내지 3사용자 입력들과 상이한 제 4사용자 입력을 수신하고, 상기 제 4 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 외부로부터 상기 마이크를 통하여 음성을 수신하고, 상기 제 3 사용자 입력의 수신 없이, 상기 수신된 음성을 적어도 일부 이용하여, 상기 제 2 소프트웨어 프로그램을 실행할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 수신된 음성을 텍스트로 변환하고, 상기 변환된 텍스트를 이용하여, 상기 제 1 소프트웨어 프로그램과 연관된 데이터 또는 명령어 중 적어도 하나를 추출하고, 상기 추출된 데이터 또는 명령어 중 적어도 하나에 기초하여 선택된 기능을 실행할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 선택된 기능의 실행 후에, 상기 변환된 텍스트를 상기 제 1 소프트웨어 프로그램 외의 다른 소프트웨어 프로그램을 위하여 사용하지 않도록 할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환한 후, 상기 디스플레이 상에 상기 제 1 소프트웨어 프로그램을 나타내는 인디케이션(indication)을 표시할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 제 2 사용자 입력이 계속 유지되는 상태 중에만, 상기 마이크를 통하여 음성을 수신하고, 상기 제 2 사용자 입력이 종료되면, 상기 마이크를 통한 음성의 수신을 중단하도록 할 수 있다.
다양한 실시 예에 따르면, 상기 입력 장치는 상기 하우징에 배치된 버튼을 포함하며, 상기 제 2 사용자 입력은 상기 버튼을 누르는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 수신된 음성을 텍스트로 변환하고, 상기 음성의 수신이 종료된 후, 상기 텍스트를 상기 디스플레이에 표시하도록 할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 수신된 음성을 텍스트로 변환하고, 상기 음성의 수신 중에 또는 수신이 종료된 후, 상기 제 1 소프트웨어 프로그램의 유저 인터페이스를 상기 디스플레이 상에 표시하고, 상기 변환된 텍스트 중 적어도 일부를 상기 유저 인터페이스의 일부에 표시하도록 할 수 있다.
다양한 실시 예에 따르면, 상기 제1소프트웨어 프로그램은, 전화 어플리케이션 프로그램을 포함하고, 상기 인스트럭션들은, 상기 프로세서가, 상기 전화 어플리케이션을 나타내는 아이콘을 상기 디스플레이 상에 표시하도록 하고, 상기 제 1 사용자 입력은 상기 아이콘을 터치하는 입력을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 입력 장치는, 물리적 버튼 또는 터치 키를 포함하고, 상기 제 2 사용자 입력은 상기 물리적 버튼 또는 터치 키를 누르거나 터치하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 인스트럭션들은, 상기 프로세서가, 상기 디스플레이가 턴오프 상태에서 턴온 상태로 전환된 후, 잠금 화면을 상기 디스플레이 상에 표시하고, 상기 잠금 화면이 표시된 상태에서 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 음성을 수신할 수 있는 상태로 전환하도록 할 수 있다.
다양한 실시 예에 따르면, 상기 잠금 화면은, 상기 전화 어플리케이션을 나타내는 아이콘을 포함하고, 상기 제 1 사용자 입력은, 상기 아이콘을 적어도 제 1 시간 동안 터치하는 동작을 포함하고, 상기 제 2 사용자 입력은, 상기 아이콘을 상기 제 1 시간 보다 긴 제 2 시간 동안 터치 또는 누르는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서는, 상기 전자 장치의 동작 상태 및 상기 제2사용자 입력의 타입 중 적어도 하나를 기반으로 선택된 기능의 실행으로 수신된 음성을 처리할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서는, 상기 수신된 음성에 대해, 복수의 기능에 대해 음성 명령을 처리할 수 있는 경우, 상기 디스플레이에 상기 복수의 기능에 대한 알림 정보를 표시하고, 상기 알림 정보로부터 사용자에 의해 선택된 기능으로 제한하여 음성 명령을 처리할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서는, 상기 제 2 사용자 입력에 대응하여, 상기 전자 장치가 잠금이 설정된 상태인지를 판단하고, 상기 잠금이 설정된 상태인 경우, 접근이 허여된 기능만을 실행하며, 상기 접근 허여된 기능이 종료되면 상기 잠금 상태로 복귀할 수 있다.
다양한 실시 예에 따르면, 상기 제2 사용자 입력은, 하드 키 또는 소프트 키 입력, 제스처 입력, 외부 장치로부터 수신된 입력 중 적어도 하나를 포함할 수 있다.
본 발명의 다양한 실시 예에 따른 전자 장치는 하우징, 외부로부터 소리를 수신하도록 배치된 마이크, 상기 하우징의 외부 면에 배치된 적어도 하나의 유저 인터페이스, 상기 마이크 및 상기 유저 인터페이스와 전기적으로 연결된 프로세서, 및 상기 프로세서와 전기적으로 연결되며, 제 1 사용자 입력에 응답하여 트리거(trigger) 가능한, 제1소프트웨어 프로그램을 저장하는 메모리를 포함하고, 상기 메모리는, 실행시에, 상기 프로세서가, 상기 적어도 하나의 유저 인터페이스를 통하여, 상기 제 1 사용자 입력과 상이한 제 2 사용자 입력을 수신하고, 상기 제2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제1소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장할 수 있다.
도5는 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시한 흐름도이다.
도 5를 참조하면, 510동작에서, 저전력 프로세서(426)는, 키 입력 또는 센서 입력에 기반한 사용자 입력을 검출하고, 520동작에서 사용자 입력에 의해 음성 인식 활성화 조건이 발생됐는지를 확인한다. 530동작에서, 저전력 프로세서(426)는 사용자 입력에 의한 음성 인식 활성화 조건이 발생된 경우, 트리거 인식 모듈(421)을 활성화한다. 이 경우, 전자 장치는 오디오 입력 장치를 활성화하여 음성 입력을 대기하는 모드로 전환할 수 있다.
540 동작에서, 상기 저전력 프로세서(426)는 음성 정보를 수신하고, 550 동작에서, 상기 트리거 음성 인식을 수행하여 지정된 트리거 음성이 검출되는지를 판단한다.
한편, 일 실시예에 따르면, 전자 장치에서 트리거 음성 인식과 음성 명령 인식 기능을 구분하지 않은 경우, 530 내지 550 동작은 생략할 수 있다. 예를 들어, 상기 530 내지 550 동작은 상기 510 동작에서 검출된 센서 또는 키 입력의 종류에 따라 생략될 수 있다. 예를 들어, 상기 510 동작에서 검출된 센서 또는 키 입력이 일정 시간 이내(숏 프레스)인 경우 상기 저전력 프로세서(426)는 상기 520 내지 550 동작을 수행할 수 있다. 반면에, 상기 510 동작에서 검출된 센서 또는 키 입력이 일정 시간 이상(롱 프레스)인 경우 상기 저전력 프로세서(426)는 520 동작 이후 560 동작을 수행할 수 있다.
560 동작에서, 상기 저전력 프로세서(426)는 상기 프로세서(420)를 깨우고, 상기 프로세서(420)로 음성 명령 인식 모듈(422)의 활성화 요청 및 트리거 정보를 전달한다. 570 동작에서 상기 프로세서(420)는 음성 명령 인식 모듈(422)을 활성화한다. 이 경우, 저전력 프로세서(426)는 545 동작에서 마이크로부터 음성 정보를 수신하고, 580동작에서 상기 수신된 음성 정보를 프로세서(420)로 전달할 수 있다.
다양한 실시예에 따르면, 상기 저전력 프로세서(426)는 키에 대한 프레스 입력이 유지되는 동안 음성 입력을 대기하고, 키 입력이 릴리즈된 경우, 음성 입력을 중단할 수 있다. 예를 들면, 상기 저전력 프로세서(426)는 파워 키에 대해 프레스 입력이 유지되는 동안 음성 정보를 수신하고, 파워 키에 대한 프레스 입력이 릴리즈(releasing)될 때까지 실시간으로 음성 정보를 상기 프로세서(420)로 전달하건, 릴리즈되는 시점에 상기 수신된 음성 정보를 상기 프로세서(420)로 전달할 수도 있다.
585동작에서, 상기 프로세서(420)는 사용자 입력에 의한 트리거 정보를 기반으로 특정 기능 도메인을 결정하고, 590동작에서, 상기 프로세서(420)는 특정 기능 도메인으로 제한하여 설정된 기능으로 음성 정보에 대응하는 음성 명령(command)을 처리한다. 어떤 실시 예에 따르면, 상기 585 동작은 상기 570동작 이전, 이후 또는 동시에 수행될 수 있다.
이하에서는 도 1의 전자 장치를 기준으로 설명하기로 한다. 하지만, 이하의 설명이 도 4의 전자 장치에도 동일(또는 유사)하게 적용될 수 있다.
도6은 다양한 실시예에 따른 전자 장치의 화면 제어 방법을 도시한 순서도이고, 도 7은 다양한 실시예에 따른 화면 제어 방법을 설명하기 위한 예시도이다.
도 6을 참조하면, 다양한 실시예에 따른 전자 장치는 사용자 입력에 대응하여 일반 기능 실행 화면과 특정 기능 도메인에 대한 음성 인식 실행 화면을 구분하여 제공할 수 있다.
610동작에서, 상기 전자 장치는 특정 키(예, 전원 키, 홈 키, 볼륨 키 및 소프트 키 중 어느 하나) 입력 또는 특정 모션에 기반한 사용자 입력을 검출한다. 620동작에서, 상기 전자 장치는 사용자 입력(예컨대 숏 터치 또는 숏 프레스)에 대응하여 프로세서를 활성하고, 630동작에서, 상기 전자 장치는, 프로세서 활성화에 응답하여 제1 사용자 인터페이스 (UI; User Interface)화면을 표시한다. 예컨대, 제1 UI화면은 전자 장치의 잠금 설정 여부에 따라 잠금 화면, 홈 화면 또는 대기 화면일 수 있다.
640동작에서, 전자 장치는 제1 UI화면이 표시된 상태에서 사용자의 입력에 대해 음성 인식 활성화 조건이 발생하는지를 판단할 수 있다. 전자 장치는 음성 인식 활성화 조건이 발생되는 경우, 650동작에서, 특정 기능 도메인에 대한 음성 인식 기능을 알림하는 제2 UI화면을 표시한다.
일 예를 들어, 701 에 도시된 바와 같이, 사용자는 화면이 꺼진 전자 장치에서 파워 키(720)에 대해 숏 프레스(short press) 입력을 수행할 수 있다. 전자 장치는, 파워 키(720)에 대해 숏 프레스(short press) 입력에 대응하여 디스플레이를 구동하여 제1UI 화면(710) 예컨대, 대기 화면을 표시할 수 있다. 제1UI 화면(710)은 통화 아이콘(711) 및 카메라 아이콘(712)을 포함할 수 있다. 사용자가 특정 도메인에 대한 음성 인식을 수행하기 위해, 전자 장치의 파워 키(720)에 대해 롱 프레스(long press) 입력을 수행할 수 있다. 그러면, 전자 장치는, 파워 키(720)에 대한 음성 인식 활성화 조건이 발생됐음을 인식하고, 음성 명령 인식 모듈을 활성화할 수 있다. 전자 장치는 702에 도시된 바와 같이, 제1UI 화면(710)을 음성 인식기능을 알림하는 제2 UI화면으로 전환할 수 있다. 제2 UI화면은 음성 인식 기능의 활성화 상태를 알림하는 정보(730) 또는, 특정 기능 도메인에 기반한 음성 인식 기능이 실행 중임을 알림하는 정보(731)를 표시할 수 있다.
예를 들어, 전자 장치는, 파워 키(720)에 대한 음성 인식 활성화 조건에 대응하여 통화 앱 실행을 지시하는 특정 기능 도메인이 설정된 경우, 통화 앱에 기반한 음성 인식 활성화를 나타내는 정보(730)를 포함할 수 있다.
이 후, 통화 앱에 기반한 음성 인식 기능이 활성화된 상태에서, 마이크를 통해 사용자의 음성 정보가 입력되는 경우, 전자 장치는 사용자의 음성에 대해 음성 인식이 수행 중 임을 나타내는 정보(731)을 표시할 수 있다.
일 실시에에 따르면, 전자 장치는, 음성 명령 인식 모듈이 활성화되는 경우, 음성 입력을 대기하기 위한 대기 모드로 전환됐음을 사용자에게 알림하기 위한 시각, 청각 또는 촉각 피드백 중 적어도 하나(예컨대 사운드, 진동, 그래픽 효과 등)을 출력하고, 사용자가 음성을 입력한 후, 파워 키에 대해 릴리즈한 경우, 음성 입력이 종료 됐음을 알림하기 위한 시각, 청각 또는 촉각 피드백 중 적어도 하나를 출력할 수 있다.
도 8a 내지 8d는, 다양한 실시예에 따른 음성 인식을 트리거링 하는 다양한 사용자 입력 방법들을 도시한다.
도 8a 내지 8d를 참조하면, 전자 장치는 다양한 사용자 입력에 응답하여 음성 명령 인식 모듈을 활성화하고 특정 기능 도메인에 제한하여 음성 명령을 처리하도록 지원할 수 있다.
일 실시예에 따르면, 도 8a 의 실시예와 같이, 전자 장치는 전자 장치 외부에 노출된 물리적 키에 대응하여 음성 명령 인식 모듈을 활성화하고, 특정기능 도메인에 기반한 음성 명령을 처리하도록 지원할 수 있다. 이 경우, 전자 장치는 물리적 키 종류 별로 특정 기능 도메인을 상이하게 매핑할 수 있다. 예를 들어 801화면에서와 같이, 파워 키에 롱 프레스 입력이 검출된 경우, 전자 장치는 파워 키에 맵핑된 통화 연결 도메인에 기반한 음성 인식 모드로 대기한다. 이 경우, 전자 장치는, 대기 화면(810)에 통화 연결 도메인에 대한 음성 인식 모드로 운용 중 임을 내는 정보(811)를 표시할 수 있다. 이 후, 사용자가 특정 인물(예, "Norah Jones")과 관련된 음성 정보를 입력한 경우, 전자 장치는 특정 인물에 대한 사용자 음성을 인식하여, 인식된 특정 인물의 전자 장치로 통화 연결하도록 음성 명령을 처리할 수 있다.
다른 예를 들면, 802화면에서와 같이, 볼륨 키에 롱 프레스 입력이 검출된 경우, 전자 장치는 볼륨 키에 맵핑된 음악 재생 도메인에 기반한 음성 인식 모드로 대기한다. 전자 장치는 대기 화면(820)에 음악 재생 도메인에 대한 음성 인식 모드로 운용 중 임을 내는 정보(821)를 표시할 수 있다. 이후, 사용자가 특정 인물(예, "Norah Jones")에 대해 음성 정보를 입력한 경우, 전자 장치는 특정 인물에 대한 사용자 음성을 인식하여 인식된 특정 인물과 관련된 음악을 선택하여 재생하도록 음성 명령을 처리할 수 있다.
다른 실시예에 따르면, 도 8b의 실시예와 같이, 전자 장치는 물리적 하드 키 이외에 소프트 키 입력에 기반하여 음성 명령 인식 모듈을 활성화하고, 특정기능 실행 도메인에 기반한 음성 명령을 실행하도록 지원할 수 있다. 예컨대, 화면이 꺼진 상태에서 사용자는 파워 키에 대한 숏 프레스(short press) 입력(예, 설정된 시간(예컨대 1초) 이내에서 프레스 입력)을 수행한 경우, 전자 장치는 803 과 같은 대기 화면을 표시할 수 있다. 대기 화면은 특정 기능 실행 아이콘 예를 들어, 통화 아이콘(830) 및 카메라 아이콘(832)을 표시할 수 있다.
다양한 실시예에 따라, 전자 장치는, 대기 화면에 표시된 통화 아이콘(830)에 대한 롱 프레스 입력(831)에 응답하여 음성 명령 인식 모듈을 활성화하여 통화 아이콘(830)에 맵핑된 통화 연결 도메인에 기반한 음성 인식 모드로 전환할 수 있다. 이후, 전자 장치는 마이크를 통해 수신된 사용자 음성(예, "Norah Jones"라는 음성 정보)을 인식하고, 통화 아이콘에 대한 트리거 정보 (예, trigger_category = CALL_ICON_LONG_PRESSED)를 확인하여 연락처 리스트에서 "Norah Jones"에 관련된 정보를 검색하고, "Norah Jones"이 검색된 경우, "Norah Jones"에게 통화 연결을 실행할 수 있다.
다양한 실시예에 따르면, 전자 장치는 803과 같은 대기 화면에서 카메라 아이콘(832)에 대한 롱 프레스 입력을 검출한 경우, 카메라 아이콘(832)에 맵핑된 카메라 기능 도메인에 기반한 음성 인식 모드로 전환할 수 있다. 이 후, 전자 장치는 마이크를 통해 수신된 사용자 음성을 기반으로 카메라 기능 관련 음성 명령을 처리할 수 있다. 예를 들면, 카메라 아이콘(832)을 롱 프레스 한 후, 음성 입력 대기 상태에서 '흑백모드'라는 음성을 입력하는 경우, 전자 장치는 카메라 아이콘(832)에 설정된 특정 기능 도메인으로 따라 카메라 앱을 실행하고, 흑백 모드의 촬영 기능을 실행할 수 있다. 또는, 사용자가 카메라 아이콘(832)을 롱 프레스 하고, '영상촬영'이라는 음성을 입력한 경우, 전자 장치는 카메라 앱을 실행하고 동영상 촬영 모드로 변경하여 동영상 녹화를 실행할 수 있다
다른 실시예에 따르면, 전자 장치에서 부재중 전화 알림 메시지가 존재하는 경우, 전자 장치는 사용자의 입력에 기반하여 부재중 전화 알림 메시지와 관련된 특정 기능 도메인에 기반하여 음성 명령을 대기할 수 있다. 예를 들어, 804에 도시된 바와 같이, 전자 장치는 부재중 전화 메시지가 발생된 경우, 대기 화면에 통화 아이콘(830)에 부재 중 전화 메시지 아이콘(840)을 표시할 수 있다. 사용자가 부재 중 알림 메시지 아이콘(840) 또는 통화 아이콘(830)을 롱 프레스 한 후, '통화'라는 음성 정보를 입력하는 경우, 전자 장치는 부재 중 전화 메시지와 관련된 상대방 장치로 통화 연결을 실행할 수 있다.
다른 실시예에 따르면, 전자 장치에서 미확인 메시지가 존재하는 경우, 전자 장치는 사용자의 입력에 기반하여 미확인 메시지 기능에 대한 특정 도메인에 기반하여 음성 명령을 대기할 수 있다. 예를 들어, 805에 도시된 바와 같이, 전자 장치는 미확인 메시지가 발생된 경우, 대기 화면에 미확인 메시지 아이콘(850)을 표시할 수 있다. 사용자가 미확인 메시지 아이콘(850)에 롱 프레스 한 후, 음성 정보를 입력한 경우, 전자 장치는 미확인 메시지의 상대방에게 문자 메시지를 전송하기 위한 특정 도메인으로 제한하며, 사용자로부터 전달된 음성 정보를 텍스트로 변화하고, 변환된 텍스트를 메시지에 포함하여 상대방에게 문자 메시지를 전송할 수 있다.
다양한 실시예에 따르면, 도 8c의 실시예와 같이, 전자 장치는 특정 제스처에 기반하여 음성 명령 인식 모듈을 활성화하여 특정 기능 도메인에 기반한 음성 명령을 실행하도록 지원할 수 있다. 예를 들어, 806에 도시된 바와 같이, 사용자는 전자 장치의 우측 끝에서 좌측으로 이동하는 left swipe 모션을 수행할 수 있다. 상기 left swipe 모션이 감지되는 경우 전자 장치는 음성 인식 기능을 트리거링할 수 있다. 이 후, 사용자는 음성 정보를 입력할 수 있다. 전자 장치는 left swipe 모션에 대응하여 특정 도메인에 한정하지 않고 입력되는 음성 정보에 따른 음성 명령을 처리할 수 있으나, 이에 한정하는 것은 아니다.
다른 예를 들어, 사용자는 807에 도시된 바와 같이, left swipe 모션 후 하측 방향으로 모션(Left-down swipe 모션)을 수행하거나, 808에 도시된 바와 같이, 상측 방향으로 모션(left-up swipe 모션)을 수행할 수 있다. 이 경우, 전자 장치는 Left swipe모션에 의해 음성 인식 활성화 조건이 발생됐음을 검출하고, 상측 방향 또는 하측 방향 모션에 의해 특정 도메인을 결정할 수 있다. 예를 들어, 전자 장치는 Left-down swipe모션 감지 시 통화 도메인으로 제한하여 수신된 음성에 대해 음성 명령을 처리하거나, left-up swipe 모션 감지 시 메시지 전송 도메인으로 제한하여 수신된 음성에 대해 음성 명령을 처리할 수 있다. 예를 들면, 사용자가 left-down swipe 모션 수행 후 "홍길동"이라는 음성을 입력한 경우, 전자 장치는 "홍길동"이라는 음성 입력에 대응하여 홍길동의 전자 장치로 통화 연결을 실행하도록 음성 명령을 처리할 수 있다.
다양한 실시예에 따르면, 도 8d 의 실시예와 같이, 전자 장치는 외부 장치로부터 전달된 입력 신호에 기반하여 음성 명령 인식 모듈을 활성화하고 외부 장치 관련 기능 도메인으로 제한한 음성 명령을 실행하도록 지원할 수 있다. 예를 들어, 도 8d 에 도시된 바와 같이, 전자 장치(890)는 외부 장치(891)(예, 스마트 워치)와 근거리 통신으로 연결될 수 있다. 사용자는 전자 장치(890)와 외부장치(891)가 연결된 상태에서 외부 장치에 구비된 키(892)에 대해 롱 프레스할 수 있다. 그러면, 외부 장치(891)는 전자 장치(890)로 외부 장치의 키 입력에 대해 롱 프레스가 발생됐음을 알림하는 입력 정보 또는 트리거 정보를 전자 장치(890)로 전달할 수 있다. 전자 장치(890)는 외부 장치에 기반한 음성 인식 활성화 조건이 발생된 경우, 음성 명령 인식 모듈을 활성화하고 외부 장치와 관련된 기능 도메인(예컨대 스마트 워치 관련 기능)으로 제한하여 수신된 음성에 대해 음성 명령을 처리할 수 있다.
도 9는 다양한 실시예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법을 도시한 순서도이다.
도9를 참조 하면, 910동작에서, 전자 장치의 프로세서 120는 센서 또는 키 입력에 기반한 사용자 입력을 검출한다. 920동작에서 상기 프로세서(120)는, 사용자 입력에 의해 음성 인식 활성화 조건 발생하는지를 판단하고, 음성 인식 활성화 조건이 발생되지 않는 경우, 990동작으로 진행하여 사용자 입력에 대응하는 일반 기능을 수행한다.
930동작에서, 상기 프로세서(120)는, 음성 인식 활성화 조건이 발생되는 경우, 음성 명령 인식 모듈을 활성화한다. 940동작에서, 프로세서(120)는, 오디오 입력 장치를 통해 입력되는 사용자의 음성 정보(예, 음성 신호/ 데이터)를 수신한다. 950동작에서, 상기 프로세서(120)는, 사용자 입력의 타입 및 단말의 동작 상태 중 적어도 하나를 확인한다. 예컨대, 프로세서(120)는, 하드 키 또는 소프트 키의 종류, 키 입력 종류(숏 터치 또는 프레스, 롱 터치 또는 롱 프레스, 더블 터치 또는 더블 클릭) 및 제스처의 종류 또는 방향 등의 사용자 입력 타입, 및 외부 장치 연결 여부, 전자 장치의 현재 위치 정보 등의 동작 상태 중 적어도 하나를 확인할 수 있다.
960동작에서, 상기 프로세서(120)는 확인된 정보를 기반으로 특정 기능 도메인을 확인하고, 970 동작에서, 특정 기능 도메인 내에서 실행 가능한 응답 명령을 결정한다 980동작에서, 상기 프로세서(120)는 특정 도메인 내에서 선택된 응답 명령으로 처리하도록 음성 명령(command)을 처리한다.
예컨대 전자 장치는, 특정 기능 도메인에 제한하여 음성 명령을 처리할 경우, 입력된 음성 정보를 이용하여 복수의 기능에 대한 음성 명령이 생성될 수 있다. 예를 들면, '홍길동'이라는 음성 정보가 입력된 경우, 통화 연결 도메인에 제한적으로 음성 명령을 처리하기 위해, 전자 장치는 연락처 리스트에서 명령 수행의 대상을 검색할 수 있다. 이 경우, 연락처 리스트에서 에 "홍길동씨", "홍길동 부장", "홍길동 사장"이 존재 할 경우, 각각 '홍길동' 음성에 응답하여 명령 수행의 대상이 될 수 있다. 전자 장치는 복수의 기능에 대해 음성 명령이 생성된 경우, 각각의 명령 수행 정보를 사용자에게 제공하고, 사용자 선택에 따라 응답 기능을 결정할 수 있다.
다른 예를 들면, 전자 장치는 '홍길동' 음성에 복수의 음성 명령이 생성된 경우, 통화목록(call log) 정보나 관계정보(예, relation_category = {FAMILY, FRIEND, WORK, …}) 에 기반하여 우선 순위의 응답 기능을 선택할 수 있다.
다른 실시예에 따른 전자 장치는 전자 장치의 위치 정보에 따라 다른 특정 기능 도메인에 제한하여 음성 명령을 처리할 수 있다. 예를 들면, 사용자 전자 장치의 불륨 키에 대해 롱 프레스한 경우, 전자 장치의 현재 위치 정보와, 지정된 위치 정보를 비교하여, 현재 사용자의 위치가 회사 장소(site)인지 집 장소 인지를 판단할 수 있다. 전자 장치는, 집 장소 에서 불륨 키에 대한 롱 프레스가 입력된 경우, 음악 실행 기능 도메인으로 제한하여 이후 입력되는 음성 입력에 대해 음성 명령을 처리할 수 있다. 예컨대, 사용자가 집 장소에서 볼륨 키를 롱 프레스 한 후, '홍길동'음성을 입력한 경우, 전자 장치는 음악 재생 앱을 실행하고, 홍길동 관련된 음악을 선택하여 재생하도록 음성 명령을 처리할 수 있다. 반면에, 사용자가 회사 장소 내에서 볼륨 키의 롱 프레스 입력 후, '홍길동'음성을 입력한 경우 전자 장치는, 회사와 관련된 앱 예를 들면, 스케쥴 앱을 실행하고, 홍길동과 관련된 스케쥴 정보를 화면에 표시하도록 음성 명령을 처리할 수 있다.
다른 실시예에 따르면, 전자 장치는 통화 아이콘에 대한 입력 조건에 따라, 통화 연결 시도로 제한하거나, 연락처 정보를 표시하는 실행 명령이 설정될 수 있다. 예를 들어, 사용자가 통화 아이콘에 대해 롱프레스 입력한 후,' 홍길동' 음성을 입력하는 경우, 전자 장치는, 통화 연결 도메인으로 제한하여 홍길동의 전화장치로 통화 연결을 시도하도록 음성 명령을 처리할 수 있다. 반면에, 사용자가 통화 아이콘에 대해 두번 탭 입력한 후, ' 홍길동' 음성을 입력하는 경우 전자 장치는 연락처 기능 도메인으로 제한하여 '홍길동' 과 관련된 연락처 정보를 제공하도록 음성 명령을 실행할 수 있다.
도 10은 다양한 실시예에 따른 키 입력 시간에 따른 도메인 결정 방법을 도시한 순서도이고, 도 11은 다양한 실시예에 따른 키 입력 시간에 따른 도메인 결정 방법을 설명하기 위한 화면 예시도이다.
도 10을 참조하면, 다양한 실시예에 따른 전자 장치는, 롱 프레스 입력 시간에 따라 상이한 기능 도메인으로 제한하여 음성 명령을 처리할 수 있다. 전자 장치의 프로세서(120)는, 1010 동작에서, 키(예, 전원 키, 홈 키, 볼륨 키 및 소프트 키 등)를 프레스하는 사용자 입력을 검출한다. 1020동작에서, 상기 프로세서(120)는 프레스 입력에 응답하여 음성 명령 인식 모듈을 활성화한다. 1030동작에서, 상기 프로세서(120)는 프레스 입력 시간이 지정된 임계시간 이상 유지되는지를 판단하고, 1040동작에서 프레스 입력이 임계 시간 이내이면, 이후 입력되는 음성 정보에 대해 제1 기능 도메인으로 제한하여 음성 명령을 처리한다. 1050 동작에서, 상기 프로세서(120)는 프레스 입력이 임계 시간 이상인 경우, 이후 입력되는 음성 정보에 대해 제2 기능 도메인으로 제한하여 음성 명령을 처리한다.
예를 들면, 전자 장치는 전원 키의 프레스 입력이 임계 시간 보다 길게 유지된 경우, 트리거 정보(trigger_category = POWER_KEY_LONG_PRESSED)를 확인하고, 1101화면에 도시된 바와 같이, '홍길동'이라는 음성이 입력된 경우, 통화 연결 기능에 제한하여 음성 명령을 처리할 수 있다. 전자 장치는 통화 연결 기능이 트리거링 되었음을 알리는 정보(1111)를 대기 화면(1110)의 일측에 표시할 수 있다.
전자 장치는 전원 키의 프레스 입력이 임계 시간 보다 짧게 유지된 경우, 트리거 정보(trigger_category = POWER_KEY_SHORT_PRESSED)를 확인하고, 특정 기능 도메인에 제한하지 않고 음성 명령을 처리할 수 있다. 예를 들면, 1102에 도시된 바와 같이, 전자 장치는 전원 키 프레스 입력이 임계 시간 보다 짧게 유지된 경우, 대기 화면(1120)에 통화 도메인 정보(1121), 메시지 도메인 정보(1122), 연락처 도메인 정보(1123)를 표시할 수 있다. 전자 장치는 다수의 도메인 정보(1121, 1122, 1123)에 대한 사용자 선택에 따라 이후 입력되는 음성 정보(예, 홍길동) 기반하여 메시지를 전달하거나, 통화 연결을 실행하거나, 연락처 정보를 제공할 수 있다.
본 발명의 다양한 실시 예에 따른 전자 장치의 음성 인식을 이용한 기능 실행 방법은 사용자 입력을 수신하는 동작, 상기 수신된 사용자 입력이 음성 인식 활성화 조건을 만족하는 경우, 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작, 상기 마이크를 통해 외부로부터 음성 정보를 수신하는 동작, 상기 사용자 입력을 기반으로 특정 기능 실행 도메인을 확인하는 동작 및 상기 확인된 기능 실행 도메인으로 제한하여 상기 수신된 음성 정보를 이용해 음성 명령을 처리하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 사용자 입력이 음성 인식 활성화 조건을 만족하지 않은 경우, 상기 사용자 입력에 대응하는 일반 기능을 실행하는 동작을 더 포함할 수 있다.
다양한 실시 예에 따르면, 상기 특정 기능 실행 도메인을 확인하는 동작은 상기 사용자 입력의 음성 인식 활성화 조건을 나타내는 트리거 정보를 확인하고, 상기 트리거 정보에 대응하여 설정된 특정 응용 프로그램의 실행 명령을 확인할 수 있다.
다양한 실시 예에 따르면, 상기 사용자 입력은, 물리적 하드 키 선택 입력, 소프트 아이콘 선택 입력, 전자 장치의 모션 제스처 입력, 외부 장치로부터 수신된 입력 중 적어도 하나일 수 있다.
다양한 실시 예에 따르면, 상기 음성 명령을 처리하는 동작은, 상기 전자 장치의 동작 상태 및 사용자 입력의 타입 중 적어도 하나를 판단하는 동작을 더 포함하고,
상기 판단 결과를 기반으로 특정 기능을 선택하고, 수신된 음성에 대해 상기 선택된 특징 기능의 실행으로 음성 명령을 처리할 수 있다.
다양한 실시 예에 따르면, 상기 마이크를 통해 외부로부터 음성 정보를 수신하는 동작은, 상기 사용자 입력이 유지되는 동안 음성을 수신하고, 상기 사용자 입력 해제 시 수신된 음성 정보에 대해 음성 인식을 수행할 수 있다.
다양한 실시 예에 따르면, 상기 음성 명령을 처리하는 동작은, 상기 전자 장치가 잠금 상태인지를 판단하는 동작; 및 상기 전자 장치가 잠금 상태인 경우, 상기 트리거 정보에 대응하여 접근이 허여된 특정 응용 프로그램만을 실행하고, 상기 특정 응용 프로그램이 종료되면 상기 잠금 상태로 복귀하는 동작을 더 포함할 수 있다.
본 발명의 다양한 실시예에 따른 전자장치의 음성 인식을 이용한 기능 실행 방법은 제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징, 외부로부터 소리를 수신하도록 배치된 마이크, 상기 하우징에 배치된 적어도 하나의 입력 장치, 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이, 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서, 및 상기 프로세서와 전기적으로 연결되고, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하는 메모리를 포함하는 전자 장치에 의하여, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하는 동작, 상기 전자 장치에 의하여, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작, 상기 전자 장치에 의하여, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하는 동작, 상기 전자 장치에 의하여, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하는 동작을 포함할 수 있다.
도 12는 다양한 실시예에 따른 아이콘을 이용하여 음성 인식을 트리거링하는 방법을 설명하기 위한 화면예시도이다.
도 12를 참조하면, 전자 장치는 1201에 도시된 바와 같이, 대기 화면(1210)을 표시할 수 있다. 일 실시예에 따른 대기 화면(1210)은 통화 아이콘(1211) 및 카메라 아이콘(1212)을 포함할 수 있으며, 부재중 전화 메시지 또는 미확인 메시지가 발생된 경우, 부재중 전화 메시지 또는 미확인 메시지에 대한 알림 아이콘을 표시할 수도 있다.
사용자는 전자 장치의 파워 키 또는 대기 화면에 표시된 통화 아이콘에 대해 롱 프레스 입력(1220)할 수 있다. 그러면, 파워 키 또는 통화 아이콘에 설정된 특정 기능 도메인,예컨대 통화 연결 도메인에 기반한 음성 명령을 처리하도록 대기할 수 있다. 전자 장치는 1202에 도시된 바와 같이, 대기 화면에 표시된 통화 아이콘(1211)에 대한 영역을 확장하여 음성 인식 기능이 활성화됐음을 사용자에게 제공할 수 있다.
사용자는 통화 아이콘(1211)에 대한 영역이 확장되어 표시된 상태에서 음성 예를 들어, "john smith"을 입력할 수 있다. 전자 장치는 사용자가 음성을 입력하고 있음을 알림하는 신호 지시자(1230)를 표시하도록 제어할 수 있다. 그러면, 전자 장치는, 음성 "john smith"를 인식하고, 음성 인식된 "john smith"를 텍스트로 변환하고 이를 대기 화면에 표시할 수도 있다. 다음에, 전자 장치는, 연락처 리스트 내에서 "john smith"에 대해 검색된 경우, "john smith"에 전화 연결을 시도하여 음성 명령을 처리 할 수 있다. 이 경우, 전자 장치는 1203에 도시된 바와 같이, 특정 도메인(예, 통화 도메인)에서 음성 명령을 처리 중임을 나타내는 텍스트 정보(1240)를 화면에 표시할 수 있다.
도 13은 다양한 실시예에 따른 음성 인식 실패를 통지하는 화면예시도이다.
도 13을 참조하면, 전자 장치는 음성 인식 모듈의 활성화 동작에 따른 정보를 사용자에게 제공하도록 지원할 수 있다. 전자 장치는 1301에 도시된 바와 같이, 마이크로부터 음성 신호가 입력중인 경우, 음성 신호가 입력 중임을 나타내는 정보(1310)를 제공할 수 있다. 전자 장치는, 1302에 도시된 바와 같이, 입력된 음성 신호에 대해 음성 인식이 수행 중인 상태를 나타내는 정보(1320)를 제공할 수 있다. 전자 장치는, 네트워크 문제 또는 인식이 불가한 음성 입력 등으로 인하여 음성 인식이 실패한 경우, 1303 에 도시된 바와 같이. 인식 실패 됐음을 사용자에게 제공하기 위해, 확장 영역(1340)을 포함한 통화 아이콘의 색상을 변경하거나, 또는 확장 영역에 상기 인식 실패에 관련된 메시지(1345; error)를 표시할 수 있다. 에러 메시지 표시 후 전자 장치는 1304에 도시된 바와 같이, 통화 아이콘에 대한 확장영역을 축소하고, 색상이 변경된 통화 아이콘(1350)만을 표시할 수 있다. 일정 시간이 경과하면, 전자 장치는 통화아이콘 또는 확장영역의 색상을 이전으로 복원할 수 있다. 상기 확장 영역 축소와 색상 복귀 과정의 순서는 변경될 수 있다.
도 14는 다양한 실시예에 따른 잠금 설정 시 전자 장치의 음성 인식을 이용한 기능 실행 방법을 설명하기 위한 도면이다.
도 14를 참조하면, 전자 장치는, 잠금 상태로 운용될 수 있다. 잠금 상태에서 파워 키에 대한 숏 프레스(short press) 입력(예, 설정된 시간 이내에서 프레스 입력)이 검출되는 경우, 일반 기능 즉, 화면을 켜지도록 제어하여 잠금 화면을 표시할 수 있다. 일 예에서, 잠금 화면은 1401 화면에 도시된 바와 같이, 카메라 아이콘(1430) 및 통화 통화 아이콘(1410)을 포함할 수 있으나, 잠금 상태에서 카메라 기능은 사진 촬영만을 수행할 수 있도록 제한적으로 동작되며, 통화 기능은 긴급 통화(예, 119, 112 등)만을 수행할 수 있도록 제한적으로 동작될 수 있다.
사용자는 잠금 화면에 표시된 통화 아이콘(1410)에 숏 프레스 입력 또는 롱 프레스 입력을 수행할 수 있다. 상기 숏 프레스 입력에 대응하여 전자 장치는 통화 어플리케이션을 트리거할 수 있다. 하지만, 상기 잠금 화면 상태이기 때문에 전자 장치는 상기 통화 어플리케이션을 실행하기 전에 잠금을 해제하도록 요청할 수 있다. 상기 롱 프레스 입력에 대응하여, 전자 장치는 마이크를 통해 음성을 수신할 수 있는 상태로 전환되며, 통화 연결 도메인으로 제한하여 음성 명령을 처리하도록 대기하고, 음성 정보가 입력되면, 1402에 도시된 바와 같이, 입력된 음성 정보에 대해 음성 인식 중임을 나타내는 정보(1420)를 화면에 제공할 수 있다.
이 때, 전자 장치는, 잠금 상태임을 확인하고, 음성 입력에 대해 제한적으로 음성 명령을 처리 처리할 수 있다. 예를 들면, 전자 장치에서, 'john smith'연락처는, 개인적(private)인 접근이 허용되지 않도록 설정될 수 있다. 전자 장치는, 잠금 상태에서, 'john smith'의 음성 입력이 수신된 경우, 'john smith'를 연락처 리스트에서 확인(검색)할 수 있다. 이때, 상기 'john smith'가 개인적 접근이 허용되지 않도록 설정되어 있기 때문에 전자 장치는 'john smith'에 대한 통화 연결이 제한된다고 판단하여 음성 명령을 처리하지 않을 수 있다. 이 경우, 전자 장치는 1403에 도시된 바와 같이 음성 명령이 실패됐음을 사용자에게 알림하기 위해 잠금 화면을 표시할 수 있다.
다른 실시예에 따르면, 전자 장치는 잠금 상태에서 통화가 허용된 이름 또는 번호를 수신하는 경우, 음성 정보에 대응하여 통화 연결을 시도하도록 처리할 수 있다. 예를 들어, 전자 장치는 잠금 화면에서 통화 아이콘(1410)에 대해 롱 프레스 입력 후'119'이라는 음성이 입력되었을 경우, 보안성과 관계없이, 119 번호로 통화 연결을 실행하도록 처리할 수 잇다. 이 경우, 전자 장치는 보안성과 관계 없이 통화 연결을 실행하였으나, 통화 기능이 완료된 이후 다시 잠금 화면을 표시하도록 제어할 수 있다.
다른 실시예에 따르면, 잠금 화면 상태에서 카메라 아이콘(1430)에 대해 롱 프레스 입력이 검출되면, 카메라 기능 도메인으로 제한하여 음성 명령을 실행하도록 처리하고, 카메라 기능 종료에 대한 입력이 발생되면, 잠금 화면으로 복귀하도록 제어할 수 있다.
이와 같이, 본 발명의 실시예에 따른 전자 장치는 잠금 설정 상태에서 음성 정보가 지정된 조건을 만족하는 경우에만 해당 기능을 실행하도록 처리할 수 있다. 또한, 해당 기능이 종료되면, 잠금 설정 상태로 복귀할 수 있다. 이를 통해, 본 발명의 실시예는 보안성을 유지(또는 향상)시킬 수 있다.
도15는 다양한 실시예에 따른 프로그램 모듈의 블록도이다.
도15를 참조하면, 한 실시예에 따르면, 프로그램 모듈(1510)(예: 프로그램(140))은 전자 장치(예: 전자 장치(101))에 관련된 자원을 제어하는 운영 체제(operating system(OS)) 및/또는 운영 체제 상에서 구동되는 다양한 어플리케이션(예: 어플리케이션 프로그램)을 포함할 수 있다. 운영 체제는, 예를 들면, 안드로이드(android), iOS, 윈도우즈(windows), 심비안(symbian), 타이젠(tizen), 또는 바다(bada) 등이 될 수 있다.
프로그램 모듈(1510)은 커널(1520), 미들웨어(1530), 어플리케이션 프로그래밍 인터페이스(application programming interface (API))(1560), 및/또는 어플리케이션(1570)을 포함할 수 있다. 프로그램 모듈(1510)의 적어도 일부는 전자 장치 상에 프리로드(preload) 되거나, 외부 전자 장치(예: 전자 장치(102, 104), 서버(106) 등)로부터 다운로드(download) 가능하다.
커널(1520)(예: 커널(141))은, 예를 들면, 시스템 리소스 매니저(1521) 및/또는 디바이스 드라이버(1523)를 포함할 수 있다. 시스템 리소스 매니저(1521)는 시스템 리소스의 제어, 할당, 또는 회수 등을 수행할 수 있다. 한 실시예에 따르면, 시스템 리소스 매니저(1521)는 프로세스 관리부, 메모리 관리부, 또는 파일 시스템 관리부 등을 포함할 수 있다. 디바이스 드라이버(1523)는, 예를 들면, 디스플레이 드라이버, 카메라 드라이버, 블루투스 드라이버, 공유 메모리 드라이버, USB 드라이버, 키패드 드라이버, WiFi 드라이버, 오디오 드라이버, 또는 IPC(inter-process communication) 드라이버를 포함할 수 있다.
미들웨어(1530)는, 예를 들면, 어플리케이션(1570)이 공통적으로 필요로 하는 기능을 제공하거나, 어플리케이션(1570)이 전자 장치 내부의 제한된 시스템 자원을 효율적으로 사용할 수 있도록 API(1560)를 통해 다양한 기능들을 어플리케이션(1570)으로 제공할 수 있다. 한 실시예에 따르면, 미들웨어(1530)(예: 미들웨어)는 런타임 라이브러리(1535), 어플리케이션 매니저(application manager)(1541), 윈도우 매니저(window manager)(1542), 멀티미디어 매니저(multimedia manager)(1543), 리소스 매니저(resource manager)(1544), 파워 매니저(power manager)(1545), 데이터베이스 매니저(database manager)(1546), 패키지 매니저(package manager)(1547), 연결 매니저(connectivity manager)(1548), 통지 매니저(notification manager)(1549), 위치 매니저(location manager)(1550), 그래픽 매니저(graphic manager)(1551), 또는 보안 매니저(security manager)(1552) 중 적어도 하나를 포함할 수 있다.
런타임 라이브러리(1535)는, 예를 들면, 어플리케이션(1570)이 실행되는 동안에 프로그래밍 언어를 통해 새로운 기능을 추가하기 위해 컴파일러가 사용하는 라이브러리 모듈을 포함할 수 있다. 런타임 라이브러리(1535)는 입출력 관리, 메모리 관리, 또는 산술 함수에 대한 기능 등을 수행할 수 있다.
어플리케이션 매니저(1541)는, 예를 들면, 어플리케이션(1570) 중 적어도 하나의 어플리케이션의 생명 주기(life cycle)를 관리할 수 있다. 윈도우 매니저(1542)는 화면에서 사용하는 GUI 자원을 관리할 수 있다. 멀티미디어 매니저(1543)는 다양한 미디어 파일들의 재생에 필요한 포맷을 파악하고, 해당 포맷에 맞는 코덱(codec)을 이용하여 미디어 파일의 인코딩(encoding) 또는 디코딩(decoding)을 수행할 수 있다. 리소스 매니저(1544)는 어플리케이션(1570) 중 적어도 어느 하나의 어플리케이션의 소스 코드, 메모리 또는 저장 공간 등의 자원을 관리할 수 있다.
파워 매니저(1545)는, 예를 들면, 바이오스(BIOS: basic input/output system) 등과 함께 동작하여 배터리(battery) 또는 전원을 관리하고, 전자 장치의 동작에 필요한 전력 정보 등을 제공할 수 있다. 데이터베이스 매니저(1546)는 어플리케이션(1570) 중 적어도 하나의 어플리케이션에서 사용할 데이터베이스를 생성, 검색, 또는 변경할 수 있다. 패키지 매니저(1547)는 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 업데이트를 관리할 수 있다.
연결 매니저(1548)는, 예를 들면, WiFi 또는 블루투스 등의 무선 연결을 관리할 수 있다. 통지 매니저(1549)는 도착 메시지, 약속, 근접성 알림 등의 사건(event)을 사용자에게 방해되지 않는 방식으로 표시 또는 통지할 수 있다. 위치 매니저(1550)는 전자 장치의 위치 정보를 관리할 수 있다. 그래픽 매니저(1551)는 사용자에게 제공될 그래픽 효과 또는 이와 관련된 사용자 인터페이스를 관리할 수 있다. 보안 매니저(1552)는 시스템 보안 또는 사용자 인증 등에 필요한 제반 보안 기능을 제공할 수 있다. 한 실시예에 따르면, 전자 장치(예: 전자 장치(101))가 전화 기능을 포함한 경우, 미들웨어(1530)는 전자 장치의 음성 또는 영상 통화 기능을 관리하기 위한 통화 매니저(telephony manager)를 더 포함할 수 있다.
미들웨어(1530)는 전술한 구성요소들의 다양한 기능의 조합을 형성하는 미들웨어 모듈을 포함할 수 있다. 미들웨어(1530)는 차별화된 기능을 제공하기 위해 운영 체제의 종류 별로 특화된 모듈을 제공할 수 있다. 또한, 미들웨어(1530)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다.
API(1560)(예: API(145))는, 예를 들면, API 프로그래밍 함수들의 집합으로, 운영 체제에 따라 다른 구성으로 제공될 수 있다. 예를 들면, 안드로이드 또는 iOS의 경우, 플랫폼 별로 하나의 API 셋을 제공할 수 있으며, 타이젠(tizen)의 경우, 플랫폼 별로 두 개 이상의 API 셋을 제공할 수 있다.
어플리케이션(1570)(예: 어플리케이션 프로그램(147))은, 예를 들면, 홈(1571), 다이얼러(1572), SMS/MMS(1573), IM(instant message)(1574), 브라우저(1575), 카메라(1576), 알람(1577), 컨택트(1578), 음성 다이얼(1579), 이메일(1580), 달력(1581), 미디어 플레이어(1582), 앨범(1583), 또는 시계(1584), 건강 관리(health care)(예: 운동량 또는 혈당 등을 측정), 또는 환경 정보 제공(예: 기압, 습도, 또는 온도 정보 등을 제공) 등의 기능을 수행할 수 있는 하나 이상의 어플리케이션을 포함할 수 있다.
한 실시예에 따르면, 어플리케이션(1570)은 전자 장치(예: 전자 장치(101))와 외부 전자 장치(예: 전자 장치(102, 104)) 사이의 정보 교환을 지원하는 어플리케이션(이하, 설명의 편의 상, "정보 교환 어플리케이션")을 포함할 수 있다. 정보 교환 어플리케이션은, 예를 들면, 외부 전자 장치에 특정 정보를 전달하기 위한 알림 전달(notification relay) 어플리케이션, 또는 외부 전자 장치를 관리하기 위한 장치 관리(device management) 어플리케이션을 포함할 수 있다.
예를 들면, 알림 전달 어플리케이션은 전자 장치의 다른 어플리케이션(예: SMS/MMS 어플리케이션, 이메일 어플리케이션, 건강 관리 어플리케이션, 또는 환경 정보 어플리케이션 등)에서 발생된 알림 정보를 외부 전자 장치(예: 전자 장치(102, 104))로 전달하는 기능을 포함할 수 있다. 또한, 알림 전달 어플리케이션은, 예를 들면, 외부 전자 장치로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다.
장치 관리 어플리케이션은, 예를 들면, 전자 장치와 통신하는 외부 전자 장치(예: 전자 장치(102, 104))의 적어도 하나의 기능(예: 외부 전자 장치 자체(또는, 일부 구성 부품)의 턴-온/턴-오프 또는 디스플레이의 밝기(또는, 해상도) 조절), 외부 전자 장치에서 동작하는 어플리케이션 또는 외부 전자 장치에서 제공되는 서비스(예: 통화 서비스 또는 메시지 서비스 등)를 관리(예: 설치, 삭제, 또는 업데이트)할 수 있다.
한 실시예에 따르면, 어플리케이션(1570)은 외부 전자 장치(예: 전자 장치(102, 104))의 속성(에 따라 지정된 어플리케이션(예: 모바일 의료 기기의 건강 관리 어플리케이션 등)을 포함할 수 있다. 한 실시예에 따르면, 어플리케이션(1570)은 외부 전자 장치(예: 서버 또는 전자 장치)로부터 수신된 어플리케이션을 포함할 수 있다. 한 실시예에 따르면, 어플리케이션(1570)은 프리로드 어플리케이션(preloaded application) 또는 서버로부터 다운로드 가능한 제3자 어플리케이션(third party application)을 포함할 수 있다. 도시된 실시예에 따른 프로그램 모듈(1510)의 구성요소들의 명칭은 운영 체제의 종류에 따라서 달라질 수 있다.
도16은 다양한 실시예에 따른 전자 장치(1601)의 블록도이다.
도16을 참조하면, 전자 장치(1601)는, 예를 들면, 도 1에 도시된 전자 장치(101)의 전체 또는 일부를 포함할 수 있다. 전자 장치(1601)는 하나 이상의 프로세서(예: AP(application processor))(1610), 통신 모듈(1620), (가입자 식별 모듈(1624), 메모리(1630), 센서 모듈(1640), 입력 장치(1650), 디스플레이(1660), 인터페이스(1670), 오디오 모듈(1680), 카메라 모듈(1691), 전력 관리 모듈(1695), 배터리(1696), 인디케이터(1697), 및 모터(1698) 를 포함할 수 있다.
프로세서(1610)는, 예를 들면, 운영 체제 또는 응용 프로그램을 구동하여 프로세서(1610)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 프로세서(1610)는, 예를 들면, SoC(system on chip) 로 구현될 수 있다. 한 실시예에 따르면, 프로세서(1610)는 GPU(graphic processing unit) 및/또는 이미지 신호 프로세서(image signal processor)를 더 포함할 수 있다. 프로세서(1610)는 도 16에 도시된 구성요소들 중 적어도 일부(예: 셀룰러 모듈(1621))를 포함할 수도 있다. 프로세서(1610) 는 다른 구성요소들(예: 비휘발성 메모리) 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다.
통신 모듈(1620)은, 도 1의 통신 인터페이스(170)와 동일 또는 유사한 구성을 가질 수 있다. 통신 모듈(1620)은, 예를 들면, 셀룰러 모듈(1621), WiFi 모듈(1623), 블루투스 모듈(1625), GNSS 모듈(1627)(예: GPS 모듈, Glonass 모듈, Beidou 모듈, 또는 Galileo 모듈), NFC 모듈(1628) 및 RF(radio frequency) 모듈(1629)를 포함할 수 있다.
셀룰러 모듈(1621)은, 예를 들면, 통신망을 통해서 음성 통화, 영상 통화, 문자 서비스, 또는 인터넷 서비스 등을 제공할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(1621)은 가입자 식별 모듈(예: SIM 카드)(1624)을 이용하여 통신 네트워크 내에서 전자 장치(1601)의 구별 및 인증을 수행할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(1621)은 프로세서(1610)가 제공할 수 있는 기능 중 적어도 일부 기능을 수행할 수 있다. 한 실시예에 따르면, 셀룰러 모듈(1621)은 커뮤니케이션 프로세서(CP: communication processor)를 포함할 수 있다.
WiFi 모듈(1623), 블루투스 모듈(1625), GNSS 모듈(1627) 또는 NFC 모듈(1628) 각각은, 예를 들면, 해당하는 모듈을 통해서 송수신되는 데이터를 처리하기 위한 프로세서를 포함할 수 있다. 어떤 실시예에 따르면, 셀룰러 모듈(1621), WiFi 모듈(1623), 블루투스 모듈(1625), GNSS 모듈(1627) 또는 NFC 모듈(1628) 중 적어도 일부(예: 두 개 이상)는 하나의 integrated chip(IC) 또는 IC 패키지 내에 포함될 수 있다.
RF 모듈(1629)은, 예를 들면, 통신 신호(예: RF 신호)를 송수신할 수 있다. RF 모듈(1629)은, 예를 들면, 트랜시버(transceiver), PAM(power amp module), 주파수 필터(frequency filter), LNA(low noise amplifier), 또는 안테나 등을 포함할 수 있다. 다른 실시예에 따르면, 셀룰러 모듈(1621), WiFi 모듈(1623), 블루투스 모듈(1625), GNSS 모듈(1627) 또는 NFC 모듈(1628) 중 적어도 하나는 별개의 RF 모듈을 통하여 RF 신호를 송수신할 수 있다.
가입자 식별 모듈(1624)은, 예를 들면, 가입자 식별 모듈을 포함하는 카드 및/또는 내장 SIM(embedded SIM)을 포함할 수 있으며, 고유한 식별 정보(예: ICCID(integrated circuit card identifier)) 또는 가입자 정보(예: IMSI(international mobile subscriber identity))를 포함할 수 있다.
메모리(1630)(예: 메모리(130))는, 예를 들면, 내장 메모리(1632) 또는 외장 메모리(1634)를 포함할 수 있다. 내장 메모리(1632)는, 예를 들면, 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나를 포함할 수 있다.
외장 메모리(1634)는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital), MMC(multi-media card) 또는 메모리 스틱(memory stick) 등을 더 포함할 수 있다. 외장 메모리(1634)는 다양한 인터페이스를 통하여 전자 장치(1601)와 기능적으로 및/또는 물리적으로 연결될 수 있다.
센서 모듈(1640)은, 예를 들면, 물리량을 계측하거나 전자 장치(1601)의 작동 상태를 감지하여, 계측 또는 감지된 정보를 전기 신호로 변환할 수 있다. 센서 모듈(1640)은, 예를 들면, 제스처 센서(1640A), 자이로 센서(1640B), 기압 센서(1640C), 마그네틱 센서(1640D), 가속도 센서(1640E), 그립 센서(1640F), 근접 센서(1640G), 컬러(color) 센서(1640H)(예: RGB(red, green, blue) 센서), 생체 센서(1640I), 온/습도 센서(1640J), 조도 센서(1640K), 또는 UV(ultra violet) 센서(1640M) 중의 적어도 하나를 포함할 수 있다. 추가적으로 또는 대체적으로(additionally or alternatively), 센서 모듈(1640)은, 예를 들면, 후각 센서(E-nose sensor), EMG 센서(electromyography sensor), EEG 센서(electroencephalogram sensor), ECG 센서(electrocardiogram sensor), IR(infrared) 센서, 홍채 센서 및/또는 지문 센서를 포함할 수 있다. 센서 모듈(1640)은 그 안에 속한 적어도 하나 이상의 센서들을 제어하기 위한 제어 회로를 더 포함할 수 있다. 어떤 실시예에서는, 전자 장치(1601)는 프로세서(1610)의 일부로서 또는 별도로, 센서 모듈(1640)을 제어하도록 구성된 프로세서를 더 포함하여, 프로세서(1610)가 슬립(sleep) 상태에 있는 동안, 센서 모듈(1640)을 제어할 수 있다.
입력 장치(1650)는, 예를 들면, 터치 패널(touch panel)(1652),(디지털) 펜 센서(pen sensor)(1654), 키(key)(1656), 또는 초음파(ultrasonic) 입력 장치(1658)를 포함할 수 있다. 터치 패널(1652)은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널(1652)은 제어 회로를 더 포함할 수도 있다. 터치 패널(1652)은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다.
(디지털) 펜 센서(1654)는, 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 쉬트(sheet)를 포함할 수 있다. 키(1656)는, 예를 들면, 물리적인 버튼, 광학식 키, 또는 키패드를 포함할 수 있다. 초음파 입력 장치(1658)는 마이크(예: 마이크(1688))를 통해, 입력 도구에서 발생된 초음파를 감지하여, 상기 감지된 초음파에 대응하는 데이터를 확인할 수 있다.
디스플레이(1660)(예: 디스플레이(160))는 패널(1662), 홀로그램 장치(1664), 또는 프로젝터(1666)를 포함할 수 있다. 패널(1662)은, 도 1의 디스플레이(160)와 동일 또는 유사한 구성을 포함할 수 있다. 패널(1662)은, 예를 들면, 유연하게(flexible), 투명하게(transparent), 또는 착용할 수 있게(wearable) 구현될 수 있다. 패널(1662)은 터치 패널(1652)과 하나의 모듈로 구성될 수도 있다. 홀로그램 장치(1664)는 빛의 간섭을 이용하여 입체 영상을 허공에 보여줄 수 있다. 프로젝터(1666)는 스크린에 빛을 투사하여 영상을 표시할 수 있다. 스크린은, 예를 들면, 전자 장치(1601)의 내부 또는 외부에 위치할 수 있다. 한 실시예에 따르면, 디스플레이(1660)는 패널(1662), 홀로그램 장치(1664), 또는 프로젝터(1666)를 제어하기 위한 제어 회로를 더 포함할 수 있다.
인터페이스(1670)는, 예를 들면, HDMI(high-definition multimedia interface)(1672), USB(universal serial bus)(1674), 광 인터페이스(optical interface)(1676), 또는 D-sub(D-subminiature)(1678)를 포함할 수 있다. 인터페이스(1670)는, 예를 들면, 도 1에 도시된 통신 인터페이스(170)에 포함될 수 있다. 추가적으로 또는 대체적으로(additionally and alternatively), 인터페이스(1670)는, 예를 들면, MHL(mobile high-definition link) 인터페이스, SD(secure digital) 카드/MMC(multi-media card) 인터페이스, 또는 IrDA(infrared data association) 규격 인터페이스를 포함할 수 있다.
오디오 모듈(1680)은, 예를 들면, 소리(sound)와 전기 신호를 쌍방향으로 변환시킬 수 있다. 오디오 모듈(1680)의 적어도 일부 구성요소는, 예를 들면, 도 1 에 도시된 입출력 인터페이스(145)에 포함될 수 있다. 오디오 모듈(1680)은, 예를 들면, 스피커(1682), 리시버(1684), 이어폰(1686), 또는 마이크(1688) 등을 통해 입력 또는 출력되는 소리 정보를 처리할 수 있다.
카메라 모듈(1691)은, 예를 들면, 정지 영상 및 동영상을 촬영할 수 있는 장치로서, 한 실시예에 따르면, 하나 이상의 이미지 센서(예: 전면 센서 또는 후면 센서), 렌즈, ISP(image signal processor), 또는 플래시(flash)(예: LED 또는 xenon lamp 등)를 포함할 수 있다.
전력 관리 모듈(1695)은, 예를 들면, 전자 장치(1601)의 전력을 관리할 수 있다. 한 실시예에 따르면, 전력 관리 모듈(1695)은 PMIC(power management integrated circuit), 충전 IC(charger integrated circuit), 또는 배터리 또는 연료 게이지(battery or fuel gauge)를 포함할 수 있다. PMIC는, 유선 및/또는 무선 충전 방식을 가질 수 있다. 무선 충전 방식은, 예를 들면, 자기공명 방식, 자기유도 방식 또는 전자기파 방식 등을 포함하며, 무선 충전을 위한 부가적인 회로, 예를 들면, 코일 루프, 공진 회로, 또는 정류기 등을 더 포함할 수 있다. 배터리 게이지는, 예를 들면, 배터리(1696)의 잔량, 충전 중 전압, 전류, 또는 온도를 측정할 수 있다. 배터리(1696)는, 예를 들면, 충전식 전지(rechargeable battery) 및/또는 태양 전지(solar battery)를 포함할 수 있다.
인디케이터(1697)는 전자 장치(1601) 또는 그 일부(예: 프로세서(1610))의 특정 상태, 예를 들면, 부팅 상태, 메시지 상태 또는 충전 상태 등을 표시할 수 있다. 모터(1698)는 전기적 신호를 기계적 진동으로 변환할 수 있고, 진동(vibration), 또는 햅틱(haptic) 효과 등을 발생시킬 수 있다. 도시되지는 않았으나, 전자 장치(1601)는 모바일 TV 지원을 위한 처리 장치(예: GPU)를 포함할 수 있다. 모바일 TV 지원을 위한 처리 장치는, 예를 들면, DMB(digital multimedia broadcasting), DVB(digital video broadcasting), 또는 미디어플로(mediaFloTM) 등의 규격에 따른 미디어 데이터를 처리할 수 있다.
본 문서에서 기술된 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 다양한 실시예에서, 전자 장치는 본 문서에서 기술된 구성요소 중 적어도 하나를 포함하여 구성될 수 있으며, 일부 구성요소가 생략되거나 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 또한, 다양한 실시예에 따른 전자 장치의 구성요소들 중 일부가 결합되어 하나의 개체(entity)로 구성됨으로써, 결합되기 이전의 해당 구성요소들의 기능을 동일하게 수행할 수 있다.
다양한 실시예에 따르면, 프로그램 모듈(910)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어, 또는 이들 중 적어도 둘 이상의 조합으로 구현될 수 있다. 프로그램 모듈(910)의 적어도 일부는, 예를 들면, 프로세서(예: 프로세서(210))에 의해 구현(implement)(예: 실행)될 수 있다. 프로그램 모듈(910)의 적어도 일부는 하나 이상의 기능을 수행하기 위한, 예를 들면, 모듈, 프로그램, 루틴, 명령어 세트(sets of instructions) 또는 프로세스 등을 포함할 수 있다.
본 문서에서 사용된 용어 "모듈"은, 예를 들면, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "모듈"은, 예를 들면, 유닛(unit), 로직(logic), 논리 블록(logical block), 부품(component), 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "모듈"은, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들면,"모듈"은, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.
다양한 실시예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그램 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서(예: 프로세서(120))에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들면, 메모리(130)가 될 수 있다.
컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(magnetic media)(예: 자기테이프), 광기록 매체(optical media)(예: CD-ROM(compact disc read only memory), DVD(digital versatile disc), 자기-광 매체(magneto-optical media)(예: 플롭티컬 디스크(floptical disk)), 하드웨어 장치(예: ROM(read only memory), RAM(random access memory), 또는 플래시 메모리 등) 등을 포함할 수 있다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 다양한 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
다양한 실시예에 따른 모듈 또는 프로그램 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 다양한 실시예에 따른 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다. 그리고 본 문서에 개시된 실시예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 문서에서 기재된 기술의 범위를 한정하는 것은 아니다. 따라서, 본 문서의 범위는, 본 문서의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시예를 포함하는 것으로 해석되어야 한다.
101 : 전자 장치 110 : 버스
120 : 프로세서 130 : 메모리
150 : 입출력 인터페이스 160 : 디스플레이
170 : 통신 인터페이스 121 : 트리거 인식 모듈
122 : 음성 명령 인식 모듈 123 : 영상 처리 모듈
124 : 기능 제어 모듈 125 : 음성 출력 모듈

Claims (27)

  1. 전자장치에 있어서,
    제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징;
    외부로부터 소리를 수신하도록 배치된 마이크;
    상기 하우징에 배치된 적어도 하나의 입력 장치;
    상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이;
    상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서; 및
    상기 프로세서와 전기적으로 연결된 메모리를 포함하고,
    상기 메모리는, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하고,
    상기 메모리는, 실행시에, 상기 프로세서가,
    상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하고,
    상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고,
    상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고,
    상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장하는 것을 특징으로 하는 전자 장치.
  2. 제1 항에 있어서,
    상기 제 1 소프트웨어 프로그램은
    응용(application) 프로그램 또는 선택된 음성 명령들을 수행하는 소프트웨어 프로그램들 중 적어도 하나를 포함하는 것을 특징으로 하는 전자 장치.
  3. 제 1 항에 있어서,
    상기 메모리는, 제 3 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 2 소프트웨어 프로그램을 저장하고,
    상기 인스트럭션들은, 실행시에, 상기 프로세서가,
    상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 내지 3사용자 입력들과 상이한 제 4사용자 입력을 수신하고,
    상기 제 4 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고,
    상기 상태에서 외부로부터 상기 마이크를 통하여 음성을 수신하고,
    상기 제 3 사용자 입력의 수신 없이, 상기 수신된 음성을 적어도 일부 이용하여, 상기 제 2 소프트웨어 프로그램을 실행하도록 하는 것을 특징으로 하는 전자 장치.
  4. 제1항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 수신된 음성을 텍스트로 변환하고,
    상기 변환된 텍스트를 이용하여, 상기 제 1 소프트웨어 프로그램과 연관된 데이터 또는 명령어 중 적어도 하나를 추출하고,
    상기 추출된 데이터 또는 명령어 중 적어도 하나에 기초하여 선택된 기능을 실행하도록 하는 것을 특징으로 하는 전자 장치.
  5. 제 4 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 선택된 기능의 실행 후에, 상기 변환된 텍스트를 상기 제 1 소프트웨어 프로그램 외의 다른 소프트웨어 프로그램을 위하여 사용하지 않도록 하는 것을 특징으로 하는 전자 장치.
  6. 제1 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환한 후,
    상기 디스플레이 상에 상기 제 1 소프트웨어 프로그램을 나타내는 인디케이션(indication)을 표시하도록 하는 것을 특징으로 하는 전자 장치.
  7. 제1 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 제 2 사용자 입력이 계속 유지되는 상태 중에만, 상기 마이크를 통하여 음성을 수신하고,
    상기 제 2 사용자 입력이 종료되면, 상기 마이크를 통한 음성의 수신을 중단하도록 하는 것을 특징으로 하는 전자 장치.
  8. 제7 항에 있어서,
    상기 입력 장치는 상기 하우징에 배치된 버튼을 포함하며, 상기 제 2 사용자 입력은 상기 버튼을 누르는 동작을 포함하는 것을 특징으로 하는 전자 장치.
  9. 제 1 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 수신된 음성을 텍스트로 변환하고,
    상기 음성의 수신이 종료된 후, 상기 텍스트를 상기 디스플레이에 표시하도록 하는 것을 특징으로 하는 전자 장치.
  10. 제 1 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 수신된 음성을 텍스트로 변환하고,
    상기 음성의 수신 중에 또는 수신이 종료된 후, 상기 제 1 소프트웨어 프로그램의 유저 인터페이스를 상기 디스플레이 상에 표시하고,
    상기 변환된 텍스트 중 적어도 일부를 상기 유저 인터페이스의 일부에 표시하도록 하는 것을 특징으로 하는 전자 장치.
  11. 제 1 항에 있어서,
    상기 제1소프트웨어 프로그램은, 전화 어플리케이션 프로그램을 포함하고,
    상기 인스트럭션들은, 상기 프로세서가, 상기 전화 어플리케이션을 나타내는 아이콘을 상기 디스플레이 상에 표시하도록 하고,
    상기 제 1 사용자 입력은 상기 아이콘을 터치하는 입력을 포함하는 것을 특징으로 하는 전자 장치.
  12. 제 11 항에 있어서,
    상기 입력 장치는, 물리적 버튼 또는 터치 키를 포함하고, 상기 제 2 사용자 입력은 상기 물리적 버튼 또는 터치 키를 누르거나 터치하는 동작을 포함하는 것을 특징으로 하는 전자 장치.
  13. 제 11 항에 있어서,
    상기 인스트럭션들은, 상기 프로세서가,
    상기 디스플레이가 턴오프 상태에서 턴온 상태로 전환된 후, 잠금 화면을 상기 디스플레이 상에 표시하고,
    상기 잠금 화면이 표시된 상태에서 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 음성을 수신할 수 있는 상태로 전환하도록 하는 것을 특징으로 하는 전자 장치.
  14. 제 13 항에 있어서,
    상기 잠금 화면은, 상기 전화 어플리케이션을 나타내는 아이콘을 포함하고,
    상기 제 1 사용자 입력은, 상기 아이콘을 적어도 제 1 시간 동안 터치하는 동작을 포함하고,
    상기 제 2 사용자 입력은, 상기 아이콘을 상기 제 1 시간 보다 긴 제 2 시간 동안 터치 또는 누르는 동작을 포함하는 것을 특징으로 하는 전자 장치.
  15. 제1 항에 있어서,
    상기 프로세서는,
    상기 전자 장치의 동작 상태 및 상기 제2사용자 입력의 타입 중 적어도 하나를 기반으로 선택된 기능의 실행으로 수신된 음성을 처리하는 것을 특징으로 하는 전자 장치.
  16. 제1 항에 있어서,
    상기 프로세서는,
    상기 수신된 음성에 대해, 복수의 기능에 대해 음성 명령을 처리할 수 있는 경우, 상기 디스플레이에 상기 복수의 기능에 대한 알림 정보를 표시하고, 상기 알림 정보로부터 사용자에 의해 선택된 기능으로 제한하여 음성 명령을 처리하는 것을 특징으로 하는 전자 장치.
  17. 제1 항에 있어서,
    상기 프로세서는,
    상기 제 2 사용자 입력에 대응하여, 상기 전자 장치가 잠금이 설정된 상태인지를 판단하고, 상기 잠금이 설정된 상태인 경우, 접근이 허여된 기능만을 실행하며, 상기 접근 허여된 기능이 종료되면 상기 잠금 상태로 복귀하는 것을 특징으로 하는 전자 장치.
  18. 제1 항에 있어서,
    상기 제2 사용자 입력은,
    하드 키 또는 소프트 키 입력, 제스처 입력, 외부 장치로부터 수신된 입력 중 적어도 하나를 포함하는 것을 특징으로 하는 전자 장치.
  19. 전자장치에 있어서,
    하우징;
    외부로부터 소리를 수신하도록 배치된 마이크;
    상기 하우징의 외부 면에 배치된 적어도 하나의 유저 인터페이스;
    상기 마이크 및 상기 유저 인터페이스와 전기적으로 연결된 프로세서; 및
    상기 프로세서와 전기적으로 연결되며, 제 1 사용자 입력에 응답하여 트리거(trigger) 가능한, 제1소프트웨어 프로그램을 저장하는 메모리를 포함하고,
    상기 메모리는, 실행시에, 상기 프로세서가,
    상기 적어도 하나의 유저 인터페이스를 통하여, 상기 제 1 사용자 입력과 상이한 제 2 사용자 입력을 수신하고,
    상기 제2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하고,
    상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하고,
    상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제1소프트웨어 프로그램을 실행하도록 하는 인스트럭션들을 저장하는 것을 특징으로 하는 전자 장치.
  20. 전자 장치의 음성 인식을 이용한 기능 실행 방법에 있어서,
    사용자 입력을 수신하는 동작;
    상기 수신된 사용자 입력이 음성 인식 활성화 조건을 만족하는 경우, 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작;
    상기 마이크를 통해 외부로부터 음성 정보를 수신하는 동작;
    상기 사용자 입력을 기반으로 특정 기능 실행 도메인을 확인하는 동작; 및
    상기 확인된 기능 실행 도메인으로 제한하여 상기 수신된 음성 정보를 이용해 음성 명령을 처리하는 동작을 포함하는 것을 특징으로 하는 방법.
  21. 제 20항에 있어서,
    상기 사용자 입력이 음성 인식 활성화 조건을 만족하지 않은 경우, 상기 사용자 입력에 대응하는 일반 기능을 실행하는 동작을 더 포함하는 것을 특징으로 하는 방법.
  22. 제 20항에 있어서,
    상기 특정 기능 실행 도메인을 확인하는 동작은
    상기 사용자 입력의 음성 인식 활성화 조건을 나타내는 트리거 정보를 확인하고, 상기 트리거 정보에 대응하여 설정된 특정 응용 프로그램의 실행 명령을 확인하는 것을 특징으로 하는 방법.
  23. 제 20항에 있어서,
    상기 사용자 입력은, 물리적 하드 키 선택 입력, 소프트 아이콘 선택 입력, 전자 장치의 모션 제스처 입력, 외부 장치로부터 수신된 입력 중 적어도 하나인 것을 특징으로 하는 방법.
  24. 제 23항에 있어서,
    상기 음성 명령을 처리하는 동작은,
    상기 전자 장치의 동작 상태 및 사용자 입력의 타입 중 적어도 하나를 판단하는 동작을 더 포함하고,
    상기 판단 결과를 기반으로 특정 기능을 선택하고, 수신된 음성에 대해 상기 선택된 특징 기능의 실행으로 음성 명령을 처리하는 것을 특징으로 하는 방법.
  25. 제 20항에 있어서,
    상기 마이크를 통해 외부로부터 음성 정보를 수신하는 동작은,
    상기 사용자 입력이 유지되는 동안 음성을 수신하고, 상기 사용자 입력 해제 시 수신된 음성 정보에 대해 음성 인식을 수행하는 것을 특징으로 하는 방법.
  26. 제 20항에 있어서,
    상기 음성 명령을 처리하는 동작은,
    상기 전자 장치가 잠금 상태인지를 판단하는 동작; 및
    상기 전자 장치가 잠금 상태인 경우, 상기 트리거 정보에 대응하여 접근이 허여된 특정 응용 프로그램만을 실행하고, 상기 특정 응용 프로그램이 종료되면 상기 잠금 상태로 복귀하는 동작을 더 포함하는 것을 특징으로 하는 방법.
  27. 전자장치의 음성 인식을 이용한 기능 실행 방법에 있어서,
    제 1 면 및 상기 제 1 면의 반대방향으로 향하는 제 2 면을 포함하는 하우징, 외부로부터 소리를 수신하도록 배치된 마이크, 상기 하우징에 배치된 적어도 하나의 입력 장치, 상기 하우징의 상기 제 1 면에 배치된, 터치스크린 디스플레이, 상기 마이크, 상기 입력 장치, 상기 디스플레이와 전기적으로 연결된 프로세서, 및 상기 프로세서와 전기적으로 연결되고, 제 1 사용자 입력에 응답하여 트리거 (trigger) 가능한, 제 1 소프트웨어 프로그램을 저장하는 메모리를 포함하는 전자 장치에 의하여, 상기 적어도 하나의 입력 장치, 또는 상기 디스플레이 상의 선택된 영역 중 적어도 하나를 통하여, 상기 제 1 사용자 입력과 상이한 제 2사용자 입력을 수신하는 동작;
    상기 전자 장치에 의하여, 상기 제 2 사용자 입력에 응답하여, 상기 마이크를 통하여 음성을 수신할 수 있는 상태로 상기 전자 장치를 전환하는 동작;
    상기 전자 장치에 의하여, 상기 상태에서 상기 마이크를 통하여 외부로부터 음성을 수신하는 동작;
    상기 전자 장치에 의하여, 상기 제 1 사용자 입력의 수신 없이, 상기 수신된 음성의 적어도 일부를 이용하여, 상기 제 1 소프트웨어 프로그램을 실행하는 동작을 포함하는 것을 특징으로 하는 방법.
KR1020150147226A 2015-10-22 2015-10-22 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 Withdrawn KR20170046958A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020150147226A KR20170046958A (ko) 2015-10-22 2015-10-22 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법
EP16195089.4A EP3160150A1 (en) 2015-10-22 2016-10-21 Electronic device and method for executing function using speech recognition thereof
US15/332,282 US20170116987A1 (en) 2015-10-22 2016-10-24 Electronic device and method for executing function using speech recognition thereof
PCT/KR2016/011972 WO2017069595A1 (en) 2015-10-22 2016-10-24 Electronic device and method for executing function using speech recognition thereof
CN201680048426.1A CN107924288A (zh) 2015-10-22 2016-10-24 电子设备及其使用语音识别来执行功能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150147226A KR20170046958A (ko) 2015-10-22 2015-10-22 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법

Publications (1)

Publication Number Publication Date
KR20170046958A true KR20170046958A (ko) 2017-05-04

Family

ID=57189890

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150147226A Withdrawn KR20170046958A (ko) 2015-10-22 2015-10-22 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법

Country Status (5)

Country Link
US (1) US20170116987A1 (ko)
EP (1) EP3160150A1 (ko)
KR (1) KR20170046958A (ko)
CN (1) CN107924288A (ko)
WO (1) WO2017069595A1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200024484A (ko) 2018-08-28 2020-03-09 주식회사 나무엔 Stt 녹음 장치 및 이를 이용한 음성-텍스트 변환 시스템
US10783887B2 (en) 2018-01-25 2020-09-22 Samsung Electronics Co., Ltd. Application processor including low power voice trigger system with external interrupt, electronic device including the same and method of operating the same
KR102167546B1 (ko) * 2019-08-22 2020-10-21 (주) 더블유엘티 다기능 무선 충전장치
KR20210005253A (ko) * 2018-05-16 2021-01-13 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
WO2021060573A1 (ko) * 2019-09-24 2021-04-01 엘지전자 주식회사 영상표시장치 및 이의 음성 인식 방법
KR20210052513A (ko) * 2018-08-30 2021-05-10 비보 모바일 커뮤니케이션 컴퍼니 리미티드 음성 처리 방법 및 이동 단말기

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
AU2014214676A1 (en) 2013-02-07 2015-08-27 Apple Inc. Voice trigger for a digital assistant
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US12223282B2 (en) 2016-06-09 2025-02-11 Apple Inc. Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US12197817B2 (en) 2016-06-11 2025-01-14 Apple Inc. Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
WO2018160199A1 (en) * 2017-03-03 2018-09-07 Google Llc Systems and methods for detecting improper implementation of presentation of content items by applications executing on client devices
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. Multi-modal interfaces
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10395650B2 (en) * 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
KR102406718B1 (ko) * 2017-07-19 2022-06-10 삼성전자주식회사 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템
KR102405752B1 (ko) * 2017-08-23 2022-06-08 삼성전자주식회사 어플리케이션 프로그램의 권한을 제어하는 방법 및 전자 장치
CN107580098B (zh) * 2017-08-29 2020-03-27 努比亚技术有限公司 移动终端
TWI658404B (zh) * 2018-02-09 2019-05-01 宏碁股份有限公司 語音辨識系統及其方法
KR102679107B1 (ko) * 2018-02-23 2024-06-27 삼성전자주식회사 세탁 기기 및 그의 제어 방법
KR102488699B1 (ko) * 2018-02-27 2023-01-17 삼성전자주식회사 전자 장치 및 그 지문 인증 인터페이스 방법
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
KR102685523B1 (ko) * 2018-03-27 2024-07-17 삼성전자주식회사 사용자 음성 입력을 처리하는 장치
KR102533443B1 (ko) * 2018-05-04 2023-05-17 삼성전자 주식회사 콘텐츠 제공 방법 및 이를 사용하는 전자 장치
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
CN110544473B (zh) 2018-05-28 2022-11-08 百度在线网络技术(北京)有限公司 语音交互方法和装置
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
KR20200017292A (ko) * 2018-08-08 2020-02-18 삼성전자주식회사 음성 인식 방법 및 그 방법을 지원하는 전자 장치
CN109003610A (zh) * 2018-08-17 2018-12-14 北京怡和嘉业医疗科技股份有限公司 呼吸设备的语音处理方法、装置、设备及终端
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN111012247A (zh) * 2018-10-10 2020-04-17 惠州市蓝微电子有限公司 吸尘器的节能控制系统及其方法
CN113196383A (zh) * 2018-12-06 2021-07-30 伟视达电子工贸有限公司 用于生成用于语音控制电子设备的命令的技术
KR102685851B1 (ko) * 2019-01-07 2024-07-18 삼성전자주식회사 무선으로 전력을 송신하거나 수신하기 위한 사용자 인터페이스를 제공하는 전자 장치 및 방법
KR102785655B1 (ko) * 2019-02-18 2025-03-26 삼성전자주식회사 루틴을 제공하기 위한 방법 및 이를 지원하는 전자 장치
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN110096211B (zh) * 2019-04-30 2021-03-19 广东美的厨房电器制造有限公司 家用电器的控制方法和家用电器
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
CN110334330A (zh) * 2019-05-27 2019-10-15 努比亚技术有限公司 一种信息编辑方法、可穿戴设备及计算机可读存储介质
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN112073776B (zh) * 2019-06-10 2022-06-24 海信视像科技股份有限公司 语音控制方法及显示设备
CN110413106B (zh) * 2019-06-18 2024-02-09 中国人民解放军军事科学院国防科技创新研究院 一种基于语音和手势的增强现实输入方法及系统
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
US11503368B2 (en) * 2020-02-26 2022-11-15 Arris Enterprises Llc Method and system for advanced customer bug reporting
US11127080B1 (en) * 2020-05-05 2021-09-21 Capital One Services, Llc Computer-based systems of microservice orchestration based on bounded contexts and methods of use thereof
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
CN111599360B (zh) * 2020-05-12 2022-11-29 Oppo广东移动通信有限公司 唤醒控制方法、装置、存储介质及电子设备
US11887589B1 (en) * 2020-06-17 2024-01-30 Amazon Technologies, Inc. Voice-based interactions with a graphical user interface
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US12198689B1 (en) * 2020-08-10 2025-01-14 Summer Institute of Linguistics, Inc. Systems and methods for multilingual dialogue interactions using dynamic automatic speech recognition and processing
CN112272320B (zh) * 2020-10-20 2022-04-15 Vidaa美国公司 一种显示设备及其重名检测方法
WO2022061293A1 (en) 2020-09-21 2022-03-24 VIDAA USA, Inc. Display apparatus and signal transmission method for display apparatus
CN112802471B (zh) * 2020-12-31 2024-01-23 北京梧桐车联科技有限责任公司 语音音区切换方法、装置、设备及存储介质
CN113093596A (zh) * 2021-03-29 2021-07-09 北京金山云网络技术有限公司 一种控制指令的处理方法和装置
CN115249389A (zh) * 2021-04-27 2022-10-28 华为技术有限公司 提醒方法、电子设备及存储介质
US11587416B1 (en) * 2021-09-01 2023-02-21 Motorola Solutions, Inc. Dynamic video analytics rules based on human conversation
CN114442875B (zh) * 2021-12-07 2025-02-21 联想(北京)有限公司 一种控制方法、装置、电子设备及存储介质
US11800068B1 (en) * 2022-04-07 2023-10-24 Haier Us Appliance Solutions, Inc. Refrigerator camera modules and methods for conserving energy at the same
CN114979355B (zh) * 2022-05-30 2024-09-24 维沃移动通信有限公司 麦克风的控制方法、装置及电子设备
CN115361180B (zh) * 2022-08-05 2024-04-30 歌尔股份有限公司 基于物理按键的语音处理方法、电子设备、装置及介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949902B1 (en) * 2001-02-06 2015-02-03 Rovi Guides, Inc. Systems and methods for providing audio-based guidance
US20030023440A1 (en) * 2001-03-09 2003-01-30 Chu Wesley A. System, Method and computer program product for presenting large lists over a voice user interface utilizing dynamic segmentation and drill down selection
US8316408B2 (en) * 2006-11-22 2012-11-20 Verizon Patent And Licensing Inc. Audio processing for media content access systems and methods
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
KR20090115599A (ko) * 2008-05-02 2009-11-05 엘지전자 주식회사 이동 단말기 및 그 정보 처리방법
KR20120020853A (ko) * 2010-08-31 2012-03-08 엘지전자 주식회사 이동 단말기 및 그 제어방법
KR102003255B1 (ko) * 2012-06-29 2019-07-24 삼성전자 주식회사 다중 입력 처리 방법 및 장치
KR101978169B1 (ko) * 2012-10-18 2019-05-14 엘지전자 주식회사 이동 단말기 및 이의제어방법
KR102091003B1 (ko) * 2012-12-10 2020-03-19 삼성전자 주식회사 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치
US20150243163A1 (en) * 2012-12-14 2015-08-27 Biscotti Inc. Audio Based Remote Control Functionality
KR101761190B1 (ko) * 2013-02-22 2017-07-25 삼성전자 주식회사 휴대 단말기의 사용자 인터페이스 제공 방법 및 장치
KR102160767B1 (ko) * 2013-06-20 2020-09-29 삼성전자주식회사 제스처를 감지하여 기능을 제어하는 휴대 단말 및 방법
KR20150016683A (ko) * 2013-08-05 2015-02-13 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
KR20150028127A (ko) * 2013-09-05 2015-03-13 삼성전자주식회사 디스플레이 장치 및 그 제어 방법
KR102155482B1 (ko) * 2013-10-15 2020-09-14 삼성전자 주식회사 디스플레이장치 및 그 제어방법
KR102210433B1 (ko) * 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
KR102209519B1 (ko) * 2014-01-27 2021-01-29 삼성전자주식회사 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
US20150256873A1 (en) * 2014-03-04 2015-09-10 Microsoft Technology Licensing, Llc Relayed voice control of devices
US9658704B2 (en) * 2015-06-10 2017-05-23 Apple Inc. Devices and methods for manipulating user interfaces with a stylus

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10783887B2 (en) 2018-01-25 2020-09-22 Samsung Electronics Co., Ltd. Application processor including low power voice trigger system with external interrupt, electronic device including the same and method of operating the same
TWI800566B (zh) * 2018-01-25 2023-05-01 南韓商三星電子股份有限公司 包含低功率之以外部中斷的語音觸發系統的應用處理器、包含該處理器的電子裝置及其操作方法
KR20210005253A (ko) * 2018-05-16 2021-01-13 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
KR20230020019A (ko) * 2018-05-16 2023-02-09 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
US11720238B2 (en) 2018-05-16 2023-08-08 Google Llc Selecting an input mode for a virtual assistant
KR20200024484A (ko) 2018-08-28 2020-03-09 주식회사 나무엔 Stt 녹음 장치 및 이를 이용한 음성-텍스트 변환 시스템
KR20210052513A (ko) * 2018-08-30 2021-05-10 비보 모바일 커뮤니케이션 컴퍼니 리미티드 음성 처리 방법 및 이동 단말기
US12033623B2 (en) 2018-08-30 2024-07-09 Vivo Mobile Communication Co., Ltd. Speech processing method and mobile terminal
KR102167546B1 (ko) * 2019-08-22 2020-10-21 (주) 더블유엘티 다기능 무선 충전장치
WO2021060573A1 (ko) * 2019-09-24 2021-04-01 엘지전자 주식회사 영상표시장치 및 이의 음성 인식 방법
US12266348B2 (en) 2019-09-24 2025-04-01 Lg Electronics Inc. Image display device and voice recognition method therefor

Also Published As

Publication number Publication date
WO2017069595A1 (en) 2017-04-27
CN107924288A (zh) 2018-04-17
EP3160150A1 (en) 2017-04-26
US20170116987A1 (en) 2017-04-27

Similar Documents

Publication Publication Date Title
US10969954B2 (en) Electronic device for processing user input and method for processing user input
KR20170046958A (ko) 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법
KR102264806B1 (ko) 스크린 미러링 서비스 제공방법 및 장치
KR102324074B1 (ko) 사운드 출력 제어 방법 및 전자 장치
KR20180083587A (ko) 전자 장치 및 그의 동작 방법
KR20180042725A (ko) 전자 장치 및 전자 장치의 멀티미디어 콘텐트 재생 방법
KR20170086814A (ko) 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR20180080629A (ko) 전자 장치 및 전자 장치의 어플리케이션 실행 히스토리 표시 방법
KR20160063068A (ko) 전자 장치, 그 동작 방법 및 기록 매체
KR102391487B1 (ko) 충전 및 데이터 통신 경로 제어 방법 및 이를 구현한 전자 장치
KR102500608B1 (ko) 어플리케이션을 제어하는 전자 장치와 이의 동작 방법
KR20170097835A (ko) 스마트 홈 시스템에서 스마트 홈 장치를 등록하기 위한 전자 장치 및 방법
CN108475329B (zh) 电子设备及其操作方法
KR20160140059A (ko) 장치 간의 입력 처리 방법 및 이를 구현하는 전자 장치
US12147818B2 (en) Electronic apparatus for launching an application in a state where a lock function is set and operating method thereof
KR20170061473A (ko) 알림을 제공하기 위한 방법 및 그 전자 장치
KR20170109408A (ko) 전자 장치 및 전자 장치 제어 방법
KR20170042165A (ko) 전자 장치의 모니터링 방법 및 장치
KR102458444B1 (ko) 전자 장치 및 그 동작 방법
KR20180052429A (ko) 데이터 전송 방법 및 이를 지원하는 전자 장치
KR20170127809A (ko) 전자 장치 및 전자 장치에서의 정보 제공 방법
KR20180014569A (ko) 근거리 무선 통신 네트워크에서 스캔 방법 및 이를 구현하는 전자 장치
KR20170109401A (ko) 전자 장치 및 그 제어 방법
KR20180076863A (ko) 외부 장치를 연결하는 방법 및 이를 지원하는 전자 장치
KR20170098112A (ko) 전자 장치 및 그의 동작 방법

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20151022

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination