KR101883301B1 - 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 - Google Patents
인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 Download PDFInfo
- Publication number
- KR101883301B1 KR101883301B1 KR1020170004094A KR20170004094A KR101883301B1 KR 101883301 B1 KR101883301 B1 KR 101883301B1 KR 1020170004094 A KR1020170004094 A KR 1020170004094A KR 20170004094 A KR20170004094 A KR 20170004094A KR 101883301 B1 KR101883301 B1 KR 101883301B1
- Authority
- KR
- South Korea
- Prior art keywords
- service
- voice
- speaker
- providing server
- service providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 개인 맞춤형 음성 인식 서비스를 제공하는 서비스 제공 서버의 구조를 나타낸 기능 블록도, 및
도 3은 본 발명의 일 실시예에 따른 개인 맞춤형 음성 인식 서비스 제공 방법의 실행 과정을 설명하는 신호 흐름도이다.
사용자 ID | 성별 | 연령 | 등록 음성 데이터 | 선호 콘텐츠 정보 |
USER1 | 여자 | 35세 | DATA1 | 미국드라마 / 가족영화 / 최신가요 |
USER2 | 남자 | 39세 | DATA2 | 액션 영화 / 영어학습 / 올드팝 |
USER3 | 남자 | 14세 | DATA3 | 가족영화 / 액션영화 / 힙합음악 |
300: 외부 전자 기기.
Claims (2)
- (a) 서비스 제공 서버가, 사용자 단말기로부터 화자의 음성이 포함된 서비스 제공 요청 메시지를 수신하는 단계;
(b) 상기 서비스 제공 서버가, 상기 서비스 제공 요청 메시지에 포함된 상기 음성을 분석하여 상기 음성의 화자를 식별하는 단계;
(c) 상기 서비스 제공 서버가, 화자 식별 정보에 기초하여 상기 화자를 위한 맞춤형 서비스 제공에 필요한 제어 명령을 생성하는 단계;
(d) 상기 서비스 제공 서버가, 기 등록되어 있는 외부 전자 기기 중에서 상기 제어 명령을 실행할 외부 전자 기기를 선택하는 단계; 및
(e) 상기 서비스 제공 서버가, 생성된 상기 제어 명령을 외부 전자 기기로 송신하는 단계
를 포함하며,
상기 (b) 단계는,
(b1) 상기 서비스 제공 서버가, 상기 음성 중 서비스 호출 부분에 대한 문장 종속형 화자 식별을 실행하는 단계; 및
(b2) 상기 서비스 제공 서버가, 상기 음성 중 서비스 요청 부분에 대한 문장 독립형 화자 식별을 실행하는 단계
를 포함하는 것인 개인 맞춤형 음성 인식 서비스 제공 방법.
- 사용자 단말기로부터 화자의 음성이 포함된 서비스 제공 요청 메시지를 수신하는 수신부;
상기 서비스 제공 요청 메시지에 포함된 상기 음성을 분석하여 상기 음성의 화자를 식별하는 화자 식별부;
상기 화자 식별부가 생성한 화자 식별 정보에 기초하여 상기 화자를 위한 맞춤형 서비스 제공에 필요한 제어 명령을 생성하고, 기 등록되어 있는 외부 전자 기기 중에서 상기 제어 명령을 실행할 외부 전자 기기를 선택하는 판단부; 및
상기 제어 명령을 외부 전자 기기로 송신하는 송신부
를 포함하며,
상기 화자 식별부는, 상기 음성 중 서비스 호출 부분에 대한 문장 종속형 화자 식별을 실행하고, 상기 음성 중 서비스 요청 부분에 대한 문장 독립형 화자 식별을 실행하는 것인 서비스 제공 서버.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170004094A KR101883301B1 (ko) | 2017-01-11 | 2017-01-11 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
US16/477,330 US11087768B2 (en) | 2017-01-11 | 2017-04-07 | Personalized voice recognition service providing method using artificial intelligence automatic speaker identification method, and service providing server used therein |
JP2019558316A JP6909311B2 (ja) | 2017-01-11 | 2017-04-07 | 人工知能自動話者識別方法を用いる個人カスタマイズ型音声認識サービスの提供方法及びこれに使用されるサービス提供サーバ |
PCT/KR2017/003807 WO2018131752A1 (ko) | 2017-01-11 | 2017-04-07 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170004094A KR101883301B1 (ko) | 2017-01-11 | 2017-01-11 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180082783A KR20180082783A (ko) | 2018-07-19 |
KR101883301B1 true KR101883301B1 (ko) | 2018-07-30 |
Family
ID=62839511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170004094A Active KR101883301B1 (ko) | 2017-01-11 | 2017-01-11 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11087768B2 (ko) |
JP (1) | JP6909311B2 (ko) |
KR (1) | KR101883301B1 (ko) |
WO (1) | WO2018131752A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200075339A (ko) | 2018-12-18 | 2020-06-26 | 전자부품연구원 | 화자인식 장치 및 방법 |
WO2020184753A1 (ko) * | 2019-03-12 | 2020-09-17 | 엘지전자 주식회사 | 음성 추출 필터를 이용하여 음성 제어를 수행하는 인공 지능 장치 및 그 방법 |
US11710498B2 (en) | 2019-02-11 | 2023-07-25 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101883301B1 (ko) * | 2017-01-11 | 2018-07-30 | (주)파워보이스 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
US10258295B2 (en) | 2017-05-09 | 2019-04-16 | LifePod Solutions, Inc. | Voice controlled assistance for monitoring adverse events of a user and/or coordinating emergency actions such as caregiver communication |
KR102574903B1 (ko) * | 2018-08-08 | 2023-09-05 | 삼성전자주식회사 | 개인화된 장치 연결을 지원하는 전자 장치 및 그 방법 |
CN109102803A (zh) * | 2018-08-09 | 2018-12-28 | 珠海格力电器股份有限公司 | 家电设备的控制方法、装置、存储介质及电子装置 |
CN109117235B (zh) | 2018-08-24 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 一种业务数据处理方法、装置以及相关设备 |
CN111862974A (zh) | 2020-07-15 | 2020-10-30 | 广州三星通信技术研究有限公司 | 智能设备的控制方法及智能设备 |
US11410655B1 (en) | 2021-07-26 | 2022-08-09 | LifePod Solutions, Inc. | Systems and methods for managing voice environments and voice routines |
US11404062B1 (en) | 2021-07-26 | 2022-08-02 | LifePod Solutions, Inc. | Systems and methods for managing voice environments and voice routines |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017003611A (ja) * | 2015-06-04 | 2017-01-05 | シャープ株式会社 | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774858A (en) * | 1995-10-23 | 1998-06-30 | Taubkin; Vladimir L. | Speech analysis method of protecting a vehicle from unauthorized accessing and controlling |
US20030171930A1 (en) * | 2002-03-07 | 2003-09-11 | Junqua Jean-Claude | Computer telephony system to access secure resources |
KR20050023941A (ko) * | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 |
JP2005086768A (ja) * | 2003-09-11 | 2005-03-31 | Toshiba Corp | 制御装置、制御方法およびプログラム |
KR20080023033A (ko) * | 2006-09-08 | 2008-03-12 | 한국전자통신연구원 | 지능형 로봇 서비스 시스템에서 무선 마이크로폰을 이용한화자 인식 방법 및 장치 |
US8442824B2 (en) * | 2008-11-26 | 2013-05-14 | Nuance Communications, Inc. | Device, system, and method of liveness detection utilizing voice biometrics |
KR101330328B1 (ko) | 2010-12-14 | 2013-11-15 | 한국전자통신연구원 | 음성 인식 방법 및 이를 위한 시스템 |
US9489950B2 (en) * | 2012-05-31 | 2016-11-08 | Agency For Science, Technology And Research | Method and system for dual scoring for text-dependent speaker verification |
KR20140119968A (ko) * | 2013-04-01 | 2014-10-13 | 삼성전자주식회사 | 콘텐츠 서비스 방법 및 시스템 |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
US20150025888A1 (en) * | 2013-07-22 | 2015-01-22 | Nuance Communications, Inc. | Speaker recognition and voice tagging for improved service |
JP6054283B2 (ja) * | 2013-11-27 | 2016-12-27 | シャープ株式会社 | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法 |
EP2980733A1 (en) * | 2014-07-31 | 2016-02-03 | Samsung Electronics Co., Ltd | Message service providing device and method of providing content via the same |
KR102249392B1 (ko) | 2014-09-02 | 2021-05-07 | 현대모비스 주식회사 | 사용자 맞춤형 서비스를 위한 차량 기기 제어 장치 및 방법 |
KR102383791B1 (ko) * | 2014-12-11 | 2022-04-08 | 삼성전자주식회사 | 전자 장치에서의 개인 비서 서비스 제공 |
KR101883301B1 (ko) * | 2017-01-11 | 2018-07-30 | (주)파워보이스 | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 |
-
2017
- 2017-01-11 KR KR1020170004094A patent/KR101883301B1/ko active Active
- 2017-04-07 WO PCT/KR2017/003807 patent/WO2018131752A1/ko active Application Filing
- 2017-04-07 US US16/477,330 patent/US11087768B2/en active Active
- 2017-04-07 JP JP2019558316A patent/JP6909311B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017003611A (ja) * | 2015-06-04 | 2017-01-05 | シャープ株式会社 | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200075339A (ko) | 2018-12-18 | 2020-06-26 | 전자부품연구원 | 화자인식 장치 및 방법 |
US11710498B2 (en) | 2019-02-11 | 2023-07-25 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
WO2020184753A1 (ko) * | 2019-03-12 | 2020-09-17 | 엘지전자 주식회사 | 음성 추출 필터를 이용하여 음성 제어를 수행하는 인공 지능 장치 및 그 방법 |
US11468886B2 (en) | 2019-03-12 | 2022-10-11 | Lg Electronics Inc. | Artificial intelligence apparatus for performing voice control using voice extraction filter and method for the same |
Also Published As
Publication number | Publication date |
---|---|
US20190378518A1 (en) | 2019-12-12 |
JP6909311B2 (ja) | 2021-07-28 |
KR20180082783A (ko) | 2018-07-19 |
US11087768B2 (en) | 2021-08-10 |
WO2018131752A1 (ko) | 2018-07-19 |
JP2020504413A (ja) | 2020-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101883301B1 (ko) | 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버 | |
KR102213637B1 (ko) | 디바이스들 간의 상태 상호작용의 캡슐화 및 동기화 | |
US12046241B2 (en) | Device leadership negotiation among voice interface devices | |
JP7225301B2 (ja) | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション | |
CN110800044B (zh) | 用于语音助手系统的话语权限管理 | |
EP3520100B1 (en) | Noise mitigation for a voice interface device | |
JP6783339B2 (ja) | 音声を処理する方法及び装置 | |
CN112136102B (zh) | 信息处理装置、信息处理方法以及信息处理系统 | |
KR20220053795A (ko) | 인공지능 비서 서비스 제공 시스템 및 방법 | |
KR102276591B1 (ko) | 음성 기반 추천서비스장치 및 그 장치의 동작 방법 | |
US20220217191A1 (en) | Method and device to manage audio and/or video sources during a streaming session |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170111 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20180112 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20180711 |
|
PG1501 | Laying open of application | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180724 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20180724 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20210726 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20220725 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20230724 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20240613 Start annual number: 7 End annual number: 7 |