KR102339085B1 - 사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 - Google Patents
사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 Download PDFInfo
- Publication number
- KR102339085B1 KR102339085B1 KR1020190088516A KR20190088516A KR102339085B1 KR 102339085 B1 KR102339085 B1 KR 102339085B1 KR 1020190088516 A KR1020190088516 A KR 1020190088516A KR 20190088516 A KR20190088516 A KR 20190088516A KR 102339085 B1 KR102339085 B1 KR 102339085B1
- Authority
- KR
- South Korea
- Prior art keywords
- user
- intention
- application
- language model
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
도 2는 본 발명의 일 실시 예에 따른 AI 서버(200)를 나타낸다.
도 3은 본 발명의 일 실시 예에 따른 AI 시스템(1)을 나타낸다.
도 4는 본 발명의 일 실시 예에 따른 AI 장치(100)를 나타낸다.
도 5는 본 발명의 일 실시 예에 따른 사용자의 어플리케이션 사용을 고려하여 사용자의 음성을 인식하는 방법을 나타낸 동작 흐름도이다.
도 6은 본 발명의 일 실시 예에 따른 사용자의 의도 인식의 성공 여부를 판단하는 과정을 나타낸 도면이다.
도 7은 도 5에 도시된 언어 모델을 갱신하는 단계(S513)의 일 예를 나타낸 동작 흐름도이다.
도 8 및 9는 본 발명의 일 실시 예에 따른 사용자의 음성을 인식하는 방법을 나타낸 도면이다.
Claims (14)
- 사용자의 음성을 인식하는 인공 지능 장치에 있어서,
마이크로폰; 및
상기 마이크로폰을 통해 상기 사용자의 발화 음성에 상응하는 소리 신호를 수신하고, 언어 모델(Language Model)을 이용하여 상기 소리 신호로부터 상기 발화 음성을 인식하고, 상기 인식 결과에 기초하여 사용자의 의도를 결정하고, 상기 의도의 결정이 성공적인지 판단하고, 상기 의도의 결정이 성공적이지 않은 경우, 상기 사용자가 발화한 상기 발화 음성을 수신한 시점에, 상기 인공 지능 장치에서, 실행 중인 어플리케이션의 사용 기록을 수집하고, 상기 수집된 어플리케이션 사용 기록을 이용하여 상기 언어 모델을 갱신하는 프로세서를 포함하고,
상기 어플리케이션의 사용 기록은
실행된 어플리케이션의 종류 및 상기 실행된 어플리케이션에 대한 상기 사용자의 조작 내용을 포함하는,
인공 지능 장치. - 청구항 1에 있어서,
상기 프로세서는
상기 언어 모델에 따른 상기 인식 결과와 상기 어플리케이션 사용 기록을 비교하여 상기 어플리케이션 사용 기록으로부터 상기 언어 모델의 갱신에 이용될 제1 키워드를 추출하고, 상기 제1 키워드에 기초하여 상기 언어 모델을 갱신하는, 인공 지능 장치. - 청구항 2에 있어서,
상기 프로세서는
상기 인식 결과에서 상기 제1 키워드에 상응하는 제2 키워드를 추출하고, 상기 언어 모델에 대하여 제2 키워드를 제1 키워드로 매핑하여 상기 언어 모델을 갱신하는, 인공 지능 장치. - 청구항 1에 있어서,
상기 프로세서는
상기 의도의 결정에 대한 신뢰도를 산출하고, 상기 산출한 신뢰도에 기초하여 상기 의도의 결정이 성공적인지 여부를 판단하는, 인공 지능 장치. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 청구항 1에 있어서,
외부 장치와 데이터를 송수신하는 통신부
를 더 포함하고,
상기 어플리케이션 사용 기록은
상기 외부 장치에서의 어플리케이션의 사용 기록을 포함하는, 인공 지능 장치. - 청구항 1에 있어서,
상기 프로세서는
상기 어플리케이션 사용 기록을 수집할 권한이 존재하는지 여부를 판단하고, 상기 권한이 존재하지 않는 경우에 상기 권한을 획득하기 위한 알림을 출력하는, 인공 지능 장치. - 인공 지능 장치의 사용자의 음성을 인식하는 방법에 있어서,
상기 사용자의 발화 음성에 상응하는 소리 신호를 수신하는 단계;
언어 모델을 이용하여 상기 소리 신호로부터 상기 발화 음성을 인식하는 단계;
상기 인식 결과에 기초하여 사용자의 의도를 결정하는 단계;
상기 의도의 결정이 성공적인지 판단하는 단계;
상기 의도의 결정이 성공적이지 않은 경우, 상기 사용자가 발화한 상기 발화 음성을 수신한 시점에, 상기 인공 지능 장치에서, 실행 중인 어플리케이션의 사용 기록을 수집하는 단계; 및
상기 수집된 어플리케이션 사용 기록을 이용하여 상기 언어 모델을 갱신하는 단계를 포함하고,
상기 어플리케이션의 사용 기록은
실행된 어플리케이션의 종류 및 상기 실행된 어플리케이션에 대한 상기 사용자의 조작 내용을 포함하는,
방법. - 사용자의 음성을 인식하는 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 비활성 기록 매체에 있어서,
상기 사용자의 음성을 인식하는 방법은
상기 사용자의 발화 음성에 상응하는 소리 신호를 수신하는 단계;
언어 모델을 이용하여 상기 소리 신호로부터 상기 발화 음성을 인식하는 단계;
상기 인식 결과에 기초하여 사용자의 의도를 결정하는 단계;
상기 의도의 결정이 성공적인지 판단하는 단계;
상기 의도의 결정이 성공적이지 않은 경우, 상기 사용자가 발화한 상기 발화 음성을 수신한 시점에, 실행 중인 어플리케이션 사용 기록을 수집하는 단계; 및
상기 수집된 어플리케이션 사용 기록을 이용하여 상기 언어 모델을 갱신하는 단계를 포함하고,
상기 어플리케이션의 사용 기록은
실행된 어플리케이션의 종류 및 상기 실행된 어플리케이션에 대한 상기 사용자의 조작 내용을 포함하는,
컴퓨터로 판독 가능한 비활성 기록 매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190088516A KR102339085B1 (ko) | 2019-07-22 | 2019-07-22 | 사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 |
US16/539,773 US11398222B2 (en) | 2019-07-22 | 2019-08-13 | Artificial intelligence apparatus and method for recognizing speech of user in consideration of user's application usage log |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190088516A KR102339085B1 (ko) | 2019-07-22 | 2019-07-22 | 사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190098089A KR20190098089A (ko) | 2019-08-21 |
KR102339085B1 true KR102339085B1 (ko) | 2021-12-14 |
Family
ID=67808083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190088516A Active KR102339085B1 (ko) | 2019-07-22 | 2019-07-22 | 사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11398222B2 (ko) |
KR (1) | KR102339085B1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110544470B (zh) * | 2019-09-11 | 2022-03-29 | 拉扎斯网络科技(上海)有限公司 | 语音识别方法、装置、可读存储介质和电子设备 |
CN110784384B (zh) * | 2019-10-16 | 2021-11-02 | 杭州九阳小家电有限公司 | 一种家电语音技能的生成方法及智能家电 |
KR102764896B1 (ko) * | 2019-12-30 | 2025-02-07 | 현대오토에버 주식회사 | 사용자 발화 의도 인식을 위한 시스템, 서버 및 방법 |
CN115066662A (zh) | 2020-01-10 | 2022-09-16 | 马格纳电子系统公司 | 通信系统和方法 |
CN111369981B (zh) * | 2020-03-02 | 2024-02-23 | 北京远鉴信息技术有限公司 | 一种方言地域识别方法、装置、电子设备及存储介质 |
KR102518448B1 (ko) * | 2021-05-14 | 2023-04-06 | (주)와이즈에이아이 | 인공지능 챗봇 기반 자동 콜 응대 서비스 시스템 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130227352A1 (en) * | 2012-02-24 | 2013-08-29 | Commvault Systems, Inc. | Log monitoring |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6125347A (en) * | 1993-09-29 | 2000-09-26 | L&H Applications Usa, Inc. | System for controlling multiple user application programs by spoken input |
US6952800B1 (en) * | 1999-09-03 | 2005-10-04 | Cisco Technology, Inc. | Arrangement for controlling and logging voice enabled web applications using extensible markup language documents |
JP4281543B2 (ja) * | 2003-12-16 | 2009-06-17 | 日産自動車株式会社 | 車両用運転操作補助装置および車両用運転操作補助装置を備えた車両 |
AU2012236649A1 (en) * | 2011-03-28 | 2013-10-31 | Ambientz | Methods and systems for searching utilizing acoustical context |
CN105074700A (zh) * | 2013-03-01 | 2015-11-18 | 奎克西公司 | 产生含有到应用程序的状态链接的搜索结果 |
US20150370787A1 (en) * | 2014-06-18 | 2015-12-24 | Microsoft Corporation | Session Context Modeling For Conversational Understanding Systems |
US20160071517A1 (en) * | 2014-09-09 | 2016-03-10 | Next It Corporation | Evaluating Conversation Data based on Risk Factors |
KR102386863B1 (ko) | 2015-09-09 | 2022-04-13 | 삼성전자주식회사 | 사용자 기반 언어 모델 생성 장치, 방법 및 음성 인식 장치 |
KR102429583B1 (ko) * | 2016-12-14 | 2022-08-05 | 삼성전자주식회사 | 전자 장치, 그의 가이드 제공 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
KR102502220B1 (ko) | 2016-12-20 | 2023-02-22 | 삼성전자주식회사 | 전자 장치, 그의 사용자 발화 의도 판단 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
KR20180074210A (ko) * | 2016-12-23 | 2018-07-03 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 인식 방법 |
CN108665890B (zh) * | 2017-03-28 | 2023-10-13 | 三星电子株式会社 | 操作语音识别服务的方法、电子设备和支持该设备的系统 |
KR102421745B1 (ko) * | 2017-08-22 | 2022-07-19 | 삼성전자주식회사 | Tts 모델을 생성하는 시스템 및 전자 장치 |
US11069346B2 (en) * | 2019-04-22 | 2021-07-20 | International Business Machines Corporation | Intent recognition model creation from randomized intent vector proximities |
-
2019
- 2019-07-22 KR KR1020190088516A patent/KR102339085B1/ko active Active
- 2019-08-13 US US16/539,773 patent/US11398222B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130227352A1 (en) * | 2012-02-24 | 2013-08-29 | Commvault Systems, Inc. | Log monitoring |
Also Published As
Publication number | Publication date |
---|---|
KR20190098089A (ko) | 2019-08-21 |
US11398222B2 (en) | 2022-07-26 |
US20190371297A1 (en) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102281515B1 (ko) | 개인화 언어 모델을 이용하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 | |
US11663516B2 (en) | Artificial intelligence apparatus and method for updating artificial intelligence model | |
KR102331675B1 (ko) | 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 | |
US11495214B2 (en) | Artificial intelligence device for providing voice recognition service and method of operating the same | |
KR102339085B1 (ko) | 사용자의 어플리케이션 사용 기록을 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 | |
KR102281602B1 (ko) | 사용자의 발화 음성을 인식하는 인공 지능 장치 및 그 방법 | |
KR20210057611A (ko) | 이미지 데이터에 포함된 객체를 인식하는 인공 지능 장치 및 그 방법 | |
KR20210072362A (ko) | 인공 지능 모델에 대한 학습 데이터를 생성하는 인공 지능 장치 및 그 방법 | |
KR102421488B1 (ko) | 복수개의 출력 레이어를 이용한 인공 지능 장치 및 방법 | |
US11322134B2 (en) | Artificial intelligence device and operating method thereof | |
KR20190099167A (ko) | 음성 인식을 수행하는 인공 지능 기기 | |
US20210334640A1 (en) | Artificial intelligence server and method for providing information to user | |
US11810575B2 (en) | Artificial intelligence robot for providing voice recognition function and method of operating the same | |
KR102412308B1 (ko) | 장치 간 연동에 기초한 장치 제어 기능을 제공하는 인공 지능 장치 및 그 방법 | |
KR20210079666A (ko) | 음향 모델을 학습시키기 위한 인공 지능 장치 | |
KR20210081103A (ko) | 복수의 언어를 포함하는 음성을 인식하는 인공 지능 장치 및 그 방법 | |
KR102331672B1 (ko) | 사용자의 위치를 결정하는 인공 지능 장치 및 그 방법 | |
KR20190106905A (ko) | 인공지능 전자기기 | |
KR20210066328A (ko) | 자연어 이해 모델을 학습시키기 위한 인공 지능 장치 | |
KR20190107616A (ko) | 개체명 테이블을 생성하는 인공 지능 장치 및 그 방법 | |
KR20190098934A (ko) | 인공 지능을 이용하여, 안내 서비스를 제공하는 로봇 및 그의 동작 방법 | |
KR102327441B1 (ko) | 인공지능 장치 | |
KR102229562B1 (ko) | 음성 인식 서비스를 제공하는 인공 지능 장치 및 그의 동작 방법 | |
KR20210052958A (ko) | 인공 지능 서버 | |
KR20190095195A (ko) | 사용자의 동선에 기초한 서비스를 제공하는 인공 지능 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190722 |
|
PA0201 | Request for examination | ||
G15R | Request for early publication | ||
PG1501 | Laying open of application |
Comment text: Request for Early Opening Patent event code: PG15011R01I Patent event date: 20190801 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20201129 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210507 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211126 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20211209 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20211210 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |