JP2019015951A - 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 - Google Patents
電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 Download PDFInfo
- Publication number
- JP2019015951A JP2019015951A JP2018047963A JP2018047963A JP2019015951A JP 2019015951 A JP2019015951 A JP 2019015951A JP 2018047963 A JP2018047963 A JP 2018047963A JP 2018047963 A JP2018047963 A JP 2018047963A JP 2019015951 A JP2019015951 A JP 2019015951A
- Authority
- JP
- Japan
- Prior art keywords
- electronic device
- wake
- audio data
- file
- data files
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- User Interface Of Digital Computer (AREA)
- Stored Programmes (AREA)
Abstract
【課題】色々な提示音声を提供でき、色々なウェイクアップ提示を提供する。【解決手段】電子機器をウェイクアップさせるためのユーザの音声ウェイクアップ指示を取得し、さらに、この音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、前記電子機器のウェイクアップ応答ファイルを再生する。【選択図】図1
Description
本発明は、ウェイクアップ技術に関し、特に、電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体に関する。
人工知能(Artificial Intelligence)の英語略語はAIである。これは、人間の知能を模擬し、伸ばし、拡張する論理、方法、技術及び応用システムを研究、開発する新たな技術科学である。人工知能は、コンピュータ科学の1つの分枝であり、知能の実体に対する了解を意図とし、人類の知能に似ている方式で反応される新たな知能機器を生産する。この分野の研究は、ロボット、言語識別、映像識別、自然言語処理及び専門家システム等がある。
近年、音声対話機能を有する電子デバイス、例えば、知能サウンドボックス等が絶えずに出現し、それは通常音声ウェイクアップ方式でウェイクアップされる。今の音声ウェイクアップ方式は、単一な提示音をウェイクアップ提示として提供し、形式が単一である。
本発明の複数の方面は、色々なウェイクアップ提示を提供する電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体を提供する。
本発明の一方面は、
電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとし、
前記電子機器のウェイクアップ応答ファイルを再生することを含む
電子機器のウェイクアップ方法を提供する。
電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとし、
前記電子機器のウェイクアップ応答ファイルを再生することを含む
電子機器のウェイクアップ方法を提供する。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする前に、さらに、
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、
前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成することを含む。
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、
前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成することを含む。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成した後、さらに、
前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させることを含む。
前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させることを含む。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとするには、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む。
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとするには、
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む。
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む。
本発明の他の一方面は、
電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を獲得する獲得手段と、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする選択手段と、
前記電子機器のウェイクアップ応答ファイルを再生する再生手段とを含む電子機器のウェイクアップ装置を提供する。
電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を獲得する獲得手段と、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする選択手段と、
前記電子機器のウェイクアップ応答ファイルを再生する再生手段とを含む電子機器のウェイクアップ装置を提供する。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記装置は、さらに、
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成する生成手段を含む。
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成する生成手段を含む。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記生成手段は、さらに、
前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させる。
前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させる。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記選択手段は、具体的に、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
前記の方面といずれか一つの可能な実現方式によると、さらに一実現方式を提供するが、前記選択手段は、具体的に、
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
本発明の他の一方面は、
一つ又は複数のプロセッサーと、
一つ又は複数のプログラムを記憶する記憶装置とを含むデバイスであって、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが前記一方面で提供する電子機器の方法を実現するデバイスを提供する。
一つ又は複数のプロセッサーと、
一つ又は複数のプログラムを記憶する記憶装置とを含むデバイスであって、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが前記一方面で提供する電子機器の方法を実現するデバイスを提供する。
本発明の他の一方面は、
コンピュータプログラムを記憶するコンピュータ可読記憶媒体であって、
前記プログラムがプロセッサーによって実行されると、前記一方面で提供する電子機器のウェイクアップ方法を実現する
コンピュータ可読記憶媒体を提供する。
コンピュータプログラムを記憶するコンピュータ可読記憶媒体であって、
前記プログラムがプロセッサーによって実行されると、前記一方面で提供する電子機器のウェイクアップ方法を実現する
コンピュータ可読記憶媒体を提供する。
前記技術案によると、本発明の実施例は、電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、さらに、この音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、前記電子機器のウェイクアップ応答ファイルを再生することができるようにし、選択可能なオーディオファイルが複数であるので、色々な提示音声を提供でき、色々なウェイクアップ提示を提供する目的を実現する。
また、本発明で提供する技術案を利用すると、声紋特徴を利用して、どのユーザーが電子デバイスをウェイクアップしているかを正確に識別でき、当該ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、ユーザーに個性的な提示音を提供でき、さらに色々なウェイクアップ提示を提供する目的を実現する。
また、本発明で提供する技術案を利用すると、ユーザーの体験を有効に向上できる。
本発明の実施例における技術案をより明瞭に説明するために、以下では、実施例又は従来の技術の記載に必要な図面を簡単に紹介し、以下に記載した図面は本発明の一部の実施例で、本分野の当業者であれば、創造的な労働をしなく、これらの図面によって他の図面を得られるのは容易なことである。
本発明の実施例の目的、技術案及び利点をより明確にするために、以下では、本発明の実施例における図面を利用して本発明の実施例の技術案を明確で完全に記述する。記述する実施例はただ本発明の一部の実施例で、全部の実施例ではないことは言うまでもない。本分野の当業者が本発明における実施例に基づいて、創造的な労働をしない前提で獲得する全部の他の実施例は、いずれも本発明の保護範囲に属する。
ここで、本発明の実施例に関する端末は、携帯電話、パーソナルデータアシスタント(Personal Digital Assistant、PDA)、無線携帯デバイス、タブレットコンピューター(Tablet Computer)、パーソナルコンピューター(Personal Computer、PC)、MP3プレイヤー、MP4プレイヤー、着用デバイス(例えば、スマート眼鏡、智能腕時計、スマートブレスレット(Smart Bracelet)等)等を含んでいてもよいが、これらに限定されない。
また、本文で使用する用語「と/または」は、ただ関連対象の関連関係を表示するもので、三つの関係が可能である。例えば、Aと/またはBは、ただAだけ存在する場合と、AとBが同時に存在する場合と、ただBだけ存在する場合の三つの可能性がある。また、本文で符号「/」は、一般的に前後関連対象が「または」の関係であることを示す。
図1は、本発明の一実施例で提供する電子機器のウェイクアップ方法のフロチャートであり、図1に示すようである。
101で、電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得する。
102で、前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
103で、前記電子機器のウェイクアップ応答ファイルを再生する。
ここで、101の後、ユーザーの音声ウェイクアップ指示を獲得してから、電子デバイスは、従来の技術における技術案を利用して、音声ウェイクアップ指示に基づいて、関連するウェイクアップ操作を実行して動作状態に入ってもよく、詳細の記述は従来の技術における関連内容を参照してもよい。
ここで、101~103の実行主体の一部又は全部は、電子デバイスに位置しているアプリ、またはローカル端末に位置しているアプリであってもよく、またはローカル端末に位置しているアプリに設置されているプラグインまたはソフトウェア開発キット(Software Development Kit、SDK)等の機能手段であってもよく、またはネットワーク側のサーバーにある処理エンジンであってもよく、またはネットワーク側にある分布式システムであってもよく、本実施例ではこれに対して特別に限定しない。
ここで、前記アプリは、端末にインストールしたネイティブアプリ(nativeApp)であってもよく、または端末におけるブラウザー上の一つのウェブページアプリ(webApp)であってもよく、本実施例ではこれに対して特別に限定しない。
このようにして、電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、さらに、この音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、前記電子機器のウェイクアップ応答ファイルを再生することができるようにし、選択可能なオーディオファイルが複数であるので、色々な提示音声を提供でき、色々なウェイクアップ提示を提供する目的を実現する。
今、家庭用のパーソナルコンピュータ、インテリジェントホーム機器、テレビボックスなどの操作システムを有するシステムは、何れもシステムスリープ機能を有し、一定条件を満足すると、スリープ状態に入り、例えば、電子機器は、一部の機能を閉じて、一部のウェイクアップ機能と電源を残す。これにより、当該電子機器の電力利用量を節約することができるとともに、電子機器の損失を低減でき、電子機器の寿命を延ばすことができる。
好ましくは、本実施例の1つの可能な実現形態で、101の前に、電子デバイスは既にスリープ状態になっている。
好ましくは、本実施例の1つの可能な実現形態で、101の前に、さらに、ある特定な音声指示を設置して、音声ウェイクアップ指示とし、例えば、「はい、始めましょう」等を設置してもよい。
好ましくは、本実施例の1つの可能な実現形態で、101で、具体的に、音声収集装置を利用して、前記ユーザーが提供する音声ウェイクアップ指示を獲得してもよい。ここで、前記音声収集装置は、電子デバイスに内装又は外装したマイクロフォン等であってもよく、本実施例ではこれを特別に限定しない。
好ましくは、本実施例の1つの可能な実現形態で、102の前で、さらに、少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得すると、さらに、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、テキストトゥスピーチ(Text To Speech、TTS)の技術を利用して、前記少なくとも2つのオーディオデータファイルを生成してもよい。
ここで、前記音声パラメーターは、ピッチパラメーター、トーンパラメーター、音量パラメーター、音質パラメーター、音声スピードパラメーター及び音響効果パラメーターにおける少なくとも1つを含んでいてもよいが、本実施例ではこれを特別に限定しない。
所謂音声パラメーターとは、例えば、男の音、女の音、子供の音、アニメーション人物の音声等の音声役割を特定できる関連パラメーターを示してもよく、本実施例ではこれを特別に限定しない。
具体的に、この実現形態で、ローカルの方式を利用して、前記少なくとも2つのオーディオデータファイルを生成してもよく、又は、クラウドの方式で、前記少なくとも2つのオーディオデータファイルを生成してもよく、本実施例ではこれを特別に限定しない。
さらに、前記少なくとも2つのオーディオデータファイルを生成してから、さらに前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させる。
例えば、電子デバイスが前記少なくとも2つのオーディオデータファイルを生成してから、生成した前記少なくとも2つのオーディオデータファイルを、音声役割に従って、それぞれ電子機器の対応するディレクトリに記憶してもよい。
または、例えば、ユーザーは、電子デバイスに対応する端末上のアプリを利用して、自分の好みに従って、前記少なくとも2つのオーディオデータファイルを生成することを制御するための音声パラメーターを提供してもよい。例えば、電子デバイスに対応する端末上のアプリを利用して、音声パラメーターを電子デバイスへ発送し、電子デバイスによって前記少なくとも2つのオーディオデータファイルを生成する。または、例えば、電子デバイスに対応する端末上のアプリまたは当該アプリに対応するサーバーを利用して、前記少なくとも2つのオーディオデータファイルを生成する。その後、生成した前記少なくとも2つのオーディオデータファイルを、音声役割に従って、それぞれ電子機器の対応するディレクトリにダウンロードしてもよい。
好ましくは、本実施例の1つの可能な実現形態で、102で、具体的に、前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
好ましくは、本実施例の1つの可能な実現形態で、102で、具体的に、前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、さらに、前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとしてもよい。
所謂声紋特徴とは、1つのオーディオデータに専属の特徴で、1セグメントのオーディオデータの重要な音声学特徴を代表できる内容に基づくデジタル署名であってもよく、その主な目的は、有効な構成を構築して2つのオーディオデータの感じ聴覚品質を比較することである。ここで、通常、大きいオーディオデータ自身を直接に比較することではなく、それに対して小さい声紋特徴を比較する。
1つの具体的な実現過程で、前記声紋特徴は、人類の発音構造の解剖学的構造の関係する音響学の特徴、例えば、周波数スペクトル、サプスペクトル(sepstrum)、フォルマント、基音、反射係数等を含んでいてもよいが、これらに限定されない。
具体的に、前記ユーザーの音声ウェイクアップ指示をサンプリングし、量化及びコーディング処理を行って、PCMデータを獲得して、ユーザーオーディオデータとする。その後に、前記ユーザーオーディオデータに対してフレーム分離処理を行って、少なくとも1つのフレームのデータを獲得し、さらに少なくとも1つのフレームデータにおける各フレームデータに対してオーディオ分析処理を行って、各フレームのデータの声紋特徴を獲得してもよい。
例えば、前記ユーザーオーディオデータに対して、予めに設定した時間間隔、例えば、20msで、フレーム分離処理を行い、隣接するフレームの間に一部のデータが重なるようにし、例えば、50%のデータが重なるようにし、このようにして、前記ユーザーオーディオデータの少なくとも1つのフレームのデータを獲得することができる。
他の1つの具体的な実現過程で、102の前に、前記ユーザーの基準声紋を獲得でき、例えば、ユーザーが提供する参照音声指示を収集して、当該参照音声指示に従って、当該ユーザーの基準声紋を獲得してもよい。
ユーザーの基準声紋を獲得してから、それに対して記憶処理を行ってもよい。具体的に、ユーザーの基準声紋を端末の記憶デバイスに記憶し、または電子機器の記憶デバイスに記憶し、本実施例ではこれを特別に限定しない。
1つの具体的な実現過程で、前記記憶デバイスは、低速度記憶デバイスであってもよく、具体的にコンピュータシステムのハードウェアであってもよく、又は端末又は電子デバイスの非運転メモリ即ち物理メモリ、例えば、読み取り専用メモリ(Read-Only Memory、ROM)とメモリ等であってもよいが、本実施例はこれを特別に限定しない。
他の1つの具体的な実現過程で、前記記憶デバイスは、高速度記憶デバイスであってもよく、具体的にコンピュータシステムのメモリ、又は端末又は電子デバイスの運転メモリ即ちシステムメモリ、例えば、ランダムアクセスメモリ(Random Access Memory、RAM)等であってもよいが、本実施例はこれを特別に限定しない。
本実施例で、電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、さらに、この音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、前記電子機器のウェイクアップ応答ファイルを再生することができるようにし、選択可能なオーディオファイルが複数であるので、色々な提示音声を提供でき、色々なウェイクアップ提示を提供する目的を実現する。
また、本発明で提供する技術案を利用すると、声紋特徴を利用して、どのユーザーが電子デバイスをウェイクアップしているかを正確に識別でき、当該ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、ユーザーに個性的な提示音を提供でき、さらに色々なウェイクアップ提示を提供する目的を実現する。
なお、本発明で提供する技術案を利用すると、ユーザーの体験を有効に向上できる。
ここで、前記の各方法の実施例を簡単に記述するために、それを全部一連の動作の組合せとして記述したが、本発明によるとあるステップは他の順序で又は同時に実行してもよいので、本分野の当業者であれば、本発明はここで記述した動作順序に限定されないことを了解できる。また、本分野の当業者であれば、明細書に記載した実施例は全部好ましい実施例に属し、それに係る動作及びモジュールは本発明に必ずしも必要なものではないことを了解できる。
前記実施例で、各実施例に対する記述は全部重点があり、ある実施例で詳細に記述しなかった部分は、他の実施例の関連記述を参照してもよい。
図2は、本発明の他の一実施例で提供する電子機器のウェイクアップ装置の構造概略図であり、図2に示すようである。本実施例の電子機器のウェイクアップ装置は、獲得手段21、選択手段22及び再生手段23を含んでいても良い。ここで、獲得手段21は、電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、選択手段22は、前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとし、再生手段23は、前記電子機器のウェイクアップ応答ファイルを再生する。
ここで、本実施例で提供する電磁デバイスのウェイクアップ装置の一部又は全部は、ローカル端末にあるアプリであってもよく、またはローカル端末にあるアプリに設置されているプラグインまたはソフトウェア開発キット(Software Development Kit、SDK)等の機能手段であってもよく、またはネットワーク側のサーバーにある処理エンジンであってもよく、またはネットワーク側にある分布式システムであってもよく、本実施例ではこれに対して特別に限定しない。
前記アプリは、端末にインストールしたネイティブアプリ(nativeApp)であってもよく、または端末におけるブラウザー上の一つのウェブページアプリ(webApp)であってもよく、本実施例ではこれに対して特別に限定しない。
好ましくは、本実施例の1つの可能な実現形態で、図3に示すように、本実施例で提供する電子機器のウェイクアップ装置は、さらに、少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成する生成手段31を含んでいてもよい。
さらに、この実現形態で、前記生成手段31は、さらに、前記少なくとも2つのオーディオデータファイルを前記電子デバイスに提供して、前記電子デバイスに記憶処理させる。
好ましくは、本実施例の1つの可能な実現形態で、前記選択手段22は、具体的に、前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
好ましくは、本実施例の1つの可能な実現形態で、前記選択手段22は、具体的に、前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする。
ここで、図1に対応する実施例における方法は、本実施例で提供する電子機器のウェイクアップ装置で実現できる。詳細な記述は、図1に対応する実施例における関連内容を参照してもよく、ここでは重複に記述しない。
本実施例で、獲得手段で電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、さらに、選択手段で前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、再生手段が前記電子機器のウェイクアップ応答ファイルを再生することができるようにし、選択可能なオーディオファイルが複数であるので、色々な提示音声を提供でき、色々なウェイクアップ提示を提供する目的を実現する。
なお、本発明で提供する技術案を利用すると、声紋特徴を利用して、どのユーザーが電子デバイスをウェイクアップしているかを正確に識別でき、当該ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることによって、ユーザーに個性的な提示音を提供でき、さらに色々なウェイクアップ提示を提供する目的を実現する。
なお、本発明で提供する技術案を利用すると、ユーザーの体験を有効に向上できる。
図4は、本発明の実施形態を実現するための例示的なコンピュータシステム/サーバー12のブロック図である。図4に示すコンピュータシステム/サーバー12はただ1つの例示で、本発明の実施例の機能及び使用範囲に何れの制限を与えるべきでない。
図4に示すように、コンピュータシステム/サーバー12は、通用の計算デバイスの形式で表現される。コンピュータシステム/サーバー12の構成要素は、1つまたは複数のプロセッサーまたは処理手段16と、記憶装置またはシステムメノリ28と、異なるシステム構成要素(システムメモリ28と処理手段16)を接続するためのバス18を含んでいてもよいが、これらに限定されない。
バス18は、複数種類のバス構造における1つまたは複数を示し、メモリバスまたはメモリ制御器、外装バス、グラフィックス高速化ポート、プロセッサーまたは複数種類のバス構造における何れのバス構造のローカルバスなどを含む。例えば、これらのアーキテクチャー構造は、工業基準体系構造(ISA)バス、マイクロチャネルのアーキテクチャー(MAC)バス、増強型ISAバス、ビデオ電子基準協会(VESA)ローカルバス及び周辺コンポーネント相互接続(PCI(peripheral component interconnect))バスなどを含んでいても良いが、これらに限定されない。
コンピュータシステム/サーバー12は、代表的に複数のコンピュータシステム可読媒体を含んでいる。これらの媒体は、何れのコンピュータシステム/サーバー12によって接続できる利用可能な媒体で、揮発性及び不揮発性媒体と、ポータブル又はアンポータブルな媒体を含んでいてもよい。
システムメモリ28は、発揮性メモリ形式のコンピュータシステム可読媒体、例えば、ランダムアクセスメモリ(RAM)30及び/又は高速キャッシュメモリ32を含んでいてもよい。コンピュータシステム/サーバー12は、さらに、他のポータブル又はアンポータブルな、揮発性/不揮発性コンピュータシステム記憶媒体を含んでいてもよい。ただ一例として、記憶システム34は、アンポータブルな、不揮発性磁気媒体(図4に示していない、通常に「ハードウェアドライバ」と呼ばれる)の読み書きに用いられてもよい。図4に示していないが、ポータブルな不揮発性磁気ディスク(例えば、「フロッピー(登録商標)ディスク))に読み書くことができる磁気ディスクドライバ、及びポータブルな不揮発性光ディスク(例えば、CD-ROM、DVD-ROMまたは他の光媒体)に読み書くことができる光ディスクドライバを提供しても良い。これらの場合、各ドライバは、1つまたは複数のデータ媒体インターフェースでバス18に接続してもよい。システムメモリ28は、少なくとも1つのプログラム製品を含んでいてもよく、当該プログラム製品は、一組(例えば、少なくとも1つの)のプログラムモジュールを備えており、これらのプログラムモジュールは本発明の各実施例の機能を実行するように配置されている。
一組(少なくとも1つの)のプログラムモジュール42を有するプログラム/実用的なアプリ40は、例えばシステムメモリ28に記憶されていてもよく、このようなプログラムモジュール42は、操作システム、1つまたは複数のアプリケーションプログラム、他のプログラムモジュール及びプログラムデータを含んでいても良いが、これらに限定されない。これらの例示に於ける一種類毎又はある組合せにはネットワーク環境での実現を含んでいてもよい。プログラムモジュール42は、通常、本発明に記載した実施例における機能及び/又は方法を実行する。
コンピュータシステム/サーバー12は、1つまたは複数の外部デバイス14(例えば、キーボード、ポインティングデバイス、ディスプレイ24等)と通信してもよく、ユーザーが当該コンピュータシステム/サーバー12と対話できる1つまたは複数のデバイスと通信してもよく、及び/又は当該コンピュータシステム/サーバー12が1つまたは複数の他の計算デバイスと通信できる何れのデバイス(例えば、ネットワークボード、モデム等)と通信してもよい。このような通信は、入力/出力(I/O)インターフェース44を通じて実行できる。また、コンピュータシステム/サーバー12は、ネットワークアダプター20で1つまたは複数のネットワーク(例えば、ローカルネットワーク(LAN)、広域ネットワーク(WAN)及び/又は公共ネットワーク、例えば、インターネットワーク)と通信してもよい。図に示すように、ネットワークアダプター20は、バス18でコンピュータシステム/サーバー12の他のモジュールと通信する。図に示していないが、コンピュータシステム/サーバー12を結合して、マイクロコード、デバイスドライバ、冗長処理手段、外部磁気ディスクドライバアレイ、RAIDシステム、磁気テープドライバ及びデータバックアップ記憶システム等を含む他のハードウェア及び/又はソフトウェアモジュールを利用することができるが、これらに限定されない。
処理ユニット16は、システムメモリ28に格納されたプログラムを実行することにより、各種機能アプリおよびデータ処理を実行し、例えば、図1に対応する実施例で提供される電子機器のウェイクアップ方法を実現する。
本発明の別の実施例は、コンピュータプログラムを格納しているコンピュータ可読記憶媒体を提供し、当該プログラムがプロセッサーによって実行される際に、図1に対応する実施例で提供される電子機器のウェイクアップ方法を実現する。
具体的に、1つまたは複数のコンピュータ可読媒体の何れの組み合わせを使用してもよい。コンピュータ可読媒体は、コンピュータ可読信号媒体、またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体は、例えば、電気、磁気、光学、電磁、赤外線、または半導体のシステム、装置またはデバイス、又はこれらの何れの組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非汲尽くしのリスト)としては、1つまたは複数のリード線を有する電気的接続、携帯型コンピュータディスク、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、イーピーロム(EPROMまたはフラッシュメモリ)、光ファイバ、携帯コンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、またはこれらの何れの適切な組み合わせを含む。本明細書において、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって利用できまたはこれらと組み合わせて利用できるプログラムを含みまたは記憶している何れかの有形媒体であってもよい。
コンピュータ可読信号媒体は、ベースバンドにおいてまたはキャリヤーの一部として伝播するコンピュータ可読なプログラムコードを搭載したデータ信号を含んでいてもよい。このような伝播するデータ信号は、様々な形態をとることができ、電磁信号、光信号、またはこれらの何れの適切な組み合わせを含んでいてもよいが、これらに限定されない。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体以外の何れかのコンピュータ可読媒体であってもよく、当該コンピュータ可読媒体は、命令実行システム、装置またはデバイスによって使用されまたはこれらに結合されて使用されるプログラムを送信し、伝播し、送信することができる。
コンピュータ可読媒体に含まれるプログラムコードは、無線、ワイヤ、ケーブル、RF等、またはこれらの何れかの適切な組み合わせの何れかの適切な媒体で送信されてもよいが、これらに限定されない。
1つまたは複数のプログラム設計言語またはこれらの組合せで、本発明の動作を実行するためのコンピュータプログラムコードを書き込むことができ、前記プログラム設計言語は、オブジェクト指向プログラミング言語、例えばJava(登録商標)、Smalltalk、C++を含み、常用の過程式プログラム設計言語、例えば「C」言語または類似なプログラム設計言語を含む。プログラムコードは、完全にユーザーのコンピュータ上で実行されてもよく、一部はユーザーのコンピュータで実行されて1つの独立したソフトウェアパッケージとして実行されてもよく、一部はユーザーのコンピュータで、一部はリモートコンピュータで実行されてもよく、または、完全にリモートコンピュータまたはサーバーで実行されてもよい。リモートコンピュータに関するものの場合は、リモートコンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む何れの種類のネットワークを介して、ユーザコンピュータに接続されてもよく、あるいは、外部コンピュータ(例えば、インターネット・サービス・プロバイダを利用してインターネットを介して接続する)に接続してもよい。
所属分野の当業者であれば、記述の便利と簡潔のために、上述記述のシステム、装置と手段の具体的な動作過程は、前述方法の実施例における対応過程を参照できることを理解すべきで、ここで重複に記述しない。
本発明で提供する幾つかの実施例で開示したシステム、装置及び方法は、他の方式によって実現できるのは理解すべきである。例えば、以上に記載した装置の実施例はただ例示的なもので、例えば、前記手段の分割はただロジック機能の分割で、実際に実現する時は他の分割方式によってもよい。例えば、複数の手段又はページモジュールは結合でき又は他の一つのシステムに集積でき、またはある特徴は無視し、または実行しないでもよい。また、示しまたは検討した互いの間の結合または直接に結合又は通信接続は、あるインターフェース、装置または手段の間接的な接合又は通信接続によるものであってもよく、電気的、機械または他の形式であってもよい。
以上で分離部材として説明した手段は、物理上で分離したものであってもよく物理上で分離しなかったものであってもよく、手段として表示した部材は物理手段であってもよく、物理手段でないでもよく、即ち、同一の位置にあってもよく、複数のネットワークユニットに分布されていてもよい。実際の必要によってその中における一部または全部手段を選択して本実施例の方案の目的を実現してもよい。
また、本発明の各実施例における各機能手段は一つの処理モジュールに集積してもよく、各手段が物理上で単独に存在してもよく、二つ又は二つ以上の手段を一つの手段に集積してもよい。前記集積した手段は、ハードウェアの形式に実現してもよく、ハードウェアにソフトウェアの機能手段を結合する形式で実現してもよい。
上記のソフト機能手段の形式で実現した集積した手段は、一つのコンピュータ可読記憶媒体に記憶してもよい。前記ソフト機能手段は一つの記憶媒体に記憶してもよく、複数の命令を含んで一つのコンピューターデバイス(パーソナルコンピュータ、サーバー、又はネットワークデバイス等)又はプロセッサー(processor)によって、本発明の各実施例の前記方法の一部のステップを実行させてもよい。前記記憶媒体は、Uディスク、ポータブルハードウェア、読み出し専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、ディスク又は光ディスク等のプログラムコードを記憶できる複数種類の媒体を含む。
最後に、以上の実施例はただ本発明の技術案を説明するためのもので、それについての限定ではなく、前記実施例を参照して本発明を詳細に説明したが、本分野の当業者は、前記の各実施例に記載の技術案を修正でき、又はその一部の技術特徴を等価置換でき、これらの修正又は置換の技術案の本質は本発明の各実施例の技術案の主旨及び範囲を離脱しない。
Claims (12)
- 電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を取得し、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとし、
前記電子機器のウェイクアップ応答ファイルを再生することを含む、電子機器のウェイクアップ方法。 - 前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする前に、さらに、
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、
前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成することを含む、請求項1に記載の電子機器のウェイクアップ方法。 - 前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成した後、さらに、
前記少なくとも2つのオーディオデータファイルを前記電子機器に提供して、前記電子機器に記憶処理させることを含む、請求項2に記載の電子機器のウェイクアップ方法。 - 前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとするには、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む、請求項1〜3の何れかの一項に記載の電子機器のウェイクアップ方法。 - 前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとするには、
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとすることを含む、請求項1〜3の何れかの一項に記載の電子機器のウェイクアップ方法。 - 電子機器をウェイクアップさせるためのユーザーの音声ウェイクアップ指示を獲得する獲得手段と、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルから1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする選択手段と、
前記電子機器のウェイクアップ応答ファイルを再生する再生手段とを含む、電子機器のウェイクアップ装置。 - 前記ウェイクアップ装置は、さらに、
少なくとも1つの提示ファイルと少なくとも1つの音声パラメーターを獲得し、前記少なくとも1つの提示ファイルと前記少なくとも1つの音声パラメーターに基づいて、TTS技術を利用して、前記少なくとも2つのオーディオデータファイルを生成する生成手段を含む、請求項6に記載の電子機器のウェイクアップ装置。 - 前記生成手段は、さらに
前記少なくとも2つのオーディオデータファイルを前記電子機器に提供して、前記電子機器に記憶処理させる、請求項7に記載の電子機器のウェイクアップ装置。 - 前記選択手段は、具体的に、
前記音声ウェイクアップ指示に基づいて、少なくとも2つのオーディオデータファイルからランダムに1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする、請求項6〜8の何れかの一項に記載の電子機器のウェイクアップ装置。 - 前記選択手段は、具体的に、
前記音声ウェイクアップ指示に基づいて、声紋特徴を獲得し、
前記声紋特徴に基づいて、少なくとも2つのオーディオデータファイルから前記ユーザーが設置した1つのオーディオデータファイルを選択して、前記電子機器のウェイクアップ応答ファイルとする、請求項6〜8の何れかの一項に記載の電子機器のウェイクアップ装置。 - 一つ又は複数のプロセッサーと、
一つ又は複数のプログラムを記憶する記憶装置とを含むデバイスであって、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサーによって実行されると、前記一つ又は複数のプロセッサーが請求項1〜5の何れかの一項に記載の電子機器のウェイクアップ方法を実現する、デバイス。 - プロセッサーに、請求項1〜5の何れかの一項に記載の電子機器のウェイクアップ方法を実行させるためのコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710543516.4 | 2017-07-05 | ||
CN201710543516.4A CN107564532A (zh) | 2017-07-05 | 2017-07-05 | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019015951A true JP2019015951A (ja) | 2019-01-31 |
Family
ID=60973450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018047963A Pending JP2019015951A (ja) | 2017-07-05 | 2018-03-15 | 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10783884B2 (ja) |
EP (1) | EP3425630A1 (ja) |
JP (1) | JP2019015951A (ja) |
KR (1) | KR20190005103A (ja) |
CN (1) | CN107564532A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111916079A (zh) * | 2020-08-03 | 2020-11-10 | 深圳创维-Rgb电子有限公司 | 一种电子设备的语音响应方法、系统、设备和存储介质 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108231079B (zh) * | 2018-02-01 | 2021-12-07 | 北京百度网讯科技有限公司 | 用于控制电子设备的方法、装置、设备以及计算机可读存储介质 |
CN108495160A (zh) * | 2018-02-08 | 2018-09-04 | 百度在线网络技术(北京)有限公司 | 智能控制方法、系统、设备及存储介质 |
CN109348068A (zh) * | 2018-12-03 | 2019-02-15 | 咪咕数字传媒有限公司 | 一种信息处理方法、装置及存储介质 |
CN109637560A (zh) * | 2018-12-19 | 2019-04-16 | 广州势必可赢网络科技有限公司 | 一种数据存储方法、装置和计算机可读存储介质 |
CN110534117B (zh) * | 2019-09-10 | 2022-11-25 | 阿波罗智联(北京)科技有限公司 | 用于优化语音生成模型的方法、装置、设备和计算机介质 |
CN113593541B (zh) * | 2020-04-30 | 2024-03-12 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、电子设备和计算机存储介质 |
CN114627879A (zh) * | 2022-03-16 | 2022-06-14 | 北京小米移动软件有限公司 | 组网内设备的唤醒方法、装置、电子设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962293A (ja) * | 1995-08-21 | 1997-03-07 | Seiko Epson Corp | 音声認識対話装置および音声認識対話処理方法 |
JPH10293709A (ja) * | 1997-04-18 | 1998-11-04 | Casio Comput Co Ltd | 情報処理装置及び記憶媒体 |
JP2001273065A (ja) * | 2000-03-23 | 2001-10-05 | Honda Motor Co Ltd | エージェント装置 |
JP2002536917A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 電話ハンドセットの音声認識ユーザインターフェイス |
JP2004096520A (ja) * | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
JP2006106748A (ja) * | 2004-10-05 | 2006-04-20 | Inago Kk | 音声認識の精度を改善するためのシステムおよび方法 |
JP2014041464A (ja) * | 2012-08-22 | 2014-03-06 | Sharp Corp | 情報処理装置およびその制御方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240405B1 (en) * | 1997-04-17 | 2001-05-29 | Casio Computer Co., Ltd. | Information processors having an agent function and storage mediums which contain processing programs for use in the information processor |
US7418392B1 (en) * | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US8898568B2 (en) * | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
CN202068466U (zh) * | 2011-03-31 | 2011-12-07 | 吴瑞宗 | 一种语音响应手机 |
US9329832B2 (en) * | 2011-05-09 | 2016-05-03 | Robert Allen Blaisch | Voice internet system and method |
CN103187051A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载互动装置 |
CN103236259B (zh) * | 2013-03-22 | 2016-06-29 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈系统、语音回复方法 |
EP3036594B1 (en) * | 2013-08-21 | 2021-05-26 | Ademco Inc. | Devices and methods for interacting with an hvac controller |
US10229256B2 (en) * | 2013-10-25 | 2019-03-12 | Intel Corporation | Techniques for preventing voice replay attacks |
US9443522B2 (en) * | 2013-11-18 | 2016-09-13 | Beijing Lenovo Software Ltd. | Voice recognition method, voice controlling method, information processing method, and electronic apparatus |
US9571645B2 (en) * | 2013-12-16 | 2017-02-14 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
JP6446993B2 (ja) * | 2014-10-20 | 2019-01-09 | ヤマハ株式会社 | 音声制御装置およびプログラム |
US9812126B2 (en) * | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
WO2017184169A1 (en) * | 2016-04-22 | 2017-10-26 | Hewlett-Packard Development Company, L.P. | Communications with trigger phrases |
WO2017197312A2 (en) * | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing speech from distributed microphones |
US10152969B2 (en) * | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10297254B2 (en) * | 2016-10-03 | 2019-05-21 | Google Llc | Task initiation using long-tail voice commands by weighting strength of association of the tasks and their respective commands based on user feedback |
KR20180085931A (ko) * | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
CN107146611B (zh) * | 2017-04-10 | 2020-04-17 | 北京猎户星空科技有限公司 | 一种语音响应方法、装置及智能设备 |
US10748531B2 (en) * | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
US10521512B2 (en) * | 2017-05-26 | 2019-12-31 | Bose Corporation | Dynamic text-to-speech response from a smart speaker |
-
2017
- 2017-07-05 CN CN201710543516.4A patent/CN107564532A/zh active Pending
- 2017-12-28 US US15/857,569 patent/US10783884B2/en active Active
-
2018
- 2018-03-15 KR KR1020180030249A patent/KR20190005103A/ko not_active Ceased
- 2018-03-15 JP JP2018047963A patent/JP2019015951A/ja active Pending
- 2018-03-22 EP EP18163301.7A patent/EP3425630A1/en not_active Ceased
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962293A (ja) * | 1995-08-21 | 1997-03-07 | Seiko Epson Corp | 音声認識対話装置および音声認識対話処理方法 |
JPH10293709A (ja) * | 1997-04-18 | 1998-11-04 | Casio Comput Co Ltd | 情報処理装置及び記憶媒体 |
JP2002536917A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 電話ハンドセットの音声認識ユーザインターフェイス |
JP2001273065A (ja) * | 2000-03-23 | 2001-10-05 | Honda Motor Co Ltd | エージェント装置 |
JP2004096520A (ja) * | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
JP2006106748A (ja) * | 2004-10-05 | 2006-04-20 | Inago Kk | 音声認識の精度を改善するためのシステムおよび方法 |
JP2014041464A (ja) * | 2012-08-22 | 2014-03-06 | Sharp Corp | 情報処理装置およびその制御方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111916079A (zh) * | 2020-08-03 | 2020-11-10 | 深圳创维-Rgb电子有限公司 | 一种电子设备的语音响应方法、系统、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR20190005103A (ko) | 2019-01-15 |
CN107564532A (zh) | 2018-01-09 |
EP3425630A1 (en) | 2019-01-09 |
US20190013020A1 (en) | 2019-01-10 |
US10783884B2 (en) | 2020-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019015951A (ja) | 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 | |
US10381016B2 (en) | Methods and apparatus for altering audio output signals | |
JP6862632B2 (ja) | 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム | |
CN107423364B (zh) | 基于人工智能的回答话术播报方法、装置及存储介质 | |
US7831432B2 (en) | Audio menus describing media contents of media players | |
CN108831437B (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
US20190005954A1 (en) | Wake-on-voice method, terminal and storage medium | |
WO2020113733A1 (zh) | 动画生成方法、装置、电子设备及计算机可读存储介质 | |
JP2019211747A (ja) | 音声接続合成の処理方法及び装置、コンピュータ設備及び読取り可能な媒体 | |
WO2020098115A1 (zh) | 字幕添加方法、装置、电子设备及计算机可读存储介质 | |
JP2019040603A (ja) | 音楽推薦方法、装置、設備及びプログラム | |
JP6814871B2 (ja) | 電子デバイスの音声制御方法、電子デバイスの音声制御装置、コンピュータ機器及び記憶媒体 | |
CN114866807A (zh) | 虚拟形象视频生成方法、装置、电子设备及可读存储介质 | |
JP2020149038A (ja) | デバイスをウェイクアップするための方法及び装置 | |
US11049490B2 (en) | Audio playback device and audio playback method thereof for adjusting text to speech of a target character using spectral features | |
CN109460548B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
EP4343761A1 (en) | Enhanced audio file generator | |
CN113157240A (zh) | 语音处理方法、装置、设备、存储介质及计算机程序产品 | |
CN102956125B (zh) | 云端数码语音教学录音系统 | |
CN111768756A (zh) | 信息处理方法、装置、车辆和计算机存储介质 | |
KR20200138643A (ko) | 전자 기기의 음성 제어 방법, 장치, 컴퓨터 기기 및 저장 매체 | |
US20090327884A1 (en) | Communicating information from auxiliary device | |
CN109300472A (zh) | 一种语音识别方法、装置、设备及介质 | |
CN100375084C (zh) | 一种带有语言复读功能的计算机及其实现方法 | |
CN111767083B (zh) | 误唤醒音频数据的收集方法、播放设备、电子设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190903 |