[go: up one dir, main page]

JP2002108390A - Speech recognition device and computer-readable recording medium - Google Patents

Speech recognition device and computer-readable recording medium

Info

Publication number
JP2002108390A
JP2002108390A JP2000294434A JP2000294434A JP2002108390A JP 2002108390 A JP2002108390 A JP 2002108390A JP 2000294434 A JP2000294434 A JP 2000294434A JP 2000294434 A JP2000294434 A JP 2000294434A JP 2002108390 A JP2002108390 A JP 2002108390A
Authority
JP
Japan
Prior art keywords
voice
switch
input unit
audio signal
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000294434A
Other languages
Japanese (ja)
Inventor
Akira Tsuruta
彰 鶴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000294434A priority Critical patent/JP2002108390A/en
Publication of JP2002108390A publication Critical patent/JP2002108390A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】抽出すべき音声区間の最初の部分や最後の部分
の欠落を少なくし、ユーザにスイッチを押すタイミング
と発声のタイミングを意識させるような煩わしさを軽減
する。 【解決手段】音声入力部1と、スイッチ3の操作状態を
検出するスイッチ状態検出部4と、入力制御部2を設
け、その入力制御部2による制御により、音声信号の取
り込みが必要なときに音声入力部1に対して音声入力部
1の使用を通知し、音声信号の取り込みが必要でなくな
ったときに音声入力部1に対して音声入力部1の使用終
了を通知するとともに、スイッチ3がOFFからON状
態になったときに、すぐに音声入力部1に対して音声信
号の取り込み開始を通知し、スイッチ3がONからOF
F状態になったときに、所定時間だけ遅れて音声信号の
取り込み終了を通知する。
(57) [Summary] [Problem] To reduce the omission of a first part and a last part of a voice section to be extracted, and to reduce a troublesomeness of making a user aware of a timing of pressing a switch and a timing of utterance. An audio input unit, a switch state detection unit for detecting an operation state of a switch, and an input control unit are provided. When the use of the voice input unit 1 is notified to the voice input unit 1 and the use of the voice signal is no longer necessary, the voice input unit 1 is notified of the end of use of the voice input unit 1 and the switch 3 is operated. When the state changes from OFF to ON, the audio input unit 1 is immediately notified of the start of the capture of the audio signal, and the switch 3 is turned ON to OFF.
When the state becomes the F state, the end of the capture of the audio signal is notified with a delay of a predetermined time.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、スイッチ操作と連
動させて必要な音声信号を取り込み、取り込んだ音声信
号を認識する音声認識装置及びコンピュータ読み取り可
能な記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice recognition device and a computer-readable recording medium which fetch a required voice signal in conjunction with a switch operation and recognize the fetched voice signal.

【0002】[0002]

【従来の技術】現在、パーソナルコンピュータ(以下、
パソコンという)等の機械に対して所定の動作を行なわ
せる際に、キーボードやマウス等を用いる方法が主流で
ある。ところが、パソコンにおいて、例えば、よく見る
Webページを表示する場合、Webブラウザを起動
し、「お気に入り」等に登録しているWebページを選
択するか、あるいは複雑なURLを入力する必要があり
面倒である。そこで、直接音声を入力することで指令を
与え、所定の動作を行なわせる音声認識が注目され始め
ている。
2. Description of the Related Art At present, personal computers (hereinafter, referred to as personal computers).
When a predetermined operation is performed on a machine such as a personal computer, a method using a keyboard, a mouse, or the like is mainly used. However, when displaying a frequently viewed Web page on a personal computer, for example, it is necessary to start up a Web browser and select a Web page registered as a “favorite” or input a complicated URL. is there. Therefore, voice recognition which gives a command by directly inputting a voice and performs a predetermined operation has been attracting attention.

【0003】従来、この種の音声認識装置として、図8
に示すように、マイクによって集音したアナログの音声
信号をA/D変換器でディジタル化した音声信号11を
取り込み、その音声信号11から算出した音声パワーを
音声区間切り出し部12に与えて音声区間を切り出し、
その切り出された音声区間について音響分析部13によ
り特徴ベクトルを抽出してマッチング部14に与え、こ
のマッチング部14において、辞書部15に予め登録さ
れている標準パターンとのマッチングを行うことによ
り、最も類似したものを認識結果16として出力するよ
うにした装置がある。
Conventionally, as this type of speech recognition apparatus, FIG.
As shown in the figure, an audio signal 11 obtained by digitizing an analog audio signal collected by a microphone with an A / D converter is taken in, and the audio power calculated from the audio signal 11 is given to an audio section cutout unit 12 to provide an audio section. Cut out
A feature vector of the cut-out speech section is extracted by the acoustic analysis unit 13 and provided to the matching unit 14. The matching unit 14 performs matching with a standard pattern registered in advance in the dictionary unit 15, so that There is a device that outputs a similar result as the recognition result 16.

【0004】この場合の音声区間の検出方法としては、
例えば音声信号から算出した音声パワーについて、音声
パワーが所定値以上に増大した開始点を検出し、音声パ
ワーが第1閾値以下となる仮終了点を検出した後、所定
の第2閾値を超えて未満となる位置に仮終了点を順次移
動していき、最終の仮終了点が終了点と決定したことに
対応し、前記開始点から終了点までの音声信号を音声区
間として切り出すものがある。
In this case, a method for detecting a voice section is as follows.
For example, with respect to the audio power calculated from the audio signal, a start point at which the audio power is increased to a predetermined value or more is detected, and a temporary end point at which the audio power is equal to or less than a first threshold is detected, In some cases, the tentative end point is sequentially moved to a position of less than and the audio signal from the start point to the end point is cut out as an audio section in response to the determination of the final tentative end point as the end point.

【0005】しかし、常に音声信号を取り込んでいる状
態で音声区間の検出を行うと、取り込まれた音声信号に
「えーっと」などの不要語や、突発的な周囲の騒音(ノ
イズ)が入った場合、これら不要語やノイズ区間を誤っ
て音声区間として検出してしまい、認識が行われてしま
う。
However, if a voice section is detected while a voice signal is constantly being captured, an unnecessary word such as "um" or sudden surrounding noise (noise) may be included in the captured voice signal. However, these unnecessary words and noise sections are erroneously detected as speech sections, and recognition is performed.

【0006】そこで実際には、スイッチを押している間
において音声信号の入力を受け付ける方法や、スイッチ
を1度押した後、一定時間音声入力を受け付ける方法な
ど、必要な音声区間をユーザが直接指定する方法と、前
記した音声区間の検出とを組み合わせることにより、不
要語や周囲の騒音等による音声区間の誤検出を防いでい
る。
Therefore, in practice, the user directly specifies a necessary voice section, such as a method of receiving a voice signal input while the switch is being pressed or a method of receiving a voice input for a certain time after pressing the switch once. By combining the method and the above-described detection of the voice section, erroneous detection of the voice section due to unnecessary words, ambient noise, and the like is prevented.

【0007】[0007]

【発明が解決しようとする課題】ところで、以上の方法
においては、ユーザが発声の開始よりも少しでも遅れて
スイッチを押した場合や、ユーザの発声の終了よりも少
しでも早くスイッチを離した場合、抽出すべき音声区間
の最初の部分や最後の部分が欠けてしまうという問題が
生じる。
By the way, in the above method, when the user presses the switch at least slightly after the start of the utterance, or when the user releases the switch at least a little before the end of the utterance of the user. However, there is a problem that the first part and the last part of the voice section to be extracted are missing.

【0008】これを解決する1つの方法として、特開平
8−185196号公報では、入力音声信号を常に取り
込んで記憶しておき、スイッチ操作で指定される検出区
間より広い範囲で、記憶している入力音声信号から1つ
だけ音声区間を抽出し、出力するようにしている。
As one method for solving this, in Japanese Patent Application Laid-Open No. Hei 8-185196, an input audio signal is always captured and stored, and stored over a wider range than a detection section designated by a switch operation. Only one voice section is extracted from the input voice signal and output.

【0009】しかし、パソコン等においてこの方法を用
いた場合、1つのアプリケーションソフトが音声入力デ
バイスを占有してしまい、音声入力を必要とする他のア
プリケーションソフトを動作させても、音声入力デバイ
スを使用することができないという問題が生じる。ま
た、低消費電力で長時間使用可能であることが重要な要
素の1つである携帯情報端末等においてこの方法を用い
た場合、常に音声信号の取り込みを行うため消費電力が
増えてしまい、使用可能時間が短くなるという問題が生
じる。
However, when this method is used in a personal computer or the like, one application software occupies the voice input device, and even if another application software that requires voice input is operated, the voice input device is used. A problem arises that it cannot be performed. In addition, when this method is used in a portable information terminal or the like, which is one of the important factors of being able to use for a long time with low power consumption, the power consumption increases because the audio signal is always taken in, so that the power consumption increases. There is a problem that the available time is shortened.

【0010】本発明はそのような実情に鑑みてなされた
もので、スイッチを用いて必要な音声区間をユーザが直
接指定する方法において、抽出すべき音声区間の最初の
部分や最後の部分の欠落を少なくし、ユーザにスイッチ
を押すタイミングと発声のタイミングを意識させるよう
な煩わしさをできるだけ軽減するとともに、必要なとき
だけ音声入力部を動作させて音声信号を取り込むことに
より消費電力を抑えことができ、しかも1つのアプリケ
ーションソフトが常に音声入力部を占有することなく、
他のアプリケーションソフトからも音声入力部を使用す
ることが可能な入力制御を行うことができる音声認識装
置と、そのような処理プログラムを記録したコンピュー
タ読み取り可能な記録媒体の提供を目的とする。
The present invention has been made in view of such circumstances, and in a method in which a user directly specifies a necessary voice section using a switch, the first section or the last section of the voice section to be extracted is missing. And reduce the hassle of making the user aware of the timing of pressing the switch and the timing of the utterance as much as possible.Also, the power consumption can be reduced by operating the voice input unit only when necessary and capturing the voice signal. Yes, and one application software does not always occupy the voice input unit,
It is an object of the present invention to provide a voice recognition device capable of performing input control that can use a voice input unit from other application software, and a computer-readable recording medium storing such a processing program.

【0011】[0011]

【課題を解決するための手段】本発明の音声認識装置
は、音声信号の取り込みを指定するスイッチ操作に応じ
て音声信号を取り込み、取り込んだ音声信号を認識する
音声認識装置であって、音声入力部と、スイッチの操作
状態を検出するスイッチ状態検出部と、入力制御部を備
えており、その入力制御部は、音声信号の取り込みが必
要なときに音声入力部に対して音声入力部の使用を通知
し、音声信号の取り込みが必要でなくなったときに音声
入力部に対して音声入力部の使用終了を通知するととも
に、スイッチがOFFからON状態になったときに、す
ぐに音声入力部に対して音声信号の取り込み開始を通知
し、スイッチがONからOFF状態になったときに、所
定時間だけ遅れて音声信号の取り込み終了を通知する機
能を備えていることによって特徴づけられる。
A voice recognition device according to the present invention is a voice recognition device for capturing a voice signal in response to a switch operation for designating the capture of a voice signal and recognizing the captured voice signal. Unit, a switch state detection unit for detecting an operation state of the switch, and an input control unit, and the input control unit uses the voice input unit for the voice input unit when it is necessary to capture a voice signal. When the switch from the OFF state to the ON state is sent to the voice input unit, the voice input unit is notified immediately when the use of the audio signal is no longer necessary. A function shall be provided to notify the start of audio signal capture and notify the end of audio signal capture after a predetermined time when the switch changes from ON to OFF. Thus characterized.

【0012】本発明の音声認識装置によれば、抽出すべ
き音声区間の最初の部分や最後の部分の欠落を少なくす
ることができ、ユーザにスイッチを押すタイミングと発
声のタイミングを意識させるような煩わしさをできるだ
け軽減することができる。また、音声の認識に必要なと
きだけ音声入力部を動作させて音声信号を取り込むの
で、消費電力を抑えことができる。
According to the speech recognition apparatus of the present invention, it is possible to reduce the loss of the first part and the last part of the speech section to be extracted, and to make the user aware of the timing of pressing the switch and the timing of utterance. The annoyance can be reduced as much as possible. In addition, since the voice input unit is operated to capture the voice signal only when necessary for voice recognition, power consumption can be reduced.

【0013】本発明の音声認識装置において、入力制御
部は、スイッチがOFFからON状態になったときに、
すぐに音声入力部に対して音声入力部の使用及び音声信
号の取り込み開始を通知し、スイッチがONからOFF
状態になったときに、所定時間だけ遅れて音声入力部に
対して音声信号の取り込み終了及び音声入力部の使用終
了を通知する機能を備えていてもよい。
[0013] In the voice recognition device of the present invention, the input control unit operates when the switch is turned from OFF to ON.
Immediately notifies the voice input unit of the use of the voice input unit and the start of capturing the audio signal, and switches from ON to OFF
A function may be provided for notifying the audio input unit of the end of capturing the audio signal and the end of use of the audio input unit after a predetermined time delay when the state is entered.

【0014】この発明によれば、スイッチのON/OF
Fに応じて音声入力部を動作させて音声信号を取り込む
ので、消費電力を更に抑えことができる。
According to the present invention, ON / OF of the switch is performed.
Since the audio input unit is operated according to F to capture an audio signal, power consumption can be further reduced.

【0015】本発明の音声認識装置において、入力制御
部は、スイッチがOFFからON状態になったときに、
すぐに音声入力部に対して音声信号の取り込み開始を通
知するとともに、スイッチがON状態になったときか
ら、予め設定した設定時間が経過した後に、ユーザに対
して音声入力可能な状態であることを通知する機能を備
えていてもよい。
[0015] In the voice recognition device of the present invention, the input control unit operates when the switch is turned from OFF to ON.
Immediately notify the voice input unit of the start of voice signal capture, and enable voice input to the user after a preset time has elapsed since the switch was turned on. May be provided.

【0016】この発明によれば、音声入力可能な状態を
表す通知(例えばアイコンの表示等)を行う時点の少し
前から音声信号の取り込みを行うようにしているので、
ユーザが音声入力可能な状態を表す通知よりも少し早く
発声しても、語頭の音声が欠けることを減らすことがで
きる。
According to the present invention, the audio signal is fetched shortly before the notification (for example, display of an icon, etc.) indicating the state in which the voice can be input.
Even if the user speaks a little earlier than the notification indicating the state in which the voice can be input, it is possible to reduce the lack of the beginning voice.

【0017】本発明の音声認識装置において、入力制御
部は、スイッチがONからOFF状態になったときか
ら、予め設定した設定時間が経過した後に、音声入力部
に対して音声信号の取り込み終了を通知する機能を備え
ていてもよい。
In the voice recognition device of the present invention, the input control unit terminates the capture of the voice signal to the voice input unit after a preset time has elapsed since the switch was turned from ON to OFF. A function for notifying may be provided.

【0018】この発明によれば、ユーザがスイッチを離
すタイミングをそれほど意識しなくても、語尾の音声が
欠けることを減らすことができる。
According to the present invention, the lack of voice at the end can be reduced even if the user does not notice the timing of releasing the switch.

【0019】本発明の音声認識装置において、入力制御
部は、音声区間検出機能を備えているとともに、スイッ
チがONからOFF状態になり、かつ音声区間の検出が
終了した後に、音声入力部に対して音声信号の取り込み
終了を通知する機能を備えていてもよい。
In the speech recognition apparatus according to the present invention, the input control unit has a speech section detection function and, after the switch is turned from ON to OFF and the detection of the speech section has been completed, the input control unit controls the speech input unit. May be provided for notifying the end of the capture of the audio signal.

【0020】この発明によれば、音声区間中に、音声入
力部が音声信号の取り込みを終了することがなくなるの
で、音声区間の最後の部分の音声の欠落を少なくするこ
とができる。
According to the present invention, since the voice input unit does not end capturing the voice signal during the voice section, the loss of voice in the last part of the voice section can be reduced.

【0021】本発明の記録媒体は、音声信号の取り込み
を指定するスイッチ操作に応じて音声信号を取り込み、
取り込まれた音声信号を認識する処理プログラムを記録
したコンピュータ読み取り可能な記録媒体であって、音
声信号の取り込みが必要なときに音声入力部に対して音
声入力部の使用を通知し、音声信号の取り込みが必要で
なくなったときに音声入力部に対して音声入力部の使用
終了を通知するとともに、スイッチがOFFからON状
態になったときに、すぐに音声入力部に対して音声信号
の取り込み開始を通知し、スイッチがONからOFF状
態になったときに、所定時間だけ遅れて音声信号の取り
込み終了を通知するための処理プログラムを記録してい
ることによって特徴づけられる。
The recording medium of the present invention captures an audio signal in response to a switch operation for designating the capture of an audio signal,
A computer-readable recording medium on which a processing program for recognizing a captured audio signal is recorded. Notifies the voice input unit of the end of use of the voice input unit when capture is no longer required, and starts capturing voice signals to the voice input unit immediately when the switch is turned on from OFF. And a processing program for notifying the end of the capture of the audio signal with a delay of a predetermined time when the switch changes from the ON state to the OFF state.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0023】図1は、本発明の音声認識装置の実施形態
の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the speech recognition apparatus of the present invention.

【0024】図1の音声認識装置は、音声入力部1、入
力制御部2、スイッチ3、スイッチ状態検出部4、音声
認識部5及び表示部6などを主体として構成されてい
る。
The speech recognition apparatus shown in FIG. 1 is mainly composed of a speech input unit 1, an input control unit 2, a switch 3, a switch state detection unit 4, a speech recognition unit 5, a display unit 6, and the like.

【0025】音声入力部1は、マイク1Aによって集音
されたアナログの音声信号をA/D変換器1Bでディジ
タル化する。ディジタル化された音声信号は、入力制御
部2及び音声認識部5に入力される。
The audio input unit 1 digitizes an analog audio signal collected by the microphone 1A with an A / D converter 1B. The digitized voice signal is input to the input control unit 2 and the voice recognition unit 5.

【0026】入力制御部2は、スイッチ3の状態や音声
区間の検出状況に応じて、音声入力部1を制御すること
により音声信号の取り込みを制御する。
The input control unit 2 controls the input of the audio signal by controlling the audio input unit 1 in accordance with the state of the switch 3 and the detection state of the audio section.

【0027】スイッチ3は、ユーザのスイッチ操作によ
りON、OFF信号を発生する。ON、OFF信号は、
スイッチ状態検出部4に入力される。
The switch 3 generates an ON / OFF signal by a user's operation of the switch. ON and OFF signals are
The signal is input to the switch state detector 4.

【0028】スイッチ状態検出部4は、スイッチ3の状
態がOFFからON状態になったときにON信号を入力
制御部2に送り、また、スイッチ3の状態がONからO
FF状態になったときにOFF信号を入力制御部2に送
る。
The switch state detector 4 sends an ON signal to the input controller 2 when the state of the switch 3 changes from OFF to ON, and changes the state of the switch 3 from ON to O.
An OFF signal is sent to the input control unit 2 when the state becomes the FF state.

【0029】音声認識部5は、例えば隠れマルコフモデ
ル( 以下、HMMという )を用いた音声認識手法の場
合、認識対象単語に対応するHMMの全てについて、そ
の生起確率を求め、生起確率の最も高いHMMに対応す
る単語を認識結果とする。
For example, in the case of a speech recognition method using a Hidden Markov Model (hereinafter, referred to as HMM), the speech recognition unit 5 obtains the occurrence probability of all HMMs corresponding to the word to be recognized, and obtains the highest occurrence probability. A word corresponding to the HMM is set as a recognition result.

【0030】HMMは、大量の音声データから得られる
音声の統計的特徴をモデル化したものであり、このHM
Mを用いた音声認識手法の詳細は、中川聖一著「確率モ
デルによる音声認識」に開示されている。
The HMM is a model of the statistical characteristics of speech obtained from a large amount of speech data.
Details of the speech recognition method using M are disclosed in "Speech Recognition by Stochastic Model" by Seichi Nakagawa.

【0031】表示部6はアイコンや認識結果等を表示す
る。
The display unit 6 displays icons, recognition results, and the like.

【0032】以上の構成の音声認識装置における入力制
御の動作を具体的に説明する。
The operation of input control in the above-structured speech recognition apparatus will be specifically described.

【0033】まず、ユーザが、音声入力を行うためにス
イッチ3を押しながら発声する場合の例を、図2のフロ
ーチャート及び図1を参照しながら説明する。
First, an example in which the user speaks while pressing the switch 3 to input a voice will be described with reference to the flowchart of FIG. 2 and FIG.

【0034】ステップS11:スイッチ状態検出部4に
よって、ユーザがスイッチ3を押したか否かが判断され
る。スイッチ3が押されたと判断した場合、入力制御部
2によって、音声入力部1に対して音声入力部1を使用
したい旨が通知される(ステップS12)。
Step S11: The switch state detector 4 determines whether the user has pressed the switch 3. If it is determined that the switch 3 has been pressed, the input control unit 2 notifies the voice input unit 1 that the user wants to use the voice input unit 1 (step S12).

【0035】ステップS13:入力制御部2によって、
音声入力部1からの情報に基づいて使用可能か否かが判
断される。他のアプリケーションソフトにより音声入力
部1が使用中である場合は音声入力部1を使用すること
ができないので、ステップS22に移行して、現在、他
のアプリケーションソフトが音声入力部1を使用中であ
る旨のエラーメッセージをユーザに対して出力して処理
を終了する。
Step S13: By the input control unit 2,
It is determined based on the information from the voice input unit 1 whether it can be used. If the voice input unit 1 is being used by another application software, the voice input unit 1 cannot be used. Therefore, the process proceeds to step S22, and the other application software is currently using the voice input unit 1. An error message to the effect is output to the user, and the process ends.

【0036】音声入力部1が使用可能である場合、これ
以降、他のアプリケーションソフトにより音声入力部1
を使用することができなくなり、入力制御部2によっ
て、音声入力部1に対して音声信号の取り込み開始が通
知される(ステップS14)。
If the voice input unit 1 can be used, the voice input unit 1 is thereafter used by another application software.
Cannot be used, and the input control unit 2 notifies the voice input unit 1 of the start of capturing of the voice signal (step S14).

【0037】ステップS15:音声入力部1によって、
音声信号の取り込みが行われる。
Step S15: The voice input unit 1
An audio signal is captured.

【0038】ステップS16:入力制御部2によって、
スイッチ3が押されてからの経過時間(ONからの経過
時間)が、予め設定された設定時間t0 よりも長いか否
かが判断される。
Step S16: The input control unit 2
It is determined whether or not the elapsed time since the switch 3 was pressed (the elapsed time since ON) is longer than a preset time t0.

【0039】設定時間t0 を決定する方法としては、例
えばユーザに「音声入力可能な状態であることを確認し
てからすぐに発声してください。」という条件のもとで
音声入力の実験を行い、図6(a)に示すように、音声
入力可能な状態と発声のタイミングを調べて設定する方
法などがある。なお、スイッチ3をONにしてから音声
入力可能な状態となるまでの設定時間t0 が長すぎる
と、ユーザの使い勝手が悪くなるので、実際は数100
ms程度が望ましい。
As a method of determining the set time t 0, for example, a voice input experiment is performed on the user under the condition “Please confirm that the voice input is possible and immediately start speaking.” As shown in FIG. 6A, there is a method of checking and setting a state in which a voice can be input and a timing of utterance. If the set time t0 from the time when the switch 3 is turned on until the voice input becomes possible is too long, the usability of the user deteriorates.
ms is desirable.

【0040】ステップS16の判断において、ONから
の経過時間が設定時間t0 よりも短い場合は、ステップ
S15に戻って音声信号の取り込みを続ける。ONから
の経過時間が設定時間t0 よりも長い場合は、ステップ
S17に移行して、入力制御部2によって、ユーザに音
声入力可能な状態であることが通知される(図5のタイ
ミングチャート参照)。
If it is determined in step S16 that the elapsed time from ON is shorter than the set time t0, the process returns to step S15 to continue capturing the audio signal. If the elapsed time from ON is longer than the set time t0, the process proceeds to step S17, and the input control unit 2 notifies the user that the voice can be input (see the timing chart of FIG. 5). .

【0041】通知の方法としては、例えば図4に示すよ
うに、通常は(a)のようなアイコンを表示部6に表示
しておき、音声入力可能な状態になったときに、(b)
のようなアイコンを表示する方法などがある。ユーザ
は、音声認識装置が入力可能な状態であること確認して
から発声を行う。
As a method of notification, as shown in FIG. 4, for example, an icon as shown in FIG.
There is a method of displaying an icon like. The user speaks after confirming that the speech recognition device is ready for input.

【0042】ステップS18:スイッチ状態検出部4に
よって、ユーザがスイッチ3を離したか否かが判断され
る。スイッチ3が押されたままであると判断した場合、
ステップS15に戻って音声信号の取り込みを続ける。
スイッチ3を離したと判断した場合、ステップS19に
移行して、入力制御部2によって、スイッチ3を離して
からの経過時間(OFFからの経過時間)が、予め設定
された設定時間t1 よりも長いか否かが判断される。
Step S18: The switch state detector 4 determines whether or not the user has released the switch 3. When it is determined that the switch 3 is kept pressed,
Returning to step S15, the capture of the audio signal is continued.
If it is determined that the switch 3 has been released, the process proceeds to step S19, where the input control unit 2 determines that the elapsed time since the switch 3 was released (the elapsed time from OFF) is longer than the preset time t1. It is determined whether it is long.

【0043】設定時間t1 を決定する方法としては、例
えばユーザに「発声が終了したらすぐにスイッチをOF
Fしてください。」という条件のもとで音声入力の実験
を行い、図6(b)に示すように発声の終了とスイッチ
OFFのタイミングを調べて設定する方法などがある。
As a method of determining the set time t 1, for example, the user is asked to “turn on the switch as soon as the utterance ends.
Please F. , An experiment of voice input is performed under the condition, and as shown in FIG. 6B, there is a method of checking and setting the timing of the end of the utterance and the switch OFF.

【0044】ステップS19の判断において、OFFか
らの経過時間が設定時間t1 よりも短い場合は、ステッ
プS15に戻り音声信号の取り込みを続ける。OFFか
らの経過時間が設定時間t1 よりも長い場合は、ステッ
プS20に移行し、入力制御部2によって、音声入力部
1に対して音声信号の取り込み終了が通知される。
If it is determined in step S19 that the elapsed time from OFF is shorter than the set time t1, the process returns to step S15 to continue capturing the audio signal. If the elapsed time from OFF is longer than the set time t1, the process proceeds to step S20, and the input control unit 2 notifies the voice input unit 1 of the completion of the capture of the voice signal.

【0045】ステップS21:入力制御部2によって、
音声入力1に対して音声入力部1の使用が終了した旨が
通知される。これ以降、他のアプリケーションソフト
は、音声入力部1を自由に使用することが可能となる。
Step S21: By the input control unit 2,
The voice input 1 is notified that the use of the voice input unit 1 has been completed. Thereafter, other application software can freely use the voice input unit 1.

【0046】次に、音声信号の取り込み終了を音声区間
中か否かで判断する場合の例を、図3のフローチャート
及び図1を参照しながら説明する。
Next, an example of a case where it is determined whether the end of the capture of the audio signal is in the audio section or not will be described with reference to the flowchart of FIG. 3 and FIG.

【0047】ステップS31:スイッチ状態検出部4に
よって、ユーザがスイッチ3を押したか否かが判断され
る。スイッチ3が押されたと判断した場合、入力制御部
2によって、音声入力部1に対して音声入力部1を使用
したい旨が通知される(ステップS32)。
Step S31: The switch state detector 4 determines whether the user has pressed the switch 3. If it is determined that the switch 3 has been pressed, the input control unit 2 notifies the voice input unit 1 that the user wants to use the voice input unit 1 (step S32).

【0048】ステップS33:入力制御部2によって、
音声入力部1からの情報に基づいて使用可能か否かが判
断される。他のアプリケーションソフトにより音声入力
部1が使用中である場合は音声入力部1を使用すること
ができないので、ステップS43に移行して、現在、他
のアプリケーションソフトが音声入力部1を使用中であ
る旨のエラーメッセージをユーザに対して出力して処理
を終了する。
Step S33: By the input control unit 2,
It is determined based on the information from the voice input unit 1 whether it can be used. If the voice input unit 1 is being used by another application software, the voice input unit 1 cannot be used. Therefore, the process proceeds to step S43, and the other application software is currently using the voice input unit 1. An error message to the effect is output to the user, and the process ends.

【0049】音声入力部1が使用可能である場合、これ
以降、他のアプリケーションソフトにより音声入力部1
を使用することができなくなり、入力制御部2によっ
て、音声入力部1に対して音声信号の取り込み開始が通
知される(ステップS34)。
When the voice input unit 1 can be used, the voice input unit 1 is thereafter used by another application software.
Cannot be used, and the input control unit 2 notifies the voice input unit 1 of the start of capturing the voice signal (step S34).

【0050】ステップS35:音声入力部1によって、
音声信号の取り込みが行われる。
Step S35: The voice input unit 1
An audio signal is captured.

【0051】ステップS36:入力制御部2によって、
スイッチ3が押されてからの経過時間(ONからの経過
時間)が、予め設定された設定時間t0 よりも長いか否
かが判断される。
Step S36: By the input control unit 2,
It is determined whether or not the elapsed time since the switch 3 was pressed (the elapsed time since ON) is longer than a preset time t0.

【0052】ONからの経過時間が設定時間t0 よりも
短い場合は、ステップS35に戻って音声信号の取り込
みを続ける。ONからの経過時間が設定時間t0 よりも
長い場合は、ステップS37に移行し、入力制御部2に
よって、ユーザに音声入力可能な状態であることが通知
される。なお、設定時間t0 は前述と同じ方法で決定す
る。
If the elapsed time from ON is shorter than the set time t0, the flow returns to step S35 to continue taking in the audio signal. If the elapsed time from ON is longer than the set time t0, the process proceeds to step S37, and the input control unit 2 notifies the user that the voice input is possible. The set time t0 is determined in the same manner as described above.

【0053】ステップS38:入力制御部2によって、
音声区間の切り出し処理を行う。
Step S38: By the input control unit 2,
The voice section is cut out.

【0054】音声区間の切り出しは、例えば音声信号か
ら算出した音声パワーについて、音声パワーが所定値以
上に増大した開始点を検出し、音声パワーが第1閾値以
下となる仮終了点を検出した後、所定の第2閾値を超え
て未満となる位置に仮終了点を順次移動していき、最後
の仮終了点が終了点と決定したことに対応し、前記開始
点から終了点までの音声信号を切り出すという処理にて
行う。
The audio section is cut out, for example, after detecting a start point of the audio power calculated from the audio signal, at which the audio power has increased to a predetermined value or more, and detecting a temporary end point at which the audio power is equal to or less than the first threshold value. The temporary end point is sequentially moved to a position that exceeds the predetermined second threshold value and becomes less than the predetermined second threshold value, and the audio signal from the start point to the end point corresponds to the determination that the final temporary end point is the end point. Is performed in a process of cutting out.

【0055】ステップS39:スイッチ状態検出部4に
よって、ユーザがスイッチ3を離したか否かが判断され
る。スイッチ3が押されたままであると判断した場合、
ステップS35に戻り音声信号の取り込みを続ける。
Step S39: The switch state detector 4 determines whether or not the user has released the switch 3. When it is determined that the switch 3 is kept pressed,
Returning to step S35, the capture of the audio signal is continued.

【0056】スイッチ3を離したと判断した場合、ステ
ップS40に移行し、入力制御部2によって、開始点を
検出した後、音声区間の終了点が決定されたか否かが判
断される。終了点が決定されていない場合、ステップS
35に戻って音声信号の取り込みを続ける。音声区間の
終了点が決定されている場合、ステップS41に移行
し、入力制御部2によって、音声入力部1に対して音声
信号の取り込み終了が通知される。
If it is determined that the switch 3 has been released, the process proceeds to step S40, and after the input control unit 2 detects the start point, it is determined whether or not the end point of the voice section has been determined. If the end point has not been determined, step S
Returning to 35, the acquisition of the audio signal is continued. If the end point of the voice section has been determined, the process proceeds to step S41, and the input control unit 2 notifies the voice input unit 1 of the end of the capture of the voice signal.

【0057】ステップS42:入力制御部2によって、
音声入力1に対して音声入力部1の使用が終了した旨が
通知される。
Step S42: By the input control unit 2,
The voice input 1 is notified that the use of the voice input unit 1 has been completed.

【0058】以上説明したような処理を音声認識処理の
前段に追加することにより、図5に示すように、従来の
処理では語尾の音声が欠けるような場合であっても、語
尾の音声が欠けることなく音声信号を取り込むことがで
きる。
By adding the processing described above to the preceding stage of the speech recognition processing, as shown in FIG. 5, even in the case where the speech at the end is missing in the conventional processing, the speech at the end is missing. Audio signals can be captured without the need.

【0059】すなわち、ユーザは、スイッチ3を押し、
音声入力可能な状態を表すアイコンを確認してから1回
だけ発声するということだけを覚えておけばよく、その
発声のタイミングとスイッチを離すタイミングをそれほ
ど意識しなくてもよい。さらに、音声入力可能な状態を
表すアイコンを表示する少し前から音声信号の取り込み
を行なっているので、万が一、音声入力可能な状態を表
すアイコンの表示より少し早く発声しても、語頭の音声
が欠けることを減らすことができる。
That is, the user presses the switch 3 and
It is sufficient to remember that the user only speaks once after confirming the icon indicating the state in which the voice can be input, and it is not necessary to be so conscious of the timing of the utterance and the timing of releasing the switch. Furthermore, since the audio signal is captured shortly before the icon indicating the state where voice input is possible is displayed, even if the utterance is a little earlier than the display of the icon indicating the state where voice input is possible, the voice at the beginning of the word will be lost. Chipping can be reduced.

【0060】また、本実施形態では、入力制御部2から
の音声入力部1の使用の通知/音声入力部1の使用終了
の通知により、必要なときだけ音声入力部1を動作させ
て音声信号を取り込むので、それ以外の間においては回
路動作を停止することにより消費電力を抑えることがで
きる。
In this embodiment, the input control unit 2 notifies the use of the voice input unit 1 and notifies the end of the use of the voice input unit 1 that the voice input unit 1 is operated only when necessary and the voice signal is used. Therefore, the power consumption can be suppressed by stopping the circuit operation during other times.

【0061】さらに、複数のアプリケーションソフトか
ら音声入力部1を使用する場合、図7(a)及び(b)
に例示するように、各アプリケーションソフトS1 ,S
2、S3 が音声入力部1を必要なときだけ占有するの
で、各アプリケーションソフトS1 ,S 2、S3 が音声
入力部1を時分割で使用することができる。
Further, when the voice input unit 1 is used from a plurality of application software, FIGS. 7A and 7B
As shown in the example, each application software S1, S
2, S3 occupies the voice input unit 1 only when necessary, so that each application software S1, S2, S3 can use the voice input unit 1 in a time-division manner.

【0062】ここで、以上説明した処理は、プログラム
により実行されるが、このプログラムの全部または一部
を、直接あるいは通信回線を介してフロッピー(登録商
標)ディスクやハードディスク等のコンピュータ読み取
り可能な記録媒体に予め格納しておき、必要に応じてイ
ンストールして用いてもよい。
Here, the above-described processing is executed by a program, and the whole or a part of the program is recorded on a computer-readable recording medium such as a floppy (registered trademark) disk or a hard disk directly or via a communication line. It may be stored in a medium in advance, and installed and used as needed.

【0063】[0063]

【発明の効果】以上説明したように、本発明によれば、
スイッチを用いて必要な音声区間をユーザが直接指定す
る方法において、抽出すべき音声区間の最初の部分や最
後の部分の欠落を少なくすることができるとともに、ユ
ーザにスイッチを押すタイミングと発声のタイミングを
意識させるような煩わしさをできるだけ軽減することが
できる。また、必要なときだけ音声入力デバイスを動作
させて音声信号を取り込むことにより消費電力を抑える
ことができる。さらに、1つのアプリケーションソフト
が常に音声入力部を占有することなく、他のアプリケー
ションソフトからも音声入力部を使用することが可能と
なる。
As described above, according to the present invention,
In a method in which a user directly specifies a necessary voice section using a switch, it is possible to reduce the loss of the first part and the last part of the voice section to be extracted, and to provide the user with a switch press timing and a utterance timing. It is possible to reduce the troublesomeness of making the user aware of the situation as much as possible. Further, power consumption can be suppressed by operating the audio input device only when necessary and taking in an audio signal. Furthermore, one application software does not always occupy the voice input unit, and it is possible to use the voice input unit from other application software.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の音声認識装置の実施形態の構成を示す
ブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an embodiment of a speech recognition device of the present invention.

【図2】経過時間により音声信号の取り込みを制御する
動作を示すフローチャートである。
FIG. 2 is a flowchart illustrating an operation of controlling capture of an audio signal based on elapsed time.

【図3】音声区間検出により音声信号の取り込みを制御
する動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation of controlling the capture of a voice signal by voice section detection.

【図4】(a)音声入力が不可の状態を表すアイコンの
例を示す図、(b)音声入力が可能な状態を表すアイコ
ンの例を示す図である
4A is a diagram illustrating an example of an icon indicating a state where voice input is not possible, and FIG. 4B is a diagram illustrating an example of an icon indicating a state where voice input is possible;

【図5】スイッチ操作、音声信号の取り込み区間及び取
り込んだ音声信号等のタイミングを示す図である。
FIG. 5 is a diagram showing a switch operation, an audio signal capturing section, and a timing of a captured audio signal.

【図6】(a)スイッチONからの経過時間に対する設
定時間の決め方を説明する図、(b)スイッチOFFか
らの経過時間に対する設定時間の決め方を説明する図で
ある。
6A is a diagram illustrating a method of determining a set time with respect to an elapsed time from a switch ON, and FIG. 6B is a diagram illustrating a method of determining a set time with respect to an elapsed time from a switch OFF.

【図7】(a)複数のアプリケーションソフトから音声
入力部を使用する場合を説明する図、(b)複数のアプ
リケーションソフトから音声入力部に対して使用要求が
出された場合の処理を説明する図である。
FIG. 7A illustrates a case where a voice input unit is used from a plurality of application software, and FIG. 7B illustrates a process when a use request is issued to the voice input unit from a plurality of application software. FIG.

【図8】従来の音声認識装置の概略構成を示す図であ
る。
FIG. 8 is a diagram showing a schematic configuration of a conventional voice recognition device.

【符号の説明】[Explanation of symbols]

1 音声入力部 1A マイク 1B A/D変換器 2 入力制御部 3 スイッチ 4 スイッチ状態検出部 5 音声認識部 6 表示部 Reference Signs List 1 voice input unit 1A microphone 1B A / D converter 2 input control unit 3 switch 4 switch state detection unit 5 voice recognition unit 6 display unit

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 音声信号の取り込みを指定するスイッチ
操作に応じて音声信号を取り込み、取り込んだ音声信号
を認識する音声認識装置であって、 音声入力部と、スイッチの操作状態を検出するスイッチ
状態検出部と、入力制御部を備え、その入力制御部は、
音声信号の取り込みが必要なときに音声入力部に対して
音声入力部の使用を通知し、音声信号の取り込みが必要
でなくなったときに音声入力部に対して音声入力部の使
用終了を通知するとともに、スイッチがOFFからON
状態になったときに、すぐに音声入力部に対して音声信
号の取り込み開始を通知し、スイッチがONからOFF
状態になったときに、所定時間だけ遅れて音声信号の取
り込み終了を通知する機能を備えていることを特徴とす
る音声認識装置。
1. A voice recognition device which captures a voice signal in response to a switch operation for designating capture of a voice signal and recognizes the captured voice signal, comprising: a voice input unit; and a switch state detecting an operation state of the switch. A detection unit, comprising an input control unit, the input control unit,
Notifies the voice input unit of the use of the voice input unit when the capture of the voice signal is necessary, and notifies the voice input unit of the end of the use of the voice input unit when the capture of the voice signal is no longer required. And switch is turned on from OFF
Immediately notifies the audio input unit of the start of audio signal capture when the status changes, and switches from ON to OFF.
A voice recognition device having a function of notifying the end of capturing of a voice signal with a delay of a predetermined time when a state is entered.
【請求項2】 前記入力制御部は、スイッチがOFFか
らON状態になったときに、すぐに音声入力部に対して
音声入力部の使用及び音声信号の取り込み開始を通知
し、スイッチがONからOFF状態になったときに、所
定時間だけ遅れて音声入力部に対して音声信号の取り込
み終了及び音声入力部の使用終了を通知する機能を備え
ていることを特徴とする請求項1記載の音声認識装置。
2. The input control section notifies the voice input section of use of the voice input section and start of capturing of a voice signal to the voice input section immediately when the switch is turned on from the OFF state. 2. The voice according to claim 1, further comprising a function of notifying the voice input unit of the end of the capture of the audio signal and the end of use of the audio input unit after a predetermined time when the state is turned off. Recognition device.
【請求項3】 前記入力制御部は、スイッチがOFFか
らON状態になったときに、すぐに音声入力部に対して
音声信号の取り込み開始を通知するとともに、スイッチ
がON状態になったときから、予め設定した設定時間が
経過した後に、ユーザに対して音声入力可能な状態であ
ることを通知する機能を備えていることを特徴とする請
求項1記載の音声認識装置。
3. The input control unit, when the switch is turned from OFF to ON, notifies the audio input unit immediately of the start of the capture of the audio signal, and starts from when the switch is turned ON. 2. The speech recognition device according to claim 1, further comprising a function of notifying a user that a speech input is possible after a preset time has elapsed.
【請求項4】 前記入力制御部は、スイッチがONから
OFF状態になったときから、予め設定した設定時間が
経過した後に、音声入力部に対して音声信号の取り込み
終了を通知する機能を備えていることを特徴とする請求
項1記載の音声認識装置。
4. The input control section has a function of notifying the audio input section of the completion of capturing of an audio signal after a preset set time has elapsed since the switch was turned from ON to OFF. The voice recognition device according to claim 1, wherein
【請求項5】 前記入力制御部は、音声区間検出機能を
備えているとともに、スイッチがONからOFF状態に
なり、かつ音声区間の検出が終了した後に、音声入力部
に対して音声信号の取り込み終了を通知する機能を備え
ていることを特徴とする請求項1記載の音声認識装置。
5. The input control section has a voice section detection function and captures a voice signal to the voice input section after the switch is turned from ON to OFF and the detection of the voice section is completed. 2. The speech recognition device according to claim 1, further comprising a function of notifying an end.
【請求項6】 音声信号の取り込みを指定するスイッチ
操作に応じて音声信号を取り込み、取り込まれた音声信
号を認識する処理プログラムを記録したコンピュータ読
み取り可能な記録媒体であって、 音声信号の取り込みが必要なときに音声入力部に対して
音声入力部の使用を通知し、音声信号の取り込みが必要
でなくなったときに音声入力部に対して音声入力部の使
用終了を通知するとともに、スイッチがOFFからON
状態になったときに、すぐに音声入力部に対して音声信
号の取り込み開始を通知し、スイッチがONからOFF
状態になったときに、所定時間だけ遅れて音声信号の取
り込み終了を通知することを特徴とする処理プログラム
を記録したコンピュータ読み取り可能な記録媒体。
6. A computer-readable recording medium storing a processing program for retrieving an audio signal in response to a switch operation for designating the capture of an audio signal and recognizing the captured audio signal, wherein the recording of the audio signal is performed. Notifies the voice input unit of the use of the voice input unit when necessary, and notifies the voice input unit of the end of use of the voice input unit when the capture of the voice signal is no longer necessary, and turns off the switch. ON
Immediately notifies the audio input unit of the start of audio signal capture when the status changes, and switches from ON to OFF.
A computer-readable recording medium having recorded thereon a processing program for notifying the end of taking in of an audio signal after a predetermined time when the state is set.
JP2000294434A 2000-09-27 2000-09-27 Speech recognition device and computer-readable recording medium Pending JP2002108390A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000294434A JP2002108390A (en) 2000-09-27 2000-09-27 Speech recognition device and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000294434A JP2002108390A (en) 2000-09-27 2000-09-27 Speech recognition device and computer-readable recording medium

Publications (1)

Publication Number Publication Date
JP2002108390A true JP2002108390A (en) 2002-04-10

Family

ID=18777044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000294434A Pending JP2002108390A (en) 2000-09-27 2000-09-27 Speech recognition device and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP2002108390A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287795A (en) * 2001-03-27 2002-10-04 Clarion Co Ltd On-vehicle voice recognition device
JP2004094077A (en) * 2002-09-03 2004-03-25 Nec Corp Speech recognition device and control method, and program
WO2006106272A3 (en) * 2005-04-07 2007-02-15 France Telecom Method for synchronization between a voice recognition processing operation and an action triggering said processing
JP2008129084A (en) * 2006-11-16 2008-06-05 Toshiba Tec Corp Voice input device and voice input method
JP2011059659A (en) * 2009-09-10 2011-03-24 Mitsubishi Electric Research Laboratories Inc Method and system for activating multiple functions including first function and second function
JP2013141237A (en) * 2011-12-30 2013-07-18 Samsung Electronics Co Ltd Electronic apparatus and control method thereof
JP2014095766A (en) * 2012-11-08 2014-05-22 Sony Corp Information processing apparatus, information processing method, and program
EP3043349B1 (en) 2006-01-06 2019-10-30 Pioneer Corporation A words recognition apparatus

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150295A (en) * 1985-12-24 1987-07-04 松下電器産業株式会社 Voice recognition method
JPH02131300A (en) * 1988-11-11 1990-05-21 Toshiba Corp Voice recognizing device
JPH02132998A (en) * 1988-11-14 1990-05-22 Toshiba Corp Microphone
JPH02141799A (en) * 1988-11-24 1990-05-31 Matsushita Electric Ind Co Ltd voice recognition device
JPH03202899A (en) * 1989-12-29 1991-09-04 Pioneer Electron Corp Voice remote control device
JPH08185196A (en) * 1994-12-28 1996-07-16 Sony Corp Voice section detector
JPH1134442A (en) * 1997-07-11 1999-02-09 Ricoh Co Ltd Printing equipment
JP2000075874A (en) * 1998-09-01 2000-03-14 Sharp Corp Information processing apparatus and recording medium recording information processing computer program
JP2000089789A (en) * 1998-09-08 2000-03-31 Fujitsu Ltd Voice recognition device and recording medium

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62150295A (en) * 1985-12-24 1987-07-04 松下電器産業株式会社 Voice recognition method
JPH02131300A (en) * 1988-11-11 1990-05-21 Toshiba Corp Voice recognizing device
JPH02132998A (en) * 1988-11-14 1990-05-22 Toshiba Corp Microphone
JPH02141799A (en) * 1988-11-24 1990-05-31 Matsushita Electric Ind Co Ltd voice recognition device
JPH03202899A (en) * 1989-12-29 1991-09-04 Pioneer Electron Corp Voice remote control device
JPH08185196A (en) * 1994-12-28 1996-07-16 Sony Corp Voice section detector
JPH1134442A (en) * 1997-07-11 1999-02-09 Ricoh Co Ltd Printing equipment
JP2000075874A (en) * 1998-09-01 2000-03-14 Sharp Corp Information processing apparatus and recording medium recording information processing computer program
JP2000089789A (en) * 1998-09-08 2000-03-31 Fujitsu Ltd Voice recognition device and recording medium

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002287795A (en) * 2001-03-27 2002-10-04 Clarion Co Ltd On-vehicle voice recognition device
JP2004094077A (en) * 2002-09-03 2004-03-25 Nec Corp Speech recognition device and control method, and program
WO2006106272A3 (en) * 2005-04-07 2007-02-15 France Telecom Method for synchronization between a voice recognition processing operation and an action triggering said processing
US8301442B2 (en) 2005-04-07 2012-10-30 France Telecom Method for synchronization between a voice recognition processing operation and an action triggering said processing
EP3043349B1 (en) 2006-01-06 2019-10-30 Pioneer Corporation A words recognition apparatus
EP3618065B1 (en) 2006-01-06 2021-05-26 Pioneer Corporation Words recognition apparatus
JP2008129084A (en) * 2006-11-16 2008-06-05 Toshiba Tec Corp Voice input device and voice input method
JP2011059659A (en) * 2009-09-10 2011-03-24 Mitsubishi Electric Research Laboratories Inc Method and system for activating multiple functions including first function and second function
JP2013141237A (en) * 2011-12-30 2013-07-18 Samsung Electronics Co Ltd Electronic apparatus and control method thereof
US9552057B2 (en) 2011-12-30 2017-01-24 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling the same
USRE50198E1 (en) 2011-12-30 2024-11-05 Samsung Electronics Co., Ltd. Electronic apparatus and method for controlling the same
CN104781782A (en) * 2012-11-08 2015-07-15 索尼公司 Information processing apparatus, information processing method, and program
JP2014095766A (en) * 2012-11-08 2014-05-22 Sony Corp Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
US20240265919A1 (en) Electronic device and voice recognition method thereof
KR102339657B1 (en) Electronic device and control method thereof
EP0702351B1 (en) Method and apparatus for analysing audio input events in a speech recognition system
JP3586777B2 (en) Voice input device
US7908146B2 (en) Digital television receiver controlled by speech recognition
TWI235358B (en) Interactive speech method and system thereof
KR20080109322A (en) Service providing method and device according to user's intuitive intention
JPWO2007111162A1 (en) Text display device, text display method and program
JP2006352869A (en) Communication terminal and call content transmission method in communication terminal
US7983921B2 (en) Information processing apparatus for speech recognition with user guidance, method and program
JP2002108390A (en) Speech recognition device and computer-readable recording medium
US20080140423A1 (en) Information processing apparatus and information processing method
JP2011248140A (en) Voice recognition device
JP2001067091A (en) Voice recognition device
CN105446695A (en) Notification message removal method and apparatus
KR100657059B1 (en) Voice recognition driving method
JP4675514B2 (en) Audio processing apparatus, audio processing method, and computer-readable recording medium storing a program for performing the method
JPH1115490A (en) Microphone system and speech recognition system
KR102494051B1 (en) Electronic device for speech recognition and method thereof
JP2008051882A (en) Voice information processing apparatus and control method thereof
JP3698635B2 (en) Speech recognition processor
JPH10133849A (en) Personal computer and error notification method
JP2003044075A (en) Electronic equipment with voice recognition function
KR102359163B1 (en) Electronic device for speech recognition and method thereof
WO2020165933A1 (en) Apparatus control device, apparatus control system, apparatus control method, apparatus control program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050809