JP4217495B2

JP4217495B2 - 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体

Info

Publication number: JP4217495B2
Application number: JP2003021029A
Authority: JP
Inventors: 寛樹山本
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2003-01-29
Filing date: 2003-01-29
Publication date: 2009-02-04
Anticipated expiration: 2023-01-29
Also published as: JP2004233577A; US20040153312A1; US7505903B2

Description

【０００１】
【発明の属する技術分野】
本発明は音声認識辞書作成技術に関するものである。
【０００２】
【従来の技術】
音声認識性能の向上により、音声認識機能を備えて音声入力で電子メールを作成できるアプリケーションが製品化されている。現在の音声認識では、音声認識辞書に登録された単語のみを認識対象とする方法が主流であり、音声認識辞書に存在しない単語（未知語）は基本的に認識できない。ディクテーション用の音声認識ソフトでは、数万語から十数万語の基本となる音声認識辞書を備えているものが多いが、必ずしも使用者が必要とする単語が全て含まれているわけではない。
【０００３】
これに対する解決方法として、市販されている多くの音声認識アプリケーションでは、既存の音声認識辞書に使用者自身が単語を追加登録して音声認識辞書を更新する機能や、使用者個人用の音声認識辞書を作成する機能を提供している。単語を登録する方法として、
▲１▼登録する単語の表記および単語の読み（発音）などの情報を一語一語使用者がキーボードなどで入力する方法、
▲２▼登録する単語を含むテキストを使用者が指定するだけでアプリケーションが単語登録に必要な処理を全て自動的で行う方法、
などが実現されている。
【０００４】
▲２▼の方法として、特開２００１−９２４８５号公報では、テキストから未知語を抽出し、読みを付与して音声認識辞書に追加する方法の一例が開示されている。
【０００５】
一方、一旦登録した単語は、使用者が音声認識辞書から削除するまで保持するのが一般的である。
【０００６】
【特許文献１】
特開２００１−９２４８５号公報
【０００７】
【発明が解決しようとする課題】
しかしながら、電子メールは、その時々の話題で書く内容が異なるため、メール作成の際に使用する単語は頻繁に変化する。したがって、音声認識を用いてメールを作成する場合は、話題が変わる度に音声認識辞書に含まれない単語が出現する可能性が高く、音声認識辞書を更新する機会は多いと予想される。
【０００８】
従来の方法で説明した▲１▼の方法にしたがって音声認識辞書を更新する場合は、一語一語表記や読みを使用者が入力する必要があり、話題が変化した時など登録すべき単語が多い時は非常に煩わしい。これに対し▲２▼の方法を用いると、より簡単に音声認識辞書を更新することが可能である。
【０００９】
一般に、受信したメールに対して返信を書く場合は、受信したメールに含まれる単語を返信内容に使うことが多いと予想される。したがって、受信したメールに含まれる未知語を自動的に音声認識辞書に追加することによって、使用者が▲１▼の方法で追加すべき単語数を減らすことができる。
【００１０】
また、メールでやり取りする話題は一過性のものが多く、メールで使用する単語は時間とともに入れ替わるため、一度登録した単語を以後ずっと保持するよりは、その都度必要な単語を登録する方が合理的である。
【００１１】
本発明は、上記課題に鑑みてなされたものであって、音声入力による文書データの作成において使用される音声認識辞書の作成にあたり、使用者の利便性を向上させることを目的とする。
【００１２】
【課題を解決するための手段】
上記の目的を達成するために本発明に係る音声認識辞書作成方法は以下のような構成を備える。即ち、
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
作成手段が、前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程とを備える。
【００１３】
【発明の実施の形態】
【第１の実施形態】
図１は、本発明の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの好適な実施形態の概略構成を示すブロック図である。
【００１４】
同図の音声認識システム２０において、２１は通信部、２２は制御部、２３は音声認識部、２４は文書データ読み込み部、２５は文書データ解析部、２６は言語処理部、２７は未知語抽出部、２８は認識辞書作成・保守部、３０は基本認識辞書、３１はメール作成用認識辞書、３２は言語処理用辞書である。
【００１５】
通信部２１は、ＯＳや外部アプリケーション１０との文書データ１１などの各種データのやり取りや使用者がマウスやキーボードを操作した際に発生するイベントの検出を行う。制御部２２は、本発明の実施形態にかかる音声認識辞書作成方法を実現する音声認識システム２０の各モジュールを制御し、システム全体の処理を統括する。
【００１６】
音声認識部２３は、マイクロフォンなどから入力される音声を、基本認識辞書３０およびメール作成用認識辞書３１を用いて音声認識処理を行い、認識結果を通信部２１を通してアプリケーション１０に出力する。
【００１７】
文書データ読み込み部２４は、メール作成用認識辞書３１を作成する際に利用する文書データ１１をアプリケーションから通信部２１を介して読み込む。
【００１８】
文書データ解析部２５は、読み込んだ文書データ１１からメール作成用認識辞書３１を作成する際に必要な情報や文書の内容であるテキストを抽出するため、読み込んだ文書データ構造を解析する。
【００１９】
言語処理部２６は、文書データ解析部から抽出されたテキストに対して、言語処理用辞書３２を用いて形態素解析を行い、テキストを単語に分割し、各単語に読みなどの音声認識辞書作成に必要な情報を付与する。
【００２０】
未知語抽出部２７は、言語処理部によって分割された各単語を、基本認識辞書３０を参照して、基本認識辞書３０に存在する単語と存在しない単語とに分類する。
【００２１】
認識辞書作成・保守部２８は、未知語抽出部２７での単語分類結果に基づき、基本認識辞書３０に存在しない単語を追加するなどしてメール作成用認識辞書３１を更新あるいは新規に作成する。また、メール作成用認識辞書３１が不要になった場合には辞書を削除する。また、複数のメール作成用認識辞書３１を使用する場合の、各辞書および辞書内の単語の更新・削除などを行う。
【００２２】
基本認識辞書３０、メール作成用認識辞書３１は、音声認識部２３が音声認識を行う際に、認識の対象となる単語の表記や読みなどを記述した辞書であり、基本認識辞書３０には音声認識システムがあらかじめ用意した単語が登録されている。また、メール作成用認識辞書３１は、作成するメールに応じて一時的に必要となる単語を本音声認識システムが自動的に登録した辞書である。なお、基本認識辞書３０には、使用者が独自に選択して追加した単語（個人辞書）を含むものとする。
【００２３】
言語処理用辞書３２は、単語の品詞や読みなど言語処理部２６が形態素解析や単語に読みをつけるために必要な情報を記述した辞書である。
【００２４】
以上の構成を備えた図１の音声認識システムの動作を図２を用いて述べる。なお、以下では、電子メールを単にメールと記述する。
【００２５】
図２は、本発明の第１の実施形態に係る音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。図２に従い、使用者がメール・アプリケーション１０で受信したメールに対して音声認識を用いて返信メールを作成する場合についてシステム全体の処理の流れを概説する。
【００２６】
本実施形態では、使用者が受信したメールを閲覧中に返信を行う場合を想定している。一般的なメール・アプリケーションでは、閲覧中のメールに返信を行う場合、ディスプレイなどの表示装置上に表示された返信ボタンをマウスでクリックしたり、アプリケーションのメニューから返信を選択することによって、自動的に返信メールを編集するウィンドウが表示される。
【００２７】
本音声認識システムでは、このような使用者の操作、すなわち『受信したメールに対する返信メールの作成を開始する』というアクションを検出した場合に一連の処理を開始する。使用者の操作は、アプリケーション１０と音声認識システム２０とが互いにあるいはＯＳを介して通信することで検出可能である。例えば、アプリケーション１０から音声認識システム２０に対して、返信メール作成を開始するメッセージを直接送っても良いし、使用者の操作によって生じるマウス操作などのイベントを音声認識システム２０の側で検出するようにしてもよい。
【００２８】
音声認識システム２０では、通信部２１によって使用者が返信メールの作成を開始したことを検出すると（ステップＳ１０１）、文書データ読み込み部２４がアプリケーション１０から返信の対象となる受信メールの文書データ１１を読み込む（ステップＳ１０２）。
【００２９】
次に、ステップＳ１０３において、文書データ解析部２５により、受信メールの文書データを解析し、宛先や送信元などが記載されたヘッダ部分を取り除いたメールの本文を言語処理部２６に渡す。図３に受信メールの一例を示す。文書データ解析部２５では、ヘッダ部分４１を取り除いたメールの本文４２を言語処理部２６に渡す。なお、読み込んだ文書データがＨＴＭＬやＸＭＬで記述された文書である場合は、文書データ解析部２５によりタグなどの不要な部分を削除する。
【００３０】
言語処理部２６では、渡された文書データを形態素解析して解析結果を未知語抽出部２７に渡す（ステップＳ１０５）。本実施形態の形態素解析では、べた書きされた文書を形態素（単語）に分割し、それぞれの形態素に読みを自動で付与し、例えば図４に示すような形式で形態素解析結果を出力する。
【００３１】
次にステップＳ１０５において、未知語抽出部２７により基本認識辞書３０と形態素解析結果とを比較して基本認識辞書に存在する単語と存在しない単語とに分類する。
【００３２】
ステップＳ１０５の未知語抽出処理の結果に基づき、ステップＳ１０６において認識辞書作成・保守部２８により、未知語のみを登録した新たな音声認識辞書を作成し、メール作成用認識辞書３１として記憶する。ステップＳ１０５で『入出力』『例会』『エスペランス』『仲原』が未知語に分類された場合に作成されるメール作成用認識辞書３１の例を、図５に示す。この例では、音声認識辞書に記述されるのは、単語の表記および読みであるが、これに限るものではなく、後段の音声認識処理で必要な場合は、例えば、発音情報、品詞情報、単語の出現頻度(出現確率)などを含んでいてもよい。
【００３３】
以上の処理によって作成されたメール作成用認識辞書３１および基本認識辞書３０を用いて、返信メール作成のために入力された使用者の音声を音声認識部２３で音声認識し、認識結果を通信部２１を介してアプリケーションに出力する（ステップＳ１０７）。なお、音声認識の際は、メール作成用認識辞書３１と基本認識辞書３０とを併用する。
【００３４】
次に返信メール作成終了を検出する（ステップＳ１０８）と、返信のために作成したメール作成用認識辞書３１を、認識辞書作成・保守部２８によって削除する（ステップＳ１０９）。ここで、使用者が返信メールの作成終了を検出する方法は、作成開始の検出と同様に、使用者がメールを送信する操作を行った際に、アプリケーション１０から作成終了のメッセージを音声認識システム２０に送ってもよいし、使用者の操作イベントを通信部２１で検出してもよい。
【００３５】
以上の説明から明らかなように、本実施形態によれば、受信メールから得られる文書データから、既存の音声認識辞書にない未知語を抽出してメール作成に必要な単語を音声認識辞書に登録することにより、使用者の利便性を向上した音声認識辞書を作成することが可能となる。
【００３６】
【第２の実施形態】
上記第１の実施形態のステップＳ１０９では、作成したメール作成用認識辞書３１をメール作成終了を検出した時点で削除しているが、他の実現方法として、一定期間経過した場合に削除するようにしてもよい。すなわち、作成したメール作成用認識辞書３１をメール作成終了と同時に削除するのではなく、その後も一定の期間、再利用する。この場合の処理の流れを図を用いて以下で説明する。
【００３７】
第１の実施形態と異なるのは、ステップＳ１０５の未知語抽出およびステップＳ１０６のメール作成用認識辞書作成およびステップＳ１０９のメール作成用認識辞書削除であるので、この部分の処理に焦点を当て説明する。
【００３８】
図６は、図２におけるステップＳ１０５およびステップＳ１０６に相当する部分の本実施形態における処理の流れを説明する図である。
【００３９】
未知語を抽出する際に、ステップＳ２０１でメール作成用認識辞書がすでに存在するかどうかを確認し、存在する場合はステップＳ２０２の処理へ、存在しない場合はステップＳ２０６の処理へ移行する。
【００４０】
ステップＳ２０２では、メール作成用認識辞書３１が古いかどうかを判断する。この判断のため、後段の処理で作成あるいは更新するメール作成用認識辞書に関して、更新日時７１を記録する。更新日時をメール作成用認識辞書中に記録する例を図７に示す。図７のメール作成用認識辞書では、図５で示したメール作成用認識辞書の例と同様、単語の表記と読みが列挙される他、辞書を作成した日時あるいは更新日時などの時間情報が更新日時として記述されている。
【００４１】
図７の例では、メール作成用認識辞書内に時間情報を記録した例を示したが、これに限るものではなく、メール作成用認識辞書とは別に、更新日時を記録しても良い。
【００４２】
また、経過時間Ｔに関しては、例えば日数単位、月単位、時間単位など任意の単位で設定できるものとする。
【００４３】
図６の説明に戻り、ステップＳ２０２において、メール作成用認識辞書３１の更新日時７１から現在時刻までの経過時間がＴを越えている場合はメール作成用認識辞書３１を削除する(ステップＳ２０５)。逆にメール作成用認識辞書３１の更新日時からの経過時間がＴ以内の場合は、以降の処理で、メール作成用認識辞書３１に未知語を追加して辞書を更新する。
【００４４】
ステップＳ２０３で、ステップＳ１０４の形態素解析で得られた単語のうち、基本認識辞書およびメール作成用認識辞書に存在しない単語を未知語として分類する。
【００４５】
ステップＳ２０４では、メール作成用認識辞書に未知語に分類された単語を追加して、メール作成用認識辞書を更新する。この際、メール作成用認識辞書の更新日時を更新する。
【００４６】
次に、メール作成用認識辞書が存在しない場合あるいは辞書を削除した場合であるステップＳ２０６以降の処理を説明する。
【００４７】
ステップＳ２０６では、未知語を抽出する際に、形態素解析結果と基本認識辞書３０とを比較し、基本認識辞書に存在しない単語を未知語として分類する。
続いて、ステップＳ２０７で未知語を含むメール作成用認識辞書を新規に作成する。この時、辞書の作成時間・更新日時を更新する。
【００４８】
以上の処理で作成あるいは更新されたメール作成用認識辞書３１を用いて第１の実施形態のステップＳ１０７以降の処理と同様の処理を行う。ただし、メール作成の終了後にメール作成用認識辞書を削除するステップＳ１０９の処理を行わずに終了する。
【００４９】
以上の説明から明らかなように、本実施形態によれば、必要のなくなった音声認識辞書については、一定期間経過後に自動的に削除して音声認識辞書を更新することが可能となり、辞書サイズの肥大化を回避し、音声認識辞書に対する使用者の利便性が向上する。
【００５０】
【第３の実施形態】
上記第２の実施形態では、メール作成用認識辞書３１の削除を、辞書単位に行ったが、単語単位に管理する方法も考えられる。この場合、更新日時はメール作成用認識辞書３１中に含まれる単語単位に管理する。単語ごとの更新日時をメール作成用認識辞書３１中に記述した例を図８に示す。図に示す通り、各単語ごとに表記、読みの他、その単語が登録された日時や更新された日時などを示す時間情報８１が付与されている。
【００５１】
このようなメール作成用認識辞書３１を用いた場合の処理の流れを図９を用いて説明する。この場合の処理の流れを図を用いて以下で説明する。
【００５２】
第１の実施形態と異なるのは、ステップＳ１０５の未知語抽出およびステップＳ１０６のメール作成用認識辞書作成およびステップＳ１０９のメール作成用認識辞書削除であるので、この部分の処理に焦点を当て説明する。
【００５３】
図９は、図２におけるステップＳ１０５およびステップＳ１０６に相当する部分の本実施形態における処理の流れを説明する図である。
【００５４】
ステップＳ１０４の形態素解析終了後、メール作成用認識辞書がある場合はステップＳ３０２の処理へ、ない場合はステップＳ３０５の処理へ移る（ステップＳ３０１）。
【００５５】
ステップＳ３０２では、メール作成用認識辞書３１に登録された単語のうち、更新日時８１からの経過時間がＴを越えた単語を削除する。次にステップＳ１０４の形態素解析で得られた単語のうち、基本認識辞書およびメール作成用認識辞書に存在しない単語を未知語として分類する。
【００５６】
続いて、ステップＳ３０４で、メール作成用認識辞書に未知語に分類された単語を追加登録するとともに、追加した単語の更新日時を現在時刻に設定する。
【００５７】
さらに、形態素解析結果で得られた単語のうち未知語でない単語と同一の単語がメール作成用認識辞書に存在する場合は、その単語の更新日時８１を現在時刻に更新する。
【００５８】
すなわち、それまでに登録されていた単語であっても新規に読み込んだ文書データ１１中に存在する単語については、更新日時を更新する。
【００５９】
次に、メール作成用認識辞書が存在しない場合であるステップＳ３０５以降の処理を説明する。
【００６０】
ステップＳ３０５では、未知語を抽出する際に、形態素解析結果と基本認識辞書３０とを比較し、基本認識辞書に存在しない単語を未知語として分類する。
【００６１】
続いて、ステップＳ３０６で未知語を含むメール作成用認識辞書３１を新規に作成する。この時、登録した単語の更新日時を更新する。
【００６２】
以上の説明から明らかなように、本実施形態によれば、音声認識辞書に含まれる必要のなくなった単語を、一定期間経過後に自動的に削除することが可能となり、音声認識辞書に対する使用者の利便性がさらに向上する。
【００６３】
【第４の実施形態】
以上の各実施形態では、メール作成用認識辞書を一つだけ持つ場合について説明したが、第２、第３の実施形態のように一定期間、メール作成用認識辞書を保持する場合は、作成するメールの目的に応じて複数のメール作成用認識辞書を使い分けた方が便利な場合がある。例えば、本実施形態で説明している返信メールを書く場合は、メールを送る相手によって話題や用いる単語が異なるため、送信先ごとにメール作成用認識辞書を使い分ける方がより高い認識性能を期待できる。
【００６４】
メールの送信先は、通信部２２を通じてアプリケーションから取得してもよいし、ステップＳ１０３において文書データを解析する際に、ヘッダ情報４１から受信メールの送信元を抽出し、これを送り先と判断してもよい。
【００６５】
同様にして、アプリケーションあるいは受信メールからメールのＳｕｂｊｅｃｔ（サブジェクト）を話題として抽出することも可能である。
【００６６】
このようにして抽出した、送り先あるいは話題ごとにメール作成用認識辞書を作成すれば、より利便性のよいメール作成用認識辞書を提供できる。
【００６７】
【第５の実施形態】
以上の各実施形態では、メールの返信を作成する場合の処理について説明したが、これに限るものではなく、本発明は、例えばウェブブラウザにおいて『ｍａｉｌｔｏ』タグで記述された部分をクリックしてメールを作成するような場合にも適用可能である。
【００６８】
この場合、文書データ１１に相当するのは、『ｍａｉｌｔｏ』が記述されているページを表示するために用いられたＨＴＭＬなどのページ記述言語で書かれた構造化文書である。ページ記述言語で記述された文書は、文書の整形などのため多数のタグが含まれているが、これらはウェブブラウザで行っている解析（パーズ）と同様の処理を文書データ解析部２５で行うことで、ブラウザ上に表示された文字だけを抽出することが可能である。従って、メールの返信を例に説明した第１〜第４の実施形態は、同時にウエブブラウザからメールを送信する場合にも適用可能であり、同様の効果が得られる。
【００６９】
さらに、この場合、第４の実施形態で説明した、複数のメール作成用認識辞書を、送信先ごと、話題（サブジェクト）ごとに管理する方法に加え、ＵＲＬごとに管理することもできる。
【００７０】
【第６の実施形態】
登録された単語あるいはメール作成用辞書を削除する基準となる経過時間Ｔは使用者が設定できるようにしてもよい。
【００７１】
【第７の実施形態】
上記各実施形態では、返信メールを作成する場合の処理について説明したが、本発明はこれに限られるものではなく、他の文書データを作成する際にも適用可能であることはいうまでもない。
【００７２】
【他の実施形態】
なお、本発明は、複数の機器（例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど）から構成されるシステムに適用しても、一つの機器からなる装置（例えば、複写機、ファクシミリ装置など）に適用してもよい。
【００７３】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【００７４】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【００７５】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどを用いることができる。
【００７６】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【００７７】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【００９５】
【発明の効果】
以上説明したように本発明によれば、音声入力による文書データの作成において使用される音声認識辞書の作成にあたり、使用者の利便性を向上することが可能となる。
【図面の簡単な説明】
【図１】本発明の第１の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの構成の一例を説明する図である。
【図２】本発明の第１の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。
【図３】本発明の第１の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムにおいて受信した電子メールの内容の一例を説明する図である。
【図４】本発明の第１の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムにおける形態素解析の結果の一例を説明する図である。
【図５】本発明の第１の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図６】本発明の第２の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。
【図７】本発明の第２の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図８】本発明の第３の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図９】本発明の第３の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。

Claims

メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
作成手段が、前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程と
を備えることを特徴とする音声認識辞書作成方法。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
作成手段が、前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程と
を備えることを特徴とする音声認識辞書作成方法。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶工程と、
削除手段が、前記記憶された登録日時から設定された期間を経過した未知語を削除する削除工程と
を備えることを特徴とする音声認識辞書作成方法。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶工程と、
削除手段が、前記記憶された登録日時から設定された期間を経過した未知語を削除する削除工程と
を備えることを特徴とする音声認識辞書作成方法。
前記未知語を抽出する工程において、解析した文書データ中に既存の未知語を含む音声認識辞書に登録された単語が含まれる場合に、更新手段が、該単語の前記登録日時を更新する更新工程を更に備えることを特徴とする請求項３または４に記載の音声認識辞書作成方法。
請求項１乃至５のいずれか１項に記載の音声認識辞書作成方法をコンピュータによって実現させるための制御プログラム。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成手段と、
前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段と
を備えることを特徴とする音声認識辞書作成装置。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成手段と、
前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段と
を備えることを特徴とする音声認識辞書作成装置。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段と
を備えることを特徴とする音声認識辞書作成装置。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段と
を備えることを特徴とする音声認識辞書作成装置。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成手段と、
前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成手段と、
前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
メール作成処理が開始されたことを検出する検出手段と、
前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。