[go: up one dir, main page]

JP4217495B2 - 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体 - Google Patents

音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体 Download PDF

Info

Publication number
JP4217495B2
JP4217495B2 JP2003021029A JP2003021029A JP4217495B2 JP 4217495 B2 JP4217495 B2 JP 4217495B2 JP 2003021029 A JP2003021029 A JP 2003021029A JP 2003021029 A JP2003021029 A JP 2003021029A JP 4217495 B2 JP4217495 B2 JP 4217495B2
Authority
JP
Japan
Prior art keywords
recognition dictionary
mail
speech recognition
creating
unknown word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003021029A
Other languages
English (en)
Other versions
JP2004233577A5 (ja
JP2004233577A (ja
Inventor
寛樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003021029A priority Critical patent/JP4217495B2/ja
Priority to US10/760,314 priority patent/US7505903B2/en
Publication of JP2004233577A publication Critical patent/JP2004233577A/ja
Publication of JP2004233577A5 publication Critical patent/JP2004233577A5/ja
Application granted granted Critical
Publication of JP4217495B2 publication Critical patent/JP4217495B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は音声認識辞書作成技術に関するものである。
【0002】
【従来の技術】
音声認識性能の向上により、音声認識機能を備えて音声入力で電子メールを作成できるアプリケーションが製品化されている。現在の音声認識では、音声認識辞書に登録された単語のみを認識対象とする方法が主流であり、音声認識辞書に存在しない単語(未知語)は基本的に認識できない。ディクテーション用の音声認識ソフトでは、数万語から十数万語の基本となる音声認識辞書を備えているものが多いが、必ずしも使用者が必要とする単語が全て含まれているわけではない。
【0003】
これに対する解決方法として、市販されている多くの音声認識アプリケーションでは、既存の音声認識辞書に使用者自身が単語を追加登録して音声認識辞書を更新する機能や、使用者個人用の音声認識辞書を作成する機能を提供している。単語を登録する方法として、
▲1▼登録する単語の表記および単語の読み(発音)などの情報を一語一語使用者がキーボードなどで入力する方法、
▲2▼登録する単語を含むテキストを使用者が指定するだけでアプリケーションが単語登録に必要な処理を全て自動的で行う方法、
などが実現されている。
【0004】
▲2▼の方法として、特開2001−92485号公報では、テキストから未知語を抽出し、読みを付与して音声認識辞書に追加する方法の一例が開示されている。
【0005】
一方、一旦登録した単語、使用者が音声認識辞書から削除するまで保持するのが一般的である。
【0006】
【特許文献1】
特開2001−92485号公報
【0007】
【発明が解決しようとする課題】
しかしながら、電子メールは、その時々の話題で書く内容が異なるため、メール作成の際に使用する単語は頻繁に変化する。したがって、音声認識を用いてメールを作成する場合は、話題が変わる度に音声認識辞書に含まれない単語が出現する可能性が高く、音声認識辞書を更新する機会は多いと予想される。
【0008】
従来の方法で説明した▲1▼の方法にしたがって音声認識辞書を更新する場合は、一語一語表記や読みを使用者が入力する必要があり、話題が変化した時など登録すべき単語が多い時は非常に煩わしい。これに対し▲2▼の方法を用いると、より簡単に音声認識辞書を更新することが可能である。
【0009】
一般に、受信したメールに対して返信を書く場合は、受信したメールに含まれる単語を返信内容に使うことが多いと予想される。したがって、受信したメールに含まれる未知語を自動的に音声認識辞書に追加することによって、使用者が▲1▼の方法で追加すべき単語数を減らすことができる。
【0010】
また、メールでやり取りする話題は一過性のものが多く、メールで使用する単語は時間とともに入れ替わるため、一度登録した単語を以後ずっと保持するよりは、その都度必要な単語を登録する方が合理的である。
【0011】
本発明は、上記課題に鑑みてなされたものであって、音声入力による文書データの作成において使用される音声認識辞書の作成にあたり、使用者の利便性を向上させることを目的とする。
【0012】
【課題を解決するための手段】
上記の目的を達成するために本発明に係る音声認識辞書作成方法は以下のような構成を備える。即ち、
メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
検出手段が、メール作成処理が開始されたことを検出する検出工程と、
読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
作成手段が、前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成工程と、
記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程とを備える。
【0013】
【発明の実施の形態】
【第1の実施形態】
図1は、本発明の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの好適な実施形態の概略構成を示すブロック図である。
【0014】
同図の音声認識システム20において、21は通信部、22は制御部、23は音声認識部、24は文書データ読み込み部、25は文書データ解析部、26は言語処理部、27は未知語抽出部、28は認識辞書作成・保守部、30は基本認識辞書、31はメール作成用認識辞書、32は言語処理用辞書である。
【0015】
通信部21は、OSや外部アプリケーション10との文書データ11などの各種データのやり取りや使用者がマウスやキーボードを操作した際に発生するイベントの検出を行う。制御部22は、本発明の実施形態にかかる音声認識辞書作成方法を実現する音声認識システム20の各モジュールを制御し、システム全体の処理を統括する。
【0016】
音声認識部23は、マイクロフォンなどから入力される音声を、基本認識辞書30およびメール作成用認識辞書31を用いて音声認識処理を行い、認識結果を通信部21を通してアプリケーション10に出力する。
【0017】
文書データ読み込み部24は、メール作成用認識辞書31を作成する際に利用する文書データ11をアプリケーションから通信部21を介して読み込む。
【0018】
文書データ解析部25は、読み込んだ文書データ11からメール作成用認識辞書31を作成する際に必要な情報や文書の内容であるテキストを抽出するため、読み込んだ文書データ構造を解析する。
【0019】
言語処理部26は、文書データ解析部から抽出されたテキストに対して、言語処理用辞書32を用いて形態素解析を行い、テキストを単語に分割し、各単語に読みなどの音声認識辞書作成に必要な情報を付与する。
【0020】
未知語抽出部27は、言語処理部によって分割された各単語を、基本認識辞書30を参照して、基本認識辞書30に存在する単語と存在しない単語とに分類する。
【0021】
認識辞書作成・保守部28は、未知語抽出部27での単語分類結果に基づき、基本認識辞書30に存在しない単語を追加するなどしてメール作成用認識辞書31を更新あるいは新規に作成する。また、メール作成用認識辞書31が不要になった場合には辞書を削除する。また、複数のメール作成用認識辞書31を使用する場合の、各辞書および辞書内の単語の更新・削除などを行う。
【0022】
基本認識辞書30、メール作成用認識辞書31は、音声認識部23が音声認識を行う際に、認識の対象となる単語の表記や読みなどを記述した辞書であり、基本認識辞書30には音声認識システムがあらかじめ用意した単語が登録されている。また、メール作成用認識辞書31は、作成するメールに応じて一時的に必要となる単語を本音声認識システムが自動的に登録した辞書である。なお、基本認識辞書30には、使用者が独自に選択して追加した単語(個人辞書)を含むものとする。
【0023】
言語処理用辞書32は、単語の品詞や読みなど言語処理部26が形態素解析や単語に読みをつけるために必要な情報を記述した辞書である。
【0024】
以上の構成を備えた図1の音声認識システムの動作を図2を用いて述べる。なお、以下では、電子メールを単にメールと記述する。
【0025】
図2は、本発明の第1の実施形態に係る音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。図2に従い、使用者がメール・アプリケーション10で受信したメールに対して音声認識を用いて返信メールを作成する場合についてシステム全体の処理の流れを概説する。
【0026】
本実施形態では、使用者が受信したメールを閲覧中に返信を行う場合を想定している。一般的なメール・アプリケーションでは、閲覧中のメールに返信を行う場合、ディスプレイなどの表示装置上に表示された返信ボタンをマウスでクリックしたり、アプリケーションのメニューから返信を選択することによって、自動的に返信メールを編集するウィンドウが表示される。
【0027】
本音声認識システムでは、このような使用者の操作、すなわち『受信したメールに対する返信メールの作成を開始する』というアクションを検出した場合に一連の処理を開始する。使用者の操作は、アプリケーション10と音声認識システム20とが互いにあるいはOSを介して通信することで検出可能である。例えば、アプリケーション10から音声認識システム20に対して、返信メール作成を開始するメッセージを直接送っても良いし、使用者の操作によって生じるマウス操作などのイベントを音声認識システム20の側で検出するようにしてもよい。
【0028】
音声認識システム20では、通信部21によって使用者が返信メールの作成を開始したことを検出すると(ステップS101)、文書データ読み込み部24がアプリケーション10から返信の対象となる受信メールの文書データ11を読み込む(ステップS102)。
【0029】
次に、ステップS103において、文書データ解析部25により、受信メールの文書データを解析し、宛先や送信元などが記載されたヘッダ部分を取り除いたメールの本文を言語処理部26に渡す。図3に受信メールの一例を示す。文書データ解析部25では、ヘッダ部分41を取り除いたメールの本文42を言語処理部26に渡す。なお、読み込んだ文書データがHTMLやXMLで記述された文書である場合は、文書データ解析部25によりタグなどの不要な部分を削除する。
【0030】
言語処理部26では、渡された文書データを形態素解析して解析結果を未知語抽出部27に渡す(ステップS105)。本実施形態の形態素解析では、べた書きされた文書を形態素(単語)に分割し、それぞれの形態素に読みを自動で付与し、例えば図4に示すような形式で形態素解析結果を出力する。
【0031】
次にステップS105において、未知語抽出部27により基本認識辞書30と形態素解析結果とを比較して基本認識辞書に存在する単語と存在しない単語とに分類する。
【0032】
ステップS105の未知語抽出処理の結果に基づき、ステップS106において認識辞書作成・保守部28により、未知語のみを登録した新たな音声認識辞書を作成し、メール作成用認識辞書31として記憶する。ステップS105で『入出力』『例会』『エスペランス』『仲原』が未知語に分類された場合に作成されるメール作成用認識辞書31の例を、図5に示す。この例では、音声認識辞書に記述されるのは、単語の表記および読みであるが、これに限るものではなく、後段の音声認識処理で必要な場合は、例えば、発音情報、品詞情報、単語の出現頻度(出現確率)などを含んでいてもよい。
【0033】
以上の処理によって作成されたメール作成用認識辞書31および基本認識辞書30を用いて、返信メール作成のために入力された使用者の音声を音声認識部23で音声認識し、認識結果を通信部21を介してアプリケーションに出力する(ステップS107)。なお、音声認識の際は、メール作成用認識辞書31と基本認識辞書30とを併用する。
【0034】
次に返信メール作成終了を検出する(ステップS108)と、返信のために作成したメール作成用認識辞書31を、認識辞書作成・保守部28によって削除する(ステップS109)。ここで、使用者が返信メールの作成終了を検出する方法は、作成開始の検出と同様に、使用者がメールを送信する操作を行った際に、アプリケーション10から作成終了のメッセージを音声認識システム20に送ってもよいし、使用者の操作イベントを通信部21で検出してもよい。
【0035】
以上の説明から明らかなように、本実施形態によれば、受信メールから得られる文書データから、既存の音声認識辞書にない未知語を抽出してメール作成に必要な単語を音声認識辞書に登録することにより、使用者の利便性を向上した音声認識辞書を作成することが可能となる。
【0036】
【第2の実施形態】
上記第1の実施形態のステップS109では、作成したメール作成用認識辞書31をメール作成終了を検出した時点で削除しているが、他の実現方法として、一定期間経過した場合に削除するようにしてもよい。すなわち、作成したメール作成用認識辞書31をメール作成終了と同時に削除するのではなく、その後も一定の期間、再利用する。この場合の処理の流れを図を用いて以下で説明する。
【0037】
第1の実施形態と異なるのは、ステップS105の未知語抽出およびステップS106のメール作成用認識辞書作成およびステップS109のメール作成用認識辞書削除であるので、この部分の処理に焦点を当て説明する。
【0038】
図6は、図2におけるステップS105およびステップS106に相当する部分の本実施形態における処理の流れを説明する図である。
【0039】
未知語を抽出する際に、ステップS201でメール作成用認識辞書がすでに存在するかどうかを確認し、存在する場合はステップS202の処理へ、存在しない場合はステップS206の処理へ移行する。
【0040】
ステップS202では、メール作成用認識辞書31が古いかどうかを判断する。この判断のため、後段の処理で作成あるいは更新するメール作成用認識辞書に関して、更新日時71を記録する。更新日時をメール作成用認識辞書中に記録する例を図7に示す。図7のメール作成用認識辞書では、図5で示したメール作成用認識辞書の例と同様、単語の表記と読みが列挙される他、辞書を作成した日時あるいは更新日時などの時間情報が更新日時として記述されている。
【0041】
図7の例では、メール作成用認識辞書内に時間情報を記録した例を示したが、これに限るものではなく、メール作成用認識辞書とは別に、更新日時を記録しても良い。
【0042】
また、経過時間Tに関しては、例えば日数単位、月単位、時間単位など任意の単位で設定できるものとする。
【0043】
図6の説明に戻り、ステップS202において、メール作成用認識辞書31の更新日時71から現在時刻までの経過時間がTを越えている場合はメール作成用認識辞書31を削除する(ステップS205)。逆にメール作成用認識辞書31の更新日時からの経過時間がT以内の場合は、以降の処理で、メール作成用認識辞書31に未知語を追加して辞書を更新する。
【0044】
ステップS203で、ステップS104の形態素解析で得られた単語のうち、基本認識辞書およびメール作成用認識辞書に存在しない単語を未知語として分類する。
【0045】
ステップS204では、メール作成用認識辞書に未知語に分類された単語を追加して、メール作成用認識辞書を更新する。この際、メール作成用認識辞書の更新日時を更新する。
【0046】
次に、メール作成用認識辞書が存在しない場合あるいは辞書を削除した場合であるステップS206以降の処理を説明する。
【0047】
ステップS206では、未知語を抽出する際に、形態素解析結果と基本認識辞書30とを比較し、基本認識辞書に存在しない単語を未知語として分類する。
続いて、ステップS207で未知語を含むメール作成用認識辞書を新規に作成する。この時、辞書の作成時間・更新日時を更新する。
【0048】
以上の処理で作成あるいは更新されたメール作成用認識辞書31を用いて第1の実施形態のステップS107以降の処理と同様の処理を行う。ただし、メール作成の終了後にメール作成用認識辞書を削除するステップS109の処理を行わずに終了する。
【0049】
以上の説明から明らかなように、本実施形態によれば、必要のなくなった音声認識辞書については、一定期間経過後に自動的に削除して音声認識辞書を更新することが可能となり、辞書サイズの肥大化を回避し、音声認識辞書に対する使用者の利便性が向上する。
【0050】
【第3の実施形態】
上記第2の実施形態では、メール作成用認識辞書31の削除を、辞書単位に行ったが、単語単位に管理する方法も考えられる。この場合、更新日時はメール作成用認識辞書31中に含まれる単語単位に管理する。単語ごとの更新日時をメール作成用認識辞書31中に記述した例を図8に示す。図に示す通り、各単語ごとに表記、読みの他、その単語が登録された日時や更新された日時などを示す時間情報81が付与されている。
【0051】
このようなメール作成用認識辞書31を用いた場合の処理の流れを図9を用いて説明する。この場合の処理の流れを図を用いて以下で説明する。
【0052】
第1の実施形態と異なるのは、ステップS105の未知語抽出およびステップS106のメール作成用認識辞書作成およびステップS109のメール作成用認識辞書削除であるので、この部分の処理に焦点を当て説明する。
【0053】
図9は、図2におけるステップS105およびステップS106に相当する部分の本実施形態における処理の流れを説明する図である。
【0054】
ステップS104の形態素解析終了後、メール作成用認識辞書がある場合はステップS302の処理へ、ない場合はステップS305の処理へ移る(ステップS301)。
【0055】
ステップS302では、メール作成用認識辞書31に登録された単語のうち、更新日時81からの経過時間がTを越えた単語を削除する。次にステップS104の形態素解析で得られた単語のうち、基本認識辞書およびメール作成用認識辞書に存在しない単語を未知語として分類する。
【0056】
続いて、ステップS304で、メール作成用認識辞書に未知語に分類された単語を追加登録するとともに、追加した単語の更新日時を現在時刻に設定する。
【0057】
さらに、形態素解析結果で得られた単語のうち未知語でない単語と同一の単語がメール作成用認識辞書に存在する場合は、その単語の更新日時81を現在時刻に更新する。
【0058】
すなわち、それまでに登録されていた単語であっても新規に読み込んだ文書データ11中に存在する単語については、更新日時を更新する。
【0059】
次に、メール作成用認識辞書が存在しない場合であるステップS305以降の処理を説明する。
【0060】
ステップS305では、未知語を抽出する際に、形態素解析結果と基本認識辞書30とを比較し、基本認識辞書に存在しない単語を未知語として分類する。
【0061】
続いて、ステップS306で未知語を含むメール作成用認識辞書31を新規に作成する。この時、登録した単語の更新日時を更新する。
【0062】
以上の説明から明らかなように、本実施形態によれば、音声認識辞書に含まれる必要のなくなった単語を、一定期間経過後に自動的に削除することが可能となり、音声認識辞書に対する使用者の利便性がさらに向上する。
【0063】
【第4の実施形態】
以上の各実施形態では、メール作成用認識辞書を一つだけ持つ場合について説明したが、第2、第3の実施形態のように一定期間、メール作成用認識辞書を保持する場合は、作成するメールの目的に応じて複数のメール作成用認識辞書を使い分けた方が便利な場合がある。例えば、本実施形態で説明している返信メールを書く場合は、メールを送る相手によって話題や用いる単語が異なるため、送信先ごとにメール作成用認識辞書を使い分ける方がより高い認識性能を期待できる。
【0064】
メールの送信先は、通信部22を通じてアプリケーションから取得してもよいし、ステップS103において文書データを解析する際に、ヘッダ情報41から受信メールの送信元を抽出し、これを送り先と判断してもよい。
【0065】
同様にして、アプリケーションあるいは受信メールからメールのSubject(サブジェクト)を話題として抽出することも可能である。
【0066】
このようにして抽出した、送り先あるいは話題ごとにメール作成用認識辞書を作成すれば、より利便性のよいメール作成用認識辞書を提供できる。
【0067】
【第5の実施形態】
以上の各実施形態では、メールの返信を作成する場合の処理について説明したが、これに限るものではなく、本発明は、例えばウェブブラウザにおいて『mailto』タグで記述された部分をクリックしてメールを作成するような場合にも適用可能である。
【0068】
この場合、文書データ11に相当するのは、『mailto』が記述されているページを表示するために用いられたHTMLなどのページ記述言語で書かれた構造化文書である。ページ記述言語で記述された文書は、文書の整形などのため多数のタグが含まれているが、これらはウェブブラウザで行っている解析(パーズ)と同様の処理を文書データ解析部25で行うことで、ブラウザ上に表示された文字だけを抽出することが可能である。従って、メールの返信を例に説明した第1〜第4の実施形態は、同時にウエブブラウザからメールを送信する場合にも適用可能であり、同様の効果が得られる。
【0069】
さらに、この場合、第4の実施形態で説明した、複数のメール作成用認識辞書を、送信先ごと、話題(サブジェクト)ごとに管理する方法に加え、URLごとに管理することもできる。
【0070】
【第6の実施形態】
登録された単語あるいはメール作成用辞書を削除する基準となる経過時間Tは使用者が設定できるようにしてもよい。
【0071】
【第7の実施形態】
上記各実施形態では、返信メールを作成する場合の処理について説明したが、本発明はこれに限られるものではなく、他の文書データを作成する際にも適用可能であることはいうまでもない。
【0072】
【他の実施形態】
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0073】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0074】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0075】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0076】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0077】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0095】
【発明の効果】
以上説明したように本発明によれば、音声入力による文書データの作成において使用される音声認識辞書の作成にあたり、使用者の利便性を向上することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの構成の一例を説明する図である。
【図2】本発明の第1の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。
【図3】本発明の第1の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムにおいて受信した電子メールの内容の一例を説明する図である。
【図4】本発明の第1の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムにおける形態素解析の結果の一例を説明する図である。
【図5】本発明の第1の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図6】本発明の第2の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。
【図7】本発明の第2の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図8】本発明の第3の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムのメール作成用認識辞書の一例を説明する図である。
【図9】本発明の第3の実施形態にかかる音声認識辞書作成方法を実現する音声認識システムの動作の一例を示すフローチャートである。

Claims (14)

  1. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
    検出手段が、メール作成処理が開始されたことを検出する検出工程と、
    読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
    抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
    作成手段が、前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成工程と、
    記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
    削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程と
    を備えることを特徴とする音声認識辞書作成方法。
  2. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
    検出手段が、メール作成処理が開始されたことを検出する検出工程と、
    読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
    抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
    作成手段が、前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成工程と、
    記憶手段が、前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶工程と、
    削除手段が、前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除工程と
    を備えることを特徴とする音声認識辞書作成方法。
  3. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
    検出手段が、メール作成処理が開始されたことを検出する検出工程と、
    読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
    抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
    記憶手段が、前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶工程と、
    削除手段が、前記記憶された登録日時から設定された期間を経過した未知語を削除する削除工程と
    を備えることを特徴とする音声認識辞書作成方法。
  4. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成方法であって、
    検出手段が、メール作成処理が開始されたことを検出する検出工程と、
    読み込み手段が、前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み工程と、
    抽出手段が、前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出工程と、
    記憶手段が、前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶工程と、
    削除手段が、前記記憶された登録日時から設定された期間を経過した未知語を削除する削除工程と
    を備えることを特徴とする音声認識辞書作成方法。
  5. 前記未知語を抽出する工程において、解析した文書データ中に既存の未知語を含む音声認識辞書に登録された単語が含まれる場合に、更新手段が、該単語の前記登録日時を更新する更新工程を更に備えることを特徴とする請求項3または4に記載の音声認識辞書作成方法。
  6. 請求項1乃至5のいずれか1項に記載の音声認識辞書作成方法をコンピュータによって実現させるための制御プログラム。
  7. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成手段と、
    前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
    前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段と
    を備えることを特徴とする音声認識辞書作成装置。
  8. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成手段と、
    前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
    前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段と
    を備えることを特徴とする音声認識辞書作成装置。
  9. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
    前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段と
    を備えることを特徴とする音声認識辞書作成装置。
  10. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置であって、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
    前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段と
    を備えることを特徴とする音声認識辞書作成装置。
  11. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を、送信されるメールの送信先ごとに作成する作成手段と、
    前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
    前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  12. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を、前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成する作成手段と、
    前記抽出した未知語を含む音声認識辞書を作成した日時を記憶する記憶手段と、
    前記記憶された日時から設定された期間を経過した場合に、前記未知語を含む音声認識辞書を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  13. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を送信されるメールの送信先ごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
    前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  14. メールの送信が可能なアプリケーションでの音声入力によるメール作成において使用される音声認識辞書を作成するための音声認識辞書作成装置におけるコンピュータを、
    メール作成処理が開始されたことを検出する検出手段と、
    前記メール作成処理が開始された場合に、前記アプリケーションにおいて受信されたメールのうち返信の対象となるメールを文書データとして読み込む読み込み手段と、
    前記読み込まれた文書データを解析して、既存の音声認識辞書に存在しない未知語を抽出する抽出手段と、
    前記抽出した未知語を含む音声認識辞書を前記アプリケーションにおいて受信されたメールのサブジェクトごとに作成するにあたり、該未知語ごとに登録日時を記憶する記憶手段と、
    前記記憶された登録日時から設定された期間を経過した未知語を削除する削除手段として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003021029A 2003-01-29 2003-01-29 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体 Expired - Fee Related JP4217495B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003021029A JP4217495B2 (ja) 2003-01-29 2003-01-29 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体
US10/760,314 US7505903B2 (en) 2003-01-29 2004-01-21 Speech recognition dictionary creation method and speech recognition dictionary creating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003021029A JP4217495B2 (ja) 2003-01-29 2003-01-29 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体

Publications (3)

Publication Number Publication Date
JP2004233577A JP2004233577A (ja) 2004-08-19
JP2004233577A5 JP2004233577A5 (ja) 2006-02-09
JP4217495B2 true JP4217495B2 (ja) 2009-02-04

Family

ID=32767532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003021029A Expired - Fee Related JP4217495B2 (ja) 2003-01-29 2003-01-29 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体

Country Status (2)

Country Link
US (1) US7505903B2 (ja)
JP (1) JP4217495B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672436B1 (en) * 2004-01-23 2010-03-02 Sprint Spectrum L.P. Voice rendering of E-mail with tags for improved user experience
US7207004B1 (en) * 2004-07-23 2007-04-17 Harrity Paul A Correction of misspelled words
WO2006057007A1 (en) * 2004-11-29 2006-06-01 Vaman Technologies (R & D) Limited Method of interpreting a request using a novel dictionary
CN101326571B (zh) 2005-12-07 2012-05-23 三菱电机株式会社 声音识别装置
JP4822829B2 (ja) * 2005-12-14 2011-11-24 キヤノン株式会社 音声認識装置および方法
US8719021B2 (en) * 2006-02-23 2014-05-06 Nec Corporation Speech recognition dictionary compilation assisting system, speech recognition dictionary compilation assisting method and speech recognition dictionary compilation assisting program
US20080243485A1 (en) * 2007-03-29 2008-10-02 Nokia Corporation Method, apparatus, system, user interface and computer program product for use with managing content
US8306810B2 (en) * 2008-02-12 2012-11-06 Ezsav Inc. Systems and methods to enable interactivity among a plurality of devices
JP2010048953A (ja) * 2008-08-20 2010-03-04 Toshiba Corp 対話文生成装置
JP5049934B2 (ja) * 2008-09-22 2012-10-17 株式会社東芝 対話文生成装置及び方法
US8032537B2 (en) * 2008-12-10 2011-10-04 Microsoft Corporation Using message sampling to determine the most frequent words in a user mailbox
CN106486114A (zh) * 2015-08-28 2017-03-08 株式会社东芝 改进语言模型的方法和装置以及语音识别方法和装置
US10572586B2 (en) * 2018-02-27 2020-02-25 International Business Machines Corporation Technique for automatically splitting words

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US236673A (en) * 1881-01-18 Benjamin c
US220793A (en) * 1879-10-21 Improvement in clothes-line reels
US128826A (en) * 1872-07-09 Improvement in stereotype-blocks
JPH09258771A (ja) * 1996-03-25 1997-10-03 Canon Inc 音声処理方法及び装置
JPH10161692A (ja) * 1996-12-03 1998-06-19 Canon Inc 音声認識装置及び音声認識方法
US6766295B1 (en) * 1999-05-10 2004-07-20 Nuance Communications Adaptation of a speech recognition system across multiple remote sessions with a speaker
US6308151B1 (en) * 1999-05-14 2001-10-23 International Business Machines Corp. Method and system using a speech recognition system to dictate a body of text in response to an available body of text
JP3476008B2 (ja) * 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体
US6507643B1 (en) * 2000-03-16 2003-01-14 Breveon Incorporated Speech recognition system and method for converting voice mail messages to electronic mail messages
JP3814459B2 (ja) * 2000-03-31 2006-08-30 キヤノン株式会社 音声認識方法及び装置と記憶媒体
WO2002031643A1 (fr) * 2000-10-11 2002-04-18 Canon Kabushiki Kaisha Dispositif de traitement d'information, procede de traitement d'information et support de stockage
JP2002268681A (ja) 2001-03-08 2002-09-20 Canon Inc 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法
JP3799280B2 (ja) 2002-03-06 2006-07-19 キヤノン株式会社 対話システムおよびその制御方法
US7146320B2 (en) * 2002-05-29 2006-12-05 Microsoft Corporation Electronic mail replies with speech recognition
JP3814566B2 (ja) 2002-06-20 2006-08-30 キヤノン株式会社 情報処理装置、情報処理方法、制御プログラム
JP3885002B2 (ja) * 2002-06-28 2007-02-21 キヤノン株式会社 情報処理装置およびその方法

Also Published As

Publication number Publication date
JP2004233577A (ja) 2004-08-19
US20040153312A1 (en) 2004-08-05
US7505903B2 (en) 2009-03-17

Similar Documents

Publication Publication Date Title
KR100890691B1 (ko) 언어학적으로 지능적인 텍스트 압축방법 및 그 처리장치
JP4217495B2 (ja) 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体
US20070233465A1 (en) Information extracting apparatus, and information extracting method
US20100023318A1 (en) Method and device for retrieving data and transforming same into qualitative data of a text-based document
US10049098B2 (en) Extracting actionable information from emails
US20130174008A1 (en) Information processing method and apparatus
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
US7228270B2 (en) Dictionary management apparatus for speech conversion
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP2002157241A (ja) 辞書作成装置
JP2002222185A (ja) 構造化文書共有装置、構造化文書共有方法及び構造化文書のファイル共有システム
Kuncham et al. Statistical sandhi splitter for agglutinative languages
JP3980974B2 (ja) スケジュール情報抽出編集装置および方法
JP5954053B2 (ja) 検索支援システム、検索支援方法、およびコンピュータプログラム
JPH10133853A (ja) 電子メール書換え方法及び装置
JP5495425B2 (ja) 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
JP3849356B2 (ja) 文字変換装置及びその方法と文字変換のためのプログラムを記録した記録媒体
JP2019121164A (ja) 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム
JP5795302B2 (ja) 形態素解析装置、方法、及びプログラム
CN1804870B (zh) 上下文树中的分析替换
JP2011113097A6 (ja) 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
KR100544375B1 (ko) 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체
JP4947843B2 (ja) 翻訳装置、翻訳方法、プログラムを記録した記録媒体、および、プログラム
JP2000242464A (ja) 音声情報処理装置及び方法並びに音声情報処理プログラムを記憶した記憶媒体
JP5574526B2 (ja) 伏せ字を含む文章を修正するための伏せ字修正プログラム、方法及び文章解析サーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081024

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081110

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131114

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees