[go: up one dir, main page]

JP2005202198A - 辞書生成装置及び音声認識装置 - Google Patents

辞書生成装置及び音声認識装置 Download PDF

Info

Publication number
JP2005202198A
JP2005202198A JP2004009006A JP2004009006A JP2005202198A JP 2005202198 A JP2005202198 A JP 2005202198A JP 2004009006 A JP2004009006 A JP 2004009006A JP 2004009006 A JP2004009006 A JP 2004009006A JP 2005202198 A JP2005202198 A JP 2005202198A
Authority
JP
Japan
Prior art keywords
name
facility
dictionary
word
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004009006A
Other languages
English (en)
Inventor
Iko Terasawa
位好 寺澤
Hiroyuki Hoshino
博之 星野
Takakatsu Yoshimura
貴克 吉村
Toshihiro Wakita
敏裕 脇田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2004009006A priority Critical patent/JP2005202198A/ja
Publication of JP2005202198A publication Critical patent/JP2005202198A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】辞書作成ルールを定義することによって、効率的でかつユーザ発話様式に適した辞書を作成する。
【解決手段】施設の正式名称を入力し、入力された施設の正式名称を形態素に分割し、分割された形態素から地域名称及び施設の正式名称の一部を抽出し、抽出された地域名称と抽出された施設の正式名称の一部とを連結単語で連結した単語を辞書用単語として生成する。
【選択図】 図2

Description

本発明は、辞書生成装置及び音声認識装置にかかり、特に、ユーザの発話様式に適した辞書を生成することができる辞書生成装置、及びこの辞書生成装置を用いた音声認識装置に関する。
従来のカーナビの音声認識では、目的地設定のためにユーザに施設名称を発話してもらう場合に、施設の正式名称を発話させていた。しかしながら、ユーザがある施設を特定する場合に、例え正式名称を知っていたとしても必ずしも正式名称を発話しないことがあるし、正式名称を知らない場合がある。例えば、愛知県犬山市に存在する「博物館明治村」を特定する場合に、正式名称の「博物館明治村」を発話することは稀であり、「明治村」または「犬山の明治村」等と発話するのが通常でる。また、このような発話が極めて自然な言い回しである。したがって、ユーザに施設の正式名称を発話させることは、ユーザの発話に対する負担が大きくなる。
一方、ユーザの発話に対する負担低減やユーザの発話様式への適合化を考慮して、長い施設名称等に区切りを入れて認識用単語を短く言い換え(例えば「厚木国際カントリー倶楽部」を「厚木国際」と短くする)、この言い換え語を辞書登録して、ユーザの言いよどみや発話単語を短縮化した音声認識装置が知られている(例えば、特許文献1参照)。
特開2001−083982号
しかしながら、上記従来の技術では、ユーザの発話に対する負担低減やユーザの発話様式への適合化が多少なりとも考慮されているが、言い換え単語の登録のルールについて規定されていないため、無計画に言い換え単語を用意すると辞書が爆発的に増加するだけになってしまう、という問題が発生する。
本発明は、上記問題を解決すべく成されたもので、辞書作成ルールを定義することによって、効率的でかつユーザ発話様式に適した辞書を作成することができる辞書作成装置を提供することを目的とする。また、本発明は、この辞書作成装置を用いて音声認識する音声認識装置を提供することを他の目的とする。
上記目的を達成するために本発明の辞書生成装置は、施設の正式名称を入力する入力手段と、複数の単語を連結するための連結単語を記憶した記憶手段と、入力された施設の正式名称を形態素毎に分割する分割手段と、分割された形態素から地域名称及び前記施設の正式名称の一部を抽出する抽出手段と、抽出された前記地域名称と抽出された前記施設の正式名称の一部とを前記連結単語で連結した単語を辞書用単語として生成する生成手段と、を含んで構成したものである。
本発明では、地域名称と施設の正式名称の一部とを連結単語で連結して単語を生成することを第1の辞書作成ルールとし、この辞書作成ルールに従って辞書用単語を生成する。このため、本発明では、入力手段から入力された施設の正式名称を形態素毎に分割し、分割された形態素から地域名称及び施設の正式名称の一部を抽出し、抽出された地域名称と抽出された施設の正式名称の一部とを連結単語で連結した単語を辞書用単語として生成する。
最寄の施設の名称と施設の正式名称の一部とを連結単語で連結して単語を生成することを第2の辞書作成ルールとし、正式名称の施設に対する最寄の施設の情報が入力されている場合には、この辞書作成ルールに従って辞書用単語を生成する。この場合には、入力手段から正式名称の施設に対する最寄の施設の情報を入力し、第2の辞書作成ルールに従って他の辞書用単語を生成する。
抽出手段により地域名称が抽出されない場合には、第1の辞書作成ルールおける地域名称の代用として施設の住所を用いることができる。この場合には、入力手段から正式名称の施設の住所を入力し、入力された施設の住所と施設の正式名称の一部とを連結単語で連結した単語を更に他の辞書用単語として生成する。
上記のようにして生成された辞書用単語は、カーナビの音声認識装置による目的地設定または目的地検索のための音声認識用の辞書として使用することができる。
以上説明したように本発明によれば、地域名称、最寄の施設で修飾された施設名称が辞書用単語として生成されるので、ユーザの発話様式に適した辞書を生成することができる、という効果が得られる。
また、上記の辞書を音声認識に使用することにより、ユーザインタフェースの向上を図ることができる、という効果が得られる。
以下、図面を参照して本発明の辞書生成装置の実施の形態を詳細に説明する。
図1に示すように、辞書生成装置の実施の形態には、後述する辞書生成処理ルーチンに従って辞書用単語を生成するコンピュータで構成された辞書生成処理装置10、及び辞書生成処理装置10に接続すると共に施設の正式名称等を入力するキーボード等で構成された入力装置12が設けられている。なお、入力装置として、音声認識によって音声を文字列に変換する音声認識装置を用いることもできる。また、入力装置として、予め入力施設名を多数記録した正式名称出力装置を用いることもできる。
また、辞書生成処理装置10には、形態素解析時に使用される多数の施設名称が記憶された形態素解析辞書としての施設データベース14、多数の地域名が記憶された地域名データベース16、及び生成された辞書用単語を記憶する記憶装置18が接続されている。
そして、辞書生成処理装置10には、辞書生成処理ルーチンのプログラム、及び多数の連結単語を記憶したメモリが設けられている。また、このメモリには、地域名称と施設の正式名称の一部とを連結単語で連結して辞書用単語を生成する第1の辞書作成ルール、及び最寄の施設の名称と施設の正式名称の一部とを連結単語で連結して辞書用単語を生成する第2の辞書作成ルールが予め記憶されている。
次に、図3を参照して、辞書生成処理装置10で実行される辞書生成処理ルーチンについて説明する。
まず、入力装置12から、支店名称を含む施設の正式名称、施設の住所(都道府県市町村の名前)、対象となっている施設に関する最寄の施設の情報を入力する。これらの情報が入力されると、ステップ100において、支店名称を含む施設の正式名称を形態素解析により施設データベース(形態素解析辞書)14を用いて形態素(単語)毎に分割し、形態素毎に形態素解析辞書に登録されている品詞情報、及び地域名であるか否かの情報等を参照する。この形態素解析については汎用プログラム(例えば、ChaSen−http://chasen.aist−nara.ac.jp/)を使用することができる。
例えば、支店名称を含む施設の正式名称が「豊田工業長久手営業所」の場合、以下の形態素毎に分割される。
・豊田 名詞−固有名詞−人名−姓
・工業 名詞−一般
・長久手 名詞−固有名詞−地域名−一般
・営業 名詞−サ変接続
・所 名詞−接尾−一般
ステップ102では、分割された単語毎に、形態素解析辞書に登録されている各単語に対する品詞情報、地域名等の参照情報を参照して、正式名称中の地域名称(上記の例では、「町」が省略された「長久手」)を示す単語を抽出する処理を実行する。地域名称を示す単語は、施設の特定に対して「市」、「町」、「村」等が省略されることが多いため、形態素解析辞書には、市町村が付加された地域名称の他、市町村が省略された地域名称も準備しておいて、市町村が省略された地域名称も地域名称として抽出する。
ステップ104では、地域名称が抽出されたか否かを判断し、地域名称が抽出された場合にはステップ112に進む。一方、上記分割された単語中に形態素解析辞書に含まれない未知語が出現し、ステップ104で形態素解析辞書によっては地域名称が抽出されなかったと判断された場合には、ステップ106において、分割された各単語と地域名称を格納した地域名データベース16との照合を行なうことにより、分割された単語のいずれかが地域名称であるか否かを判定する。
この判定の結果、分割された単語のいずれかが地域名称であると判定された場合は、ステップ112に進み、分割された単語のいずれも地域名称でないと判断された場合、すなわち施設の正式名称中に地域名称が含まれていなかった場合は、ステップ110において入力された住所(都道府県名または市町村名)を地域名称とし、住所で地域名称を代用する。
次のステップ112では、正式名称の一部を抽出し、予め記憶された第1の辞書作成ルールにしたがって地域名称情報付与処理を行ない、辞書用単語を生成する。すなわち、抽出した地域名称(または、照合の結果得られた地域名称、または地域名称を代用する住所)、連結単語、及び抽出した施設の正式名称の一部を組み合わせ、連結単語で地域名称と施設の正式名称の一部とを連結して辞書用単語を生成する。
正式名称の一部としては、施設名称自体(上記の例では「豊田工業」)を用いることができる。正式名称の一部として施設名称の一部を用いても良い。
連結単語としては、「の」、「にある」等のユーザが発話しそうな単語を予め準備してメモリに記憶しておく。また、施設特定のための表現方法のアンケートをとったり、言い回し様式の収集実験等から連結単語を作成し、メモリに記憶しておいてもよい。
上記の施設の正式名称が「豊田工業長久手営業所」の例の場合には、地域名称は「町」が省略された「長久手」または「町」が付加された「長久手町」であるので、地域名称、連結単語、及び施設名称の一部を組み合わせて、辞書用単語として「長久手の豊田工業」または「長久手町にある豊田工業」を生成する。
また、他の例として「アピタ(登録商標)長久手店」の場合は、地域名称が「長久手」であり、正式名称の一部として固有名詞である「アピタ」が抽出されるため、連結単語としての「の」または「にある」を用いて、「長久手のアピタ」、または「長久手町にあるアピタ」の辞書用単語が生成される。
次のステップ114では、予め記憶された第2の辞書作成ルールに従って周辺施設情報付与処理を行ない、他の辞書用単語を生成する。周辺施設情報付与処理では、辞書用単語を作成する地域名称に関して、最寄の周辺施設(例えば、鉄道の駅、高速道路のIC等)が入力されている場合には、上記の地域名称情報を付与した単語に加えて、周辺施設情報を用いて、周辺施設名称、連結単語、及び施設の正式名称の一部を組み合わせ、連結単語で周辺施設名称と施設の正式名称の一部とを連結した辞書用単語を生成する。
上記の例で示した「豊田工業」に対して、最寄の施設の情報として「豊田工業の前に位置する役場」との情報が入力されていれば、辞書用単語として「役場近くの豊田工業」または「役場前にある豊田工業」を生成する。
この場合の連結単語は、「近くの」、「前にある」等の単語が適当であるが、これらの連結単語は、上記で説明したように、施設特定のための表現方法をアンケートまたは言い回し様式の収集実験等から予め作成してメモリに記憶しておけばよい。
上記の地域名称情報付与処理、及び周辺施設情報付与処理により生成された辞書用単語(例えば「長久手の豊田工業」、「長久手町にある豊田工業」、「役場近くの豊田工業」、「役場前にある豊田工業」)は、ステップ116において記憶装置18に登録され、施設設定・検索用の辞書が生成される。
そして、このように作成した辞書を用い、施設設定・検索(例えば、カーナビでの目的地設定)のための音声認識装置用の辞書又は検索用辞書として利用される。
本発明の実施の形態の辞書生成装置を示すブロック図である。 辞書生成方法を説明するための説明図である。 辞書生成処理ルーチンを示す流れ図である。
符号の説明
10 辞書生成処理装置
14 施設データベース
16 地域名データベース

Claims (4)

  1. 施設の正式名称を入力する入力手段と、
    複数の単語を連結するための連結単語を記憶した記憶手段と、
    入力された施設の正式名称を形態素毎に分割する分割手段と、
    分割された形態素から地域名称及び前記施設の正式名称の一部を抽出する抽出手段と、
    抽出された前記地域名称と抽出された前記施設の正式名称の一部とを前記連結単語で連結した単語を辞書用単語として生成する生成手段と、
    を含む辞書生成装置。
  2. 前記入力手段から前記正式名称の施設に対する最寄の施設の情報を入力し、
    前記生成手段は、入力された最寄の施設の名称と抽出された前記施設の正式名称の一部とを前記連結単語で連結した単語を他の辞書用単語として生成する請求項1記載の辞書生成装置。
  3. 前記入力手段から前記正式名称の施設の住所を入力し、前記生成手段は、前記抽出手段により地域名称が抽出されないときに、入力された施設の住所と抽出された前記施設の正式名称の一部とを前記連結単語で連結した単語を更に他の辞書用単語として生成する請求項1または2に記載の辞書生成装置。
  4. 請求項1〜3のいずれか1項記載の辞書生成装置によって生成された辞書用単語が格納された記憶装置を用いて音声認識を行なう音声認識装置。
JP2004009006A 2004-01-16 2004-01-16 辞書生成装置及び音声認識装置 Pending JP2005202198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004009006A JP2005202198A (ja) 2004-01-16 2004-01-16 辞書生成装置及び音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004009006A JP2005202198A (ja) 2004-01-16 2004-01-16 辞書生成装置及び音声認識装置

Publications (1)

Publication Number Publication Date
JP2005202198A true JP2005202198A (ja) 2005-07-28

Family

ID=34822167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004009006A Pending JP2005202198A (ja) 2004-01-16 2004-01-16 辞書生成装置及び音声認識装置

Country Status (1)

Country Link
JP (1) JP2005202198A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009236860A (ja) * 2008-03-28 2009-10-15 Aisin Aw Co Ltd 目的地設定装置及び目的地設定用プログラム
JP2010122699A (ja) * 2006-04-07 2010-06-03 Panasonic Corp 地点名称生成装置および地点名称生成方法
WO2010100977A1 (ja) 2009-03-03 2010-09-10 三菱電機株式会社 音声認識装置
US8279171B2 (en) 2006-07-06 2012-10-02 Panasonic Corporation Voice input device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122699A (ja) * 2006-04-07 2010-06-03 Panasonic Corp 地点名称生成装置および地点名称生成方法
US8279171B2 (en) 2006-07-06 2012-10-02 Panasonic Corporation Voice input device
JP2009236860A (ja) * 2008-03-28 2009-10-15 Aisin Aw Co Ltd 目的地設定装置及び目的地設定用プログラム
WO2010100977A1 (ja) 2009-03-03 2010-09-10 三菱電機株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
US9449599B2 (en) Systems and methods for adaptive proper name entity recognition and understanding
CN102725790B (zh) 识别词典制作装置及声音识别装置
US8285537B2 (en) Recognition of proper nouns using native-language pronunciation
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
US8880400B2 (en) Voice recognition device
US8126714B2 (en) Voice search device
EP2081185A1 (en) Speech recognition on large lists using fragments
JPWO2016067418A1 (ja) 対話制御装置および対話制御方法
US7197457B2 (en) Method for statistical language modeling in speech recognition
CN103050115A (zh) 识别装置、识别方法、生成装置和生成方法
CN108885618A (zh) 意图估计装置和意图估计方法
EP3005152B1 (en) Systems and methods for adaptive proper name entity recognition and understanding
JP2005202198A (ja) 辞書生成装置及び音声認識装置
JP4220151B2 (ja) 音声対話装置
JP3581044B2 (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
JP6009396B2 (ja) 発音付与方法とその装置とプログラム
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP2009150988A (ja) 音声認識辞書作成装置
JP4733436B2 (ja) 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
JP2007212660A (ja) 音声認識用辞書生成装置
US11975729B2 (en) Method for generating a voice announcement as feedback to a handwritten user input, corresponding control device, and motor vehicle
JP2004053979A (ja) 音声認識辞書の作成方法及び音声認識辞書作成システム
JP2007086404A (ja) 音声合成装置
JP5252209B2 (ja) 読み生成装置